データサイエンスの適用分野まとめ
データサイエンスの適用分野が下記リンクが参考になったのでリストアップしたのと個人的な見解も踏まえてまとめました。
https://exploratory.io/training-jp
データサイエンスとは何か?
数学、統計学を基ににたアルゴリズムを使って、データのパターンを発見し理解することによって、将来のビジネスのパフォーマンスを予測し改善する。
改めて言うこともありませんが、データサイエンスの目的は、ビジネス課題の解決。
どういった分析に適用される
ビジネスのほぼ全領域にわたる。いづれも、経験と勘による経営判断から、大量のデータに基づいた経営判断とすることで、経営資源の投入による効果の予測精度をあげて、結果的にコストパフォーマンスの高い施策をうつことが目的。たとえ、予測が外れたとしても、どの仮定が実際と違っていたかの分析もできるのこともデータ・ドリブンの特徴になると思う。
具体例
- プロダクト開発
レコメンデーション・エンジン、最適化エンジン、チャットボット、開発スケジュール予測、コード分析(クオリティ向上)、イシュー・相関・類似分析
- プロダクト・マネジメント(プロダクトの改善)
A/Bテスト、アンケート・フィードバック分析、リテンション分析、コホート分析、A-Ha要因分析、カスタマー・Behavior分析、カスタマー・ライフタイムバリュー分析
- インフラストラクチャ・エンジニアリング
リソース・アロケーション・プラニング(イベントなどサーバ負荷予測)、需要予測、サイト・パフォーマンス・モニタリング、ログ解析、アノマリー分析
- カスタマーサクセス(カスタマーサポート)
問題がある前に対応する、イシュー・リソリューション効果分析、相関・類似・クラスタリング分析、テキスト分析
- マーケティング
キャンペーンROI分析、キャンペーン・インパクト予測、A/Bテスト、テキスト・センチメント分析、メディア・チャネル分析、カスタマーセグメンテーション
- ファイナンス
ファイナンシャル・プラニング、売上予測、バーン・レート予測・モニタリング、Profitability分析
オープンソースのアルゴリズム
-
Twitter
Anomaly detection(異常値検出)
・異常値検出アルゴリズム(異常なアクセス、機械の故障予知、トレンド)
https://github.com/twitter/AnomalyDetection -
Google
マーケティング
広告キャンペーンのインパクトがどれだけあったか、ホワイトノイズとの区別ス
https://google.github.io/CausalImpact/CausalImpact.html
https://blog.exploratory.io/an-introduction-to-causal-impact-analysis-a57bce54078e -
Uber
A/Bテスト
ベイズ確率A/Bテスト
どれだけAの方が優れているか
どれだけサンプルデータが集まればテストを終われるか
https://eng.uber.com/xp/
https://eng.uber.com/experimentation-platform/ -
リテンション・コホート分析
マーケティング、グロースハックの前にカスタマー・リテンション率を把握
カスタマーライフタイムバリューの計算 -
リテンション要因分析(A-Ha Moment)
Facebook, Slack -
テキスト・センチメント分析
何が流行っているか。どのように反応しているのか。