M岡研究室の4年生の学生と少しお話したが、評価しているアプリケーションが気になるので以下の論文のアプリケーションを列挙してみる。
様々な機械学習アルゴリズムの MapReduce による実装と高速化
- Locally Weighted Linear Regression (LWLR)
- Naive Bayes (NB)
- Gaussian Discriminative Analysis (GDA)
- k-means
- Logistic Regression (LR)
- Neural Network (NN)
- Principal Components Analysis (PCA)
- Independent Component Analysis (ICA)
- Expectation Maximization (EM)
- Support Vector Machine (SVM)
この中で、それぞれ GPU による高速化している研究はあるのでそれを使って評価するのが良いだろう。
- k-means の GPU の高速化
http://www.computer.org/portal/web/csdl/doi/10.1109/CSIE.2009.491
また、ちょっと視点は異なるが、Hadoop が各企業でどのように使われているかをまとめたサイトもある。
そのほかに、Apache プロジェクトの中に Mahout という機械学習のアルゴリズムを MapReduce などのフレームワークでスケーラブルにするプロジェクトもあります。
どちらかというと,まだ,アプリケーションを評価できるほど,基盤レイヤができていないです.特に,モニタリングまわりなど..なので,基盤レイヤの拡充がどちらかといえば,先決です..とはいえ,アプリ候補が結構限られてしまうので,いろいろ教えていただけると有り難いです.
返信削除