2010年2月24日水曜日

評価アプリケーション

M岡研究室の4年生の学生と少しお話したが、評価しているアプリケーションが気になるので以下の論文のアプリケーションを列挙してみる。

様々な機械学習アルゴリズムの MapReduce による実装と高速化
  • Locally Weighted Linear Regression (LWLR)
  • Naive Bayes (NB)
  • Gaussian Discriminative Analysis (GDA)
  • k-means
  • Logistic Regression (LR)
  • Neural Network (NN)
  • Principal Components Analysis (PCA)
  • Independent Component Analysis (ICA)
  • Expectation Maximization (EM)
  • Support Vector Machine (SVM)
この中で、それぞれ GPU による高速化している研究はあるのでそれを使って評価するのが良いだろう。
また、ちょっと視点は異なるが、Hadoop が各企業でどのように使われているかをまとめたサイトもある。

そのほかに、Apache プロジェクトの中に Mahout という機械学習のアルゴリズムを MapReduce などのフレームワークでスケーラブルにするプロジェクトもあります。

2010年2月21日日曜日

StreamGPU: CPU-GPU 協調動作において SLAに基づく適応的なウィンドウサイズ調節機構の提案

 CPU-GPU 協調動作において、お互いの干渉を受けるため、両者のレイテンシを満たす中で最大のウィンドウサイズを決定することが重要である。これを、システマティックに求める方法を考える。

[問題の前提]
SLA (レイテンシ, 結果スコアの精度など)に関してはレイテンシのみを対象

(1) 短いウィンドウサイズの局所的解析:低レイテンシが要求される
- レイテンシの上限が決まっている (例: 10ms)
- CPU で実行
(2) 長いウィンドウサイズの大局的解析:
- レイテンシの上限が決まっている (例: 5秒)
- GPU で実行

[実行環境]
- CPU (2コア) と GPU から構成されるシングルノード。
- GPU, CPU の性能は仮定しない
- 他のジョブは稼動していなく、占有可能

[解く問題]
上記の前提において、(1),(2)で定められたレイテンシを満たす最適なウィンドウサイズ (CPU側、GPU側)を決定する


[解決手法]
CPU 側で守るべきレイテンシを Lc, GPU 側で守るべき レイテンシをLg とし、この両者のレイテンシを満たす最適なウィンドウサイズを CPU, GPU 側で算出する手法を以下に提示する。

0. GPU のウィンドウサイズ Wg を固定する.

CPU, GPU 単体のパフォーマンスを与えられた評価環境においてテストし, 以下のようなデータを算出する。これらのデータから GPU が CPU の性能を上回るウィンドウサイズ Wcpu-gpuを求める。下記の1から6のステップは GPU のウィンドウサイズを固定させるが、このサイズは Wcpu-gpu 以上のサイズから開始する。下記の森田君の実験の場合は 450 が開始点となる。ただし、GPU 側のレイテンシ Lg があらかじめ与えられる。



1. CPU の Conflict が存在しない場合の GPU 単体の実行時間を TG0とする

2. GPU のウィンドウサイズ Wg を固定させて、CPU のウィンドウサイズ Wc を増加させたときの Tg と Tc を測定する。Tg はCPUでの計算やメモリ転送などの干渉を受けて増加する. 

3. 2 のデータを受けて、定義域をサイズ、値域を実行時間とする関数をそれぞれ Fg, Fc とし、その関数を非線形の回帰分析によって算出する。

4. Lg (CPU側で守るべきレイテンシ)を与えたときの最大の Wc (CPUのウィンドウサイズ)をステップ3 によって算出した関数 Fg を用いて, Lg = Fg(x) --> x = Fg-1(Lg) (-1 は逆関数) のように計算し、x を Wc とする。

5. ステップ4を用いて算出したWc と関数 Fc を用いて (Tc = Fc(Wc)) , Wcにおける実行時間 Tc を算出.

6. ステップ5を用いて算出した Tc が CPU側のレイテンシより下回っているかどうかを検査。
(6-1) 下回っている場合には CPU 側のウィンドウサイズはステップ4 によって得られた Wc とする
(6-2) 上回っている場合には CPU 側のウィンドウサイズWc を Fc-1(Lc) によって求めた値とする
下図においては(6-1) が上図、(6-2) が下図となる



2010年2月20日土曜日

卒論発表会

松浦君、森田君の卒論発表が無事に終わりました。大変お疲れさまでした。



2010年2月15日月曜日

Towarads Scalable Stream Platform for CDR Processing

総務省が2009年に発表している CDR (通話記録)データ処理量に関する統計情報。
ベンチマークの参考になります。
http://www.tca.or.jp/databook/pdf/2009chapter_2j.pdf

こちらの資料も詳しいです。

2010年2月5日金曜日

Harvard Medical School 来訪

Harvard Medical School, FDA, 横浜市立大学病院の方たちのミーティングがありました。




2010年2月1日月曜日

未来の交通社会をシミュレーション

未来の交通社会をシミュレーションー数百万台規模の多様で広範囲な都市交通をミクロに再現する交通シミュレータ (PDF)

総務省・情報大航海プロジェクト

現在、日本では、「情報大航海プロジェクト」というプロジェクトが総務省を中心に動いていますが、その共有プラットフォームがあるそうです。データも必要に応じては使える可能性があります。
http://www.igvpj.jp/index/cp-info/000/

http://www.igvpj.jp/cp_jp/
 には、「センサ情報に基づく行動解析基盤」(URL) など 様々な成果技術がまとめられています。

総務省のライフログ

http://www.soumu.go.jp/main_content/000044438.pdf

九州電力のライフログ

------
九州電力の100%子会社キューデンインフォコム(http://www.qic.co.jp/) などが手がけるのが、糖尿病など生活習慣病患者の血糖値や体重、血圧などを測定しサーバに送って、データを元に自動解析または医師が対策を指示するサービ ス。患者には身体の上下・左右・前後の動きを把握する3軸加速度センサを付加し、数秒で「ジャンプした」「横になった」「走っている」など約40種類の行 動パターンに分析する。血糖測定器や血圧計も使って患者が運動不足だと階段を使うよう指示したり、糖尿病患者の血糖値が高くなったときにインスリンの打ち 忘れがないかを通知したりする。

KDDI 研究所が主催するライフログ実証実験

http://www.ubila.org/lifelog/index.html
以下、プロジェクト概要
----
『ケータイdeライフログ』はau携帯電話で動作するBREWアプリとそれに対応する個人専用サイト を提供するサービスです。携帯電話上のセンサで自分の居場所、写真、商品バーコードなどを読み取り、 思い思いのコメントを記入して、個人専用サイトにアップロードすることで、日記(ライフログ)を 簡単に作成することができます。
----

東大森川研究室の関する論文 (URL)

猿渡 俊介
" 招待講演: 無線センサネットワークによるオフィス空間ライフログ "
第8回情報科学技術フォーラム(FIT2009), イベント企画, Sept. 2009. pdf

大原 壮太郎,鈴木 誠,猿渡 俊介, 南 正輝,森川 博之
" 無線センサノードにおけるシングルコアCPUの問題点に関する定量的評価 "
情報処理学会研究報告, ユビキタスコンピューティングシステム研究会, UBI-23-6, July 2009. (優秀論文賞受賞) pdf

山田 直治, 礒田 佳徳, 南 正輝, 森川 博之
" GPS位置情報を用いた逐次的移動経路推定手法の評価 "
電子情報通信学会ソサイエティ大会, B-7-62, Sep. 2009. pdf

高木 潤一郎, 猿渡 俊介, 川島 英之, 南 正輝, 森川 博之
" 時系列センサデータベースシステムの初期的検討 "
電子情報通信学会ソサイエティ大会, BS-5-4, Sep. 2009. pdf

Reality Mining by MIT Media Lab

ライフログ、すなわち人間の行動履歴から行動パターンや嗜好を分析する研究がはやっていますが、MIT の Meida Lab がリードする Reality Mining というプロジェクトでは、携帯電話のBlueTooth機能を使った人間行動のマイニングを行っているようです。また、実証実験で収集したデータも匿名化して公開しています。
プロジェクトの URL: http://reality.media.mit.edu/ 

論文
N. Eagle, A. Pentland, and D. Lazer (2009), Inferring Social Network Structure using Mobile Phone Data, Proceedings of the National Academy of Sciences (PNAS),106(36), pp. 15274-15278. PDF