ラベル strategy の投稿を表示しています。 すべての投稿を表示
ラベル strategy の投稿を表示しています。 すべての投稿を表示

2011年3月3日木曜日

良い論文を書く

 良い論文を書く(=国際会議に通す)上で必要なことを書きます。

(1) 実装を始める前に、徹底的に既存研究を調査し、それとの差異を明確にする。差異が明確にできたら、深い実装を始める前にスライドに一つの筋書きが書けるはずです。研究によっては、少し実装を始めなければわからないこともあるでしょう。この際にはできるだけ、クイックにプロトタイプ実装し、iterative に(1) を繰り返していきましょう。

(2) 実装中には、新たな技術的発見、既存研究との差異をより明確化するような要素を見つけてください。その研究の価値が集りますし、新規性を主張しやすくなります。

(3) 実装が終了した後は、徹底的な定性的・定量的評価をしてください。(a) 評価対象アプリケーション・シナリオの豊富さ(マイクロベンチマーク、実アプリケーションを含めて3つが定石)、(b) 提案手法の優位性を示すデータ、(c) (b)に関するプロファイリング(なぜ良くなったか、なぜ悪いかを定量的に示す)(d) 類似技術との比較、の4点セットが必須です。特にほっとして(3)が poor になりがちですが、非常に大切です。

論文は最終的に国際会議(査読付き)に通してこそ、その研究が終了したと思ってください。(1) の段階で研究の方向性を変えていくことは悪いことではありません。むしろ研究の方向性が間違ったまま突っ走ることこそ良くありません。但し、(2) まで進んだ際には必ずその研究をしっかりと完遂していきましょう。

関連エントリ

2010年12月15日水曜日

評価の重要さ

 論文としての完成度を高めるには、徹底的に、提案する手法を定量的かつ定性的に評価する必要があります。良い研究であっても、その辺の Evidence がないと論文としては難しく、逆に、国際学会のいろいろな論文を見ると、提案する手法の新規性や進歩性が低くても、その辺の徹底的な分析があることによって、採択されている論文もあることに気づくでしょう。実装に比べると、評価は地道な作業ですが、そこが論文としては非常に重要であることを覚えておいてほしいと思います。

2010年11月16日火曜日

プロジェクト体制のまとめ

今の研究室のプロジェクト体制を再度まとめましょう.

1. StreamGPU チーム (松浦君、上野君)
2. StraemGraphチーム (西井君、雁瀬君)
3. StreamCloud &StreamDS チーム(石井君、松浦君)
4. StreamScale チーム (Miyuru 君、上野君)

2010年3月22日月曜日

2010年度前期輪読テーマ

4月から始める Stream Computing SIG (Special Interest Group) のテーマをそろそろ考えていきたいと思います。輪読するだけでなく、研究に関する議論も行っていきましょう。プロジェクトミーティングは別途行うとして、こちらでは主に関連研究や論文を読んで、それぞれの研究力をつけていきたいと思います。
  • Load Shedding に関するテーマ: Data Stream Load Shedding by Amit Ahuja の本
  • Virtualization の仕組み (準仮想化と完全仮想化の違いなど)やクラウド関係
  • SQL のストリームへの拡張 (StreamSQL, CQL など)
  • StreamGPU 関連
  • 耐故障性、高信頼性、データ保証などを取り入れた DSMS

2010年1月30日土曜日

2010年度のプロジェクトの構図

鈴村研究室の今年のプロジェクト体制の構図。黄色は昨年度からの継続またはほぼ確定しているプロジェクト、緑は可能性はあるが未確定のプロジェクト、オレンジは他の研究室との協業プロジェクトです。



2010年1月1日金曜日

鈴村研究室の2010年の抱負

あけましておめでとうございます。今年も研究頑張りましょう。

さて、今年の研究室の目標を列挙しましょうか。まずは昨年から続いているプロジェクトを更に進展させ、きっちりと国際学会まで通しましょう

StreamGPU
  • 卒論、情報処理学会全国大会、SACSIS 及び国際学会での発表
  • 差分データ送信などのデータストリーム処理+GPU ならでは最適化手法の考案と評価
  • マルチ GPU における評価
  • 新たなアーキテクチャ (Fermi) 上での評価
  • SST 以外のアプリケーションを用いた評価
StreamDS (Dynamic Scheduler) :
  • 卒論、情報処理全国大会、SACSIS 及び国際学会に通す.
  • Hadoop との統合(松岡研究室との共同研究)
StreamTwitter
  • パブリックなサービスとして公開する。国内学会、国際学会に通す
  • トラフィックのパターン解析
  • 意味付け(アメダスやインフルエンザ流行度合いなどのトレンド分析)
 次に4月から、新たに3名がメンバーとして加わると予想されますが、新たな研究テーマにも取り組んでいきたいと思っています。具体的には以下の通りです。特に現在では、実データとして Twitter のデータしかないという問題があります。この問題を打開すべく、今年は、鈴村研究室発のセンサーをばらまいて、より多くの実センサーデータを取得できる環境を作り、ミドルウェアの研究に役立てていきたいと思っています。
  • StreamCloud : クラウド上におけるストリーム処理システム: Amazon EC2 / Eucalyptus 上における Elasticity を利用したスケーラブルなストリーム処理システム。さらに Xen や Hypervisor 上での System S の性能特性を調べます。
  • StreamShedder: Load Shedding 技術の追求: SSD などの高速ストレージを用いた高負荷時におけるデータの退避技術。ターゲットアプリケーションとして Twitter などを例に評価すれば良いでしょう。これは松浦君の卒論でフォーカスしている StreamDS を強固にする技術として重要です。Zip の法則などのアプリケーションのセマンティクスを活用した Shedding 手法も考案できるでしょう。
  • StreamAR: 拡張現実システムにおけるストリーム処理技術を用いたスケーラブルなソフトウェア基盤の構築。及び iPhone や Android 上での鈴村研究室発の AR アプリケーションの公開。

  • StreamScript: ストリーム処理の開発生産性の向上: 現在の SPADE/System S では、ユーザーがカスタマイズしたコードを書く際には、別途 C++ でコードを書かなければならず、Agility が低いです。この問題点に対して、Python, Ruby などのスクリプト言語ベースでのユーザー定義オペレーターを記述できるように改良し、開発生産性を向上させます。実装としては、既に Java でユーザー定義のオペレータを作れる JavaUDOP というものがあるので、それを利用して、JVM (Java Virtual Machine) ベースで実装されたスクリプト言語処理系を呼び出すようなアーキテクチャになると思われます。
  • ストリーム処理システムの実装: SPADE のシンタックスは踏襲し、 それを処理するシステムをスクラッチから構築する。
 上記の技術を探求する際に、現実的なアプリケーションを見据えることが重要です。今のところ、Twitter や異常検知のアルゴリズムは実アプリケーションですが、引き続き、キラーアプリケーションを探し、それらのアプリケーションをベースに研究を行っていく体制を確立していきたいと思います。現在、以下のアプリケーションが候補です。
  • スケーラブルなリアルタイム音声処理への応用(新メンバー西井君に期待)
  • 次世代 DNA シーケンサー及びバイオへの応用
  • 楽天などの Web サイトのログ高速処理
  • 環境関係: Live E! プロジェクト, Boston 近郊の気象データ