2009年4月23日木曜日

サーチエンジン

Google の創始者 Sergey Brin Lawrence Page が書いた論文。PageRank の論文と同様に、Web のサーチエンジンアーキテクチャに関する代表的な論文であり、一読に値する。

The Anatomy of the Search Engine: http://infolab.stanford.edu/~backrub/google.html

2009年4月22日水曜日

卒論準備期間の意義

卒論は院試の後9月から本格的に始まるのだが、B4 の4月から7月までのこの準備期間はとても重要な期間。というのは、卒論に入ると、もういきなり最先端の研究に飛び込まなければいけないため、基礎的なことを勉強する暇はほとんどなく、修士に進むと更にそれを国際学会に通すために卒論の研究を発展させなければいけないので時間がない。

なので、いろいろ大変だと思いますが、今のこの時期は研究に携わる前の準備期間として非常に重要なので、頑張ってください。

Web 3.0

インターネットの父と呼ばれる Tim Berners Lee (MIT 教授) の講演で、現在の Social Networking System (Mixi, Facebook, MySpace など)は、初期のインターネットプロバイダの囲い込み (AOL, Prodigy, ... など)に戻っていると指摘。インターネットの思想はオープンネスが核にあり、これらの囲い込みは望ましくない。もし、Web 3.0 という言葉を定義するとすれば、OpenID などの技術がとても重要になってくると指摘。

2009年4月20日月曜日

18th WWW (World Wide Web) が スタート

スペインまでは直行便がないため、ロンドンのヒースロー空港経由でマドリッドに入ってきました。自宅を出てからホテルに到着するまで23時間。結構かかります。

WWW 2009 は, Web 系の学会のため、Yahoo や Google などの存在感が非常に大きいです。最近は、ユーザーの Web 上でのクリックの傾向を見て、広告の提示などを個々のユーザーにカスタマイズして出すようにしてきていますが、Click Stream という言葉を使うようになってきました。

我々、ストリームコンピューティングの研究グループとしては、さまざまな応用領域に役立つ研究をやっていきたいですが、この一つがこの Click Stream でしょう。

2009年4月17日金曜日

WWW 20周年記念

今年はWeb の20周年ということで、World Wide Web の創始者ともいえる Tim Berners-Lee 氏が来週スペインで行われる 国際学会WWW2009の基調講演でお話されます。CERN の http://webcast.cern.ch/でも実況中継されるようです。この講演に関しては、またここに書きます

民間営利企業における研究所の役割

民間営利企業における研究所の役割とは何だと思いますか?研究所の応募用紙のひとつの質問にこのようなものがありました。是非、時間があるときにでも考えて、ブログに書いてみてください。

まだ研究を始めてないので、想像でしか書けないと思いますが、研究を進めていくうちにその認識が変わっていくと思います。

IBM Smarter Planet University Jam 2009

来週 IBM では「IBM Smarter Planet University Jam 2009」という全
世界的な、大学・学生の方の間のオンラインディスカッションを企画しています。
よりよい地球、よりよい環境を作っていくにはどうしたらよいか、世界中の多くの
人と議論するチャンスです。ファシリテータとして本学の元教員である丸山さんも
参加します。ぜひ、一度はのぞいてみてください。

http://www-06.ibm.com/jp/software/academic/ur/ujam.html

研究環境の整備

研究環境の整備、いろいろとありがとうございます! 感謝、感謝です。

Subversion 関連に関しては、土曜日に見てみましょう。

2009年4月16日木曜日

IBM の技術トレンド文書: GTO (Global Technology Outlook)

IBM は、今後の未来の技術動向を GTO (Global Technology Outlook) という形で、世の中に発信していいます。この GTO 文書の戦略策定は、研究部門(リサーチ部門)がリードして作っていきます。

民間企業の研究所に勤める醍醐味は、世界に影響力のある技術文書に携われることではないでしょうか。

TRL (Tokyo Research Laboratory: 東京基礎研究所)の所長である丸山さんが CNET のブログに2009年度の GTO の概略を書いているので、暇なときにでも読んでみてください。
http://japan.cnet.com/blog/maruyama/2009/03/23/entry_27021287/?ref=rss

2009年4月15日水曜日

Eucalyptus : オープンソースのクラウドシステム

2000年頃に鈴村がお世話になった UCSB の Rich Wolski 教授 がリードする オープンソースのクラウドシステム. http://eucalyptus.cs.ucsb.edu/
Amazon EC2 (Elastic Computing) のインタフェースと互換だとか。

2009年4月14日火曜日

IBM 箱崎事業所

今日は、半蔵門線の水天宮前駅にある IBM 箱崎事業所にいって、ストリームコンピューティングの話しをしてきます。昨今、いろいろな業種(金融、建設機械、携帯など)からお声のかかるこの分野。ホットなエリアです。

2009年4月12日日曜日

所信表明演説

学生の皆さん、ブログに所信表明演説を書いてください。今年1年の目標やこの1年間にどう成長していきたいかを書いてください。

内部向け情報共有ページ

http://sites.google.com/site/suzumuralab/ を使用して、情報などの共有を行いたいと思います。各自の研究の進捗はブログで管理してください。

卒論準備演習: ネットワークプログラミング

課題: ネットワークプログラミングの基礎

期日: 4月30日まで

課題1)  クライアントが送った文字列をサーバー側に表示するプログラムを
      Java, C, Ruby で記述せよ (プロトコルは TCP)

hostA) ./server -port 8888 (ポート8888で待機)
hostB) ./client -server hostA:8888 "Hello World"

注意点
- クライアントとサーバーは異なるホストで稼動することを仮定せよ。
- マシンは Condor クラスタを利用
- 開発環境は Java は Eclipse, C と Ruby は Emacs を使用
- ソースコードは Subversion で管理
 - パケット監視ツールを用いてパケットを監視せよ

課題2) 課題1で作成したプログラム(Java, Ruby, C のどれかでよい)を拡張する。適当な
  プロトコルを設計し、それを実装する クライアント、サーバーを実装せよ
      

研究室サーバー

マシン: Dell マシン (スペックは?)

OS
: Ubuntu 最新版

Pukiwiki: ドキュメント管理

Web サーバー:
- 各人の Web サーバーを置く? GSIC のサーバーでも同じく Web コンテンツを
  置けるので、それとの比較を行う

Subversion
ソースコードや文書のバージョン管理用ソフトウェアとして、代表的なものに Subversion や CVS があります。本研究室では、CVS よりも定評のある Subversion を使いましょう。http://subversion.bluegate.org/doc/book.html.

バックアップ方法について考える (例: RAID)

その他必要かもしれないもの: NFS サーバー

注目学会

国内学会

国際学会

WWW2009

鈴村は 4月19日から WWW 2009 (World Wide Web) に参加。WWW はウェブ系では採択率が 11% (900件中100件ぐらい)と非常にハイレベルな国際学会であり、アカデミック(大学や公的機関の研究者)な研究者だけでなく、Google, Yahoo, Microsoft, IBM などメジャーな IT 企業の発表が多いのも特徴的である。
幸いにも First Author として1件、共著者として1件論文が採択されたので、その発表をしにいく。
学会の様子はまた随時このブログにアップする。

海外インターンの薦め

卒論終了後の春休み、M1の夏休み、冬休み、春休みを利用して、海外のインターンに行くことを薦めたい。海外での経験は日本社会では非常に重宝されるし、身についた英語力と経験は自身の戦略的な武器になる。

先生も企業探しに協力するが(もちろんIBM内でも探す)、どんなチャンスがあるかを自身でも探していって欲しい。ご存知だと思うが、語学は一夜にして身につくものでもないので、英語力は常に磨いていってほしい。

並列プログラミングの基礎

卒論準備演習として、まずは基礎技術を身につけるために以下の4つの課題(1-4) を行う。おおよそ3ヶ月あるので、一つの課題につき2週間の期間を設ける。いずれも超重要な基礎技術(履歴書にもちゃんとスキルとして書ける)であり、卒論期間(9月から)に入ると、ゆっくり勉強する時間がなくなるので、しっかりと習得してほしい。

0. 研究環境の整備 (VMWare, Linux のインストール)
1. Network プログラミング ( C と Java)
2. マルチスレッドプログラミング (C と Java)
3. MapReduce プログラミング(プログラミング言語 JavaとHadoopを用いる)
4. CELL または GPU プログラミング (プログラミング言語 C) :ハードウェアを後日購入
(Optional) MPI プログラミング (プログラミング言語 C)

投稿内容の区分にラベルを使用

このブログへの投稿内容を区分するために、以下のラベルのいずれかを付与します

students : 学生に向けた発信です。学生は必ずこれはチェックを
suzumura-todo: 鈴村自身の ToDo です
misc: その他
... (随時追加していきます)

鈴村 ToDo

- Office 、ウイルスソフトウェアの取得(鈴村の東工大メールアドレスを取得してから)
- Lavie の 2.5 inch ハードディスク

MapReduce 入門

昨今、大変注目を浴びている 大規模並列プログラミングフレームワーク MapReduce.
ここの Lecture 1 (Introduction), 2 (MapReduce), 3 (Distributed File Systems) を見てみてください。MapReduce やその根底にある分散ファイルシステムの真髄に触れることができるでしょう。