2010年5月29日土曜日

[StreamSR] DICOMO 2010

西井くんの論文投稿先を考えています。音声以外では以下の研究会やシンポジウムでしょうか。国際学会もどこに出すか考えていきたいですね。

情報処理学会 DPS 研究会:マルチメディアと分散処理研究会
発表申込締め切り 7/12, 原稿締め切り 8月中旬

DICOMO マルチメディア、分散、協調、モバイル
既に締め切りが過ぎていまっています。


[StreamSR] 音声認識のスケーラビリティに関する研究

「音声対話システムにおけるスケーラビリティ評価モデルの検討」
[論文誌Vol.46, No.9, pp. 2269-2278 (2005)]

モバイル環境において,情報検索など利用者の目的を達成するためのインタフェースとして音声対話システムが注目されている.本論文では,サーバ処理能力と完全重複ユーザ数を求めることで,サーバ認識型音声対話システムのシステムスケーラビリティを推定する手法を提案する.サーバ処理能力は応答間隔および遅延時間から算出され,完全重複ユーザ数は発話間隔および同時接続ユーザ数より算出される.これらの値を応答時間で補正してサービスに必要なサーバ台数であるスケーラビリティを推定する.そして,「レストラン検索」および「駐車場検索」をサービス例とした検証評価を行い,サービス要件に応じたシステムスケーラビリティ推定の可能性を示した.

[StreamGPU] Regular Expression on GPU

正規表現を GPU 上で実行する研究。GPU に関係している人、要チェック。

Regular Expression Matching on Graphics Hardware for Intrusion Detection
http://www.ics.forth.gr/dcs/Activities/papers/gnort-regexp.raid09.pdf

StreamScale: データストリーム処理系の実装

 そろそろ、うちの研究室でのデータストリーム処理系の設計を始めようと思います。やはり、コンポーネント化が重要であるので、OSGi のバンドル機構を使ってどのように実装していくかを調査していきましょう。

OSGi は Eclipse のプラグインなどに使われていますが、Spring, JBOSS, WebLogic, GlassFish, WebSphere Application Server v7.0 などのサーバーサイドでも使われだしています。以下は、WAS v7.0 の OSGi フレームワークの使われ方を開発したものです。チェックして見て下さい。


2010年5月26日水曜日

ASPLOS 7月締切り

http://asplos11.cs.ucr.edu/callforpapers.html

OceanStore: An architecture for globalscale persistent storage

OceanStore: An architecture for globalscale persistent storage (PDF)

2010年5月20日木曜日

[Data Distribution / StreamScale] データストリーム処理におけるデータ分散最適化

来週からイスラエルで始まる 国際会議 SYSTOR 2010 では、ETL (Extract-Transform-Load) 処理にデータストリーム処理をした際の様々な性能解析と性能最適化に関する論文を発表します。

さて、この研究の続きとして以下のことを考えています。

SYSTOR の論文では、データを計算側に送る供給量が並列環境では十分ではなく、計算側のノード数、コア数を増加させたときにスケーラビリティが得られないという問題点をあげています。その解決策として、データの供給側を増やすことによって、リニアな性能向上を達成できたというのがこの研究の貢献です。この論文を受けて、以下の研究テーマを考えています。

1. 自動最適化: 先行研究では、供給側の増加は、供給側の分割数を試行錯誤しながら行いましたが、自動的に最適な分割数を探索し、かつプログラム変換によって自動最適化を行う手法を考えます。また、計算側のオペレータは、事前にプログラマによって SPLIT などによって、並列化していることを前提としていますが、開発者は論理的にデータ読み込みと計算部分を並列化を意識せずに開発し、最適化機構によって、ソース数と計算オペレータ数を最適化するようなプログラム変換を施し最高性能を得ます。

2. 実行時自動最適化: 1 は実行時前の最適化ですが、実行時にプロファイリングしながら最適化することも考えられます。こちらは難易度が高いですし、現行の System S ではできないでしょう。本研究室でデータストリーム処理系を作るとしたら、まず、このような最適化ができるような仕組みを作っておく必要があります。

2010年5月18日火曜日

2009年度 IA 研究会 研究賞受賞

 老木君が主著の論文「ストリーム処理 System S を基盤にしたWebサーバーの構築」が2009年度の IA 研究会(インターネットアーキテクチャ)の研究賞を受賞しました。研究賞は、09年に研究会で発表された論文の中から数件採択されるものなので、価値が高いものです。老木君、おめでとうございます!

2010年5月17日月曜日

[StreamGraph] グラフアルゴリズムのライブラリ

Java 実装
  • Jung (Java Universal Network/Graph Framework) :グラフ(ネットワーク)構造の視覚化や分析を行うための、Java ベースのオープンソースライブラリ (Link)
  • JGraphT: http://www.jgrapht.org/
Python 実装
C++ 実装

[StreamSR] Call Centers of the Future

先日ゼミで少し紹介した次世代コールセンターに関する記事が以下の PDF にのっています。

西井君、チェックしてみてください。

以下、ほんの一部ですが、紹介を。

- 最近のコールセンターにかけると、"Please note that this call may be recorded for training and evaluating purposes" と言われることも多く、顧客とのやりとりは録音されている。
- "Shall I make the bookings for you" と言う所を、"Can I lock this for you ?" と良く言う人がいたら、それを即座に訂正するような仕組みを作りたい
- Call Center には お客様からのコールを待つ Inbound (航空券の予約システム、お客様コールセンター) と お客さまへの売り込みをかけるOutbound がある。Outband で売り上げが良いオペレータ (Agent) の言い回しなど、Association マイニングなどを用いて行いたい。
- Call Center の成功にはオペレータの教育が重要だが、それにもコストがかかる。集団教育以外に、個別の教育も重要で、ここをコンピュータである程度 Automation できると良い

2010年5月14日金曜日

新メンバー第1回目演習発表会

新メンバー4人(石井君、上野君、雁瀬君、西井君)の第1回目演習発表会がありました。それぞれテーマは違いますが、頑張ったと思います。お疲れ様です。

 次の発表に向けて、ひとつだけ気をつけて欲しいことがあります。 研究では、”実用性”、”新規性”、”進歩性”をディフェンスする要素を定量的なり定性的なり言う必要がありますが、何をやったかを正確に伝える技術に加えて、自分の研究の Contribution を正確に伝える技術がとても重要です。

これをやるには、参考文献や他の研究の詳細をちゃんと調べなければいけないので時間はかかりますが、大事なことなので意識して研究に勤しんでください。

2010年5月2日日曜日

Cytoscape

ネットワークの可視化ツールとして、統計言語の R の igraph や sna パッケージ、Processing による可視化などがあるが、Cytoscape はよく出来ていそうだ。元々バイオ系の可視化に作られたものだが、Twitter などの動的ネットワークの可視化にも使えるだろう。