2012年6月21日木曜日

Clearing the clouds: a study of emerging scale-out workloads on modern hardware


Clearing the clouds: a study of emerging scale-out workloads on modern hardware

http://dl.acm.org/citation.cfm?id=2150982

Graph related stuff

Lifting Sequential Graph Algorithms for Distributed-Memory Parallel Computationhttp://osl.iu.edu/publications/prints/2005/Gregor:OOPSLA:2005.pdf



Efficient Parallel Graph Exploration on Multi-Core CPU and GPU, PACT2011

http://ppl.stanford.edu/papers/pact11-hong.pdf



Accelerating CUDA Graph Algorithms at Maximum Warp, PPOP2007

http://ppl.stanford.edu/papers/ppopp070a-slides.pdf



Efficient Breadth-First Search on the Cell/B.E. Processor
http://www.dais.unive.it/~calpar/AA07-08/bfs.pdf



Optimizing Parallel Sparse Matrix-Vector Multiplication by Corner Partitioning, PARA08
http://www.sandia.gov/~egboman/papers/PARA08.pdf

Fast sparse matrix-vector multiplication by partitioning and reordering
http://igitur-archive.library.uu.nl/dissertations/2011-0913-201603/UUindex.html

More introduction stuff
http://www.cs.berkeley.edu/~skamil/cs267/notes/lect15NoteSpMV_kim.pdf

CACHE-OBLIVIOUS SPARSE MATRIX–VECTOR MULTIPLICATION BY
USING SPARSE MATRIX PARTITIONING METHODS

http://people.cs.kuleuven.be/~albert-jan.yzelman/PDFs/yzelman09-rev.pdf



Parallel Hypergraph Partitioning for Scientific Computing

http://www.cs.sandia.gov/~egboman/papers/IPDPS06.pdf



ON TWO-DIMENSIONAL SPARSE MATRIX PARTITIONING:
MODELS, METHODS, AND A RECIPE∗, 2010

http://graal.ens-lyon.fr/~bucar/papers/ucca2D.pdf


Application to protein-protein interaction network. 

A. Vazquez, A. Flammini, A. Maritan, and A. Vespignani.
Global protein function prediction in protein-protein interaction network
http://www.ncbi.nlm.nih.gov/pubmed/12740586


Application to computational phylogenetics 

B. Moret, D. Bader, and T. Warnow. High-performance algorithm engineering for computational phylogenetics. In
Proc. Int’l Conf. on Computational Science, volume 2073–
2074 of Lecture Notes in Computer Science, San Francisco,
CA, 2001. Springer-Verlag.


B. M. Moret, D. Bader, T. Warnow, S. Wyman, and M. Yan.
GRAPPA: a high-performance computational tool for phylogeny reconstruction from gene-order data. In Proc.
Botany, Albuquerque, NM, Aug. 2001.

2012年6月19日火曜日

Machine-Learning with Real-time and Streaming Applications

http://lyra.berkeley.edu/CDIConf/program.html

2012年6月12日火曜日

メモリ消費量を考慮したジョブスケジューリング

2年ほど前に書いた以下のエントリの問題は現実に必要な技術。
http://suzumura-lab.blogspot.jp/2010/07/blog-post_28.html

Apache Mahout

Machine Learning の Hadoop ベースのライブラリ Apache Mahout http://mahout.apache.org/
サポートされているアルゴリズム。
  • Collaborative Filtering
  • User and Item based recommenders
  • K-Means, Fuzzy K-Means clustering
  • Mean Shift clustering
  • Dirichlet process clustering
  • Latent Dirichlet Allocation
  • Singular value decomposition
  • Parallel Frequent Pattern mining
  • Complementary Naive Bayes classifier
  • Random forest decision tree based classifier
  • High performance java collections (previously colt collections)
  • A vibrant community

各自のタスク

各自のタスクの概要は以下の通りです。

Miyuru君: X10 Workshop @ Beijing 発表。SOCC2012投稿。ScaleGraphプロジェクトリード
上野君:HPDC発表準備/発表, ISC参加。ACS論文誌発表. 青柳君 X10 ベース ストリーム処理系ヘルプ、大規模グラフ処理基盤アーキテクチャ設計.
雁瀬君:WISE論文執筆。I-GIMV の追求. Apache Giraph 上への実装
渡部君:次の研究テーマ決め。Apache Giraph, HAMA, HBase などの実装。関連論文読み。I-GIMV論文読みなど
岡田君:イベント検知+感情・評判分析を用いたストリーム処理基盤のアーキテクチャおよびコンポーネントの実装詳細設計
Charuwat君:BC最適化実装。RDF + DBPedia、グラフパターンマッチング調査
橋川君:ソーシャルネットワークのシミュレーション基盤構築。6月は Twitter のクローラー実装。
小形君:Spectral Clustering 。MAGMA による高速化。他のクラスタリングアルゴリズムの調査
バオ君:Apache Giraph の実装中身、サンプルアプリケーション、TSUBAME 上での性能評価など
金刺君:大規模エージェントシミュレーションのメッセージング機能の実装。データ同化 (Data Assimilation) が研究テーマ。


2012年6月9日土曜日

Pregel のオープンソース実装

バオ君の次の課題として、Pregel のオープンソース実装である Apache Giraph (http://incubator.apache.org/giraph/)を試してもらっている。Web ページを見ると、Fault Tolerancy などを鑑みて Hadoop/Zookeeper 上に実装されているようだ。性能面では ?? な実装である。

ちなみに、前にブログでも紹介したことがあるが、BSP(Bulk Synchronous Parallel)を実装している Apache Hama (http://incubator.apache.org/hama/)というプロジェクトもあるが、それとは関係ない。こちらはHDFS は使っているようだ。

また、Pregel のもう一つの実装である Bagel というのもある。以下の記事が参考になる。
http://d.hatena.ne.jp/smly/20110730/1312022963