パソコンでスパコン並のグラフデータ処理が可能!?

グラフデータ処理というものが存在するらしいです。浮動小数点演算(FLOPS, Floating-point Operations Per Second)や整数演算(IPS, Instructions Per Second)は知っていましたが、コンピュータのグラフ処理能力を競うベンチマークまであるみたいです。

日本のスパコン「京」が、中国スパコンの台頭で、すっかり時代遅れになってしまったのですが、グラフ処理性能においては未だに世界最速だそうです。驚きました。少し古いデータなので今でも当てはまるのかは分かりませんが、その時のニュース記事があります。

2期連続でスーパーコンピュータ「京」がGraph500で世界第1位を獲得
-ビッグデータの処理で重要となるグラフ解析でも最高レベルの評価-

理化学研究所(理研)と東京工業大学、アイルランドのユニバーシティ・カレッジ・ダブリン、九州大学、富士通株式会社による国際共同研究グループは、ビッグデータ処理(大規模グラフ解析)に関するスーパーコンピュータの国際的な性能ランキングであるGraph500において、スーパーコンピュータ「京(けい)」1による解析結果で、2015年7月に続き第1位を獲得しました。

コンピュータの性能だけではなく、アルゴリズムやプログラムを含めた総合的な能力が求められるようです。「京」のポテンシャルの高さを示していると言えるでしょう。

パソコンでスパコン並のグラフ処理

パソコンに載せるGPUでスパコンレベルの計算速度を達成したというニュースは前回やりましたが、今回もPCがスパコンを越えたというニュース記事がありました。

Faster Than CMU’s Supercomputer, Korean Researchers Developed Easier, Cheaper Graph Data Processing System

GStream 2.0 employs a PC in which two GPUs and two PCI-e SSDs are used for graph-type data groups. This PC processes 256 billion edges at a speed of 2 GTEPS and can be utilized in various fields such as the Internet of Things, brain science, artificial intelligence and social networking.

「GStream 2.0は、2枚のGPUカードと2個のPCI-e SSDが、グラフタイプのデータグループのために使われているPCを採用しています。このPCは、2GTEPSの速度で2560億エッジを処理し、例えば、モノのインターネット、脳科学、人工知能、ソーシャル・ネットワーキングなどの様々な分野で利用可能です。」

GTEPS(giga traversed edges per second)とは、1秒間に10億回のエッジ(枝)探索が行えるということのようです。ちなみに「京」は38,621GTEPS(ギガテップス)の性能らしいので、パソコンで2GTEPSという事は、京はこのPCの約19310倍の性能という事になり、価格差を考えた場合、このGStream 2.0のコスパはかなり凄いような気がします。

The GraphLab of CMU

“The GraphLab of Carnegie Mellon University, which is the most advanced big data analyzer at this point in time, requires 1,400 seconds to process graph data having up to 32 billion edges with a supercomputer equipped with 480 CPU cores, a 2 TB memory and a 5 GB network,”

「現段階でビッグデータ分析の最先端である、カーネギーメロン大学のGraphLabは、480個のCPUコア、2Tバイトの主記憶、5GBのネットワークを備えたスーパーコンピュータを持ってしても、最大320億エッジを持つグラフデータを処理するのに1400秒を要します。」

スパコンで1400兆かかる処理を、GStream 2.0はなんと500秒以内で処理してしまうらしいのです。物凄いコスパです。スパコンとPCじゃ、維持費と電気代だけでも偉い違いですし。

アルゴリズムとプログラム

結局はアルゴリズムとプログラミング次第で、PCでもスパコン並みの計算処理が実行可能になるという事ではないのでしょうか。コンピュータの計算速度はコンピュータの性能だけが全てではなく、アルゴリズム構築や、コーディング技術もかなりのウェイトを占めていて、プログラマーの腕次第で、数十万のPCで、その数千倍の価格のスパコン並みの処理が可能になれば、それはそれで素晴らしいことだと思います。ハードの性能が全てではなく、コンピュータもソフトが無ければ所詮はタダの箱なので、アプリ開発能力もハードの能力以上に大切だと言う事を如実に物語っているのではないでしょうか。

Footnotes