HPC/AIの可能性を最大化する高速・大容量ストレージ > メディア > データ分析のニーズをうけHPCはエンタープライズ領域へ - JLUG 2016レポート
イベントレポート
2016/11/29

データ分析のニーズをうけHPCはエンタープライズ領域へ - JLUG 2016レポート

メディア
HPC領域で高い実績のあるオープンソースのファイルシステム「Lustre」のユーザーカンファレンス「Japan Lustre Users Group (JLUG) 2016(主催:データダイレクト・ネットワークス・ジャパン)」が10月18日、東工大蔵前会館で開催された。企業からの注目度が年々増すなか、今年から実施時間が半日から1日に拡大された同イベントの模様をレポートしよう。

裾野が広がる企業の分析ニーズに積極的にこたえる

今年で6回目となるLustreファイルシステム関連の国内唯一のイベントJLUG。コントリビューターやユーザーが一堂に会し、情報交換やコミュニティからの最新情報を得るための貴重な機会の場だ。近年はビッグデータやIoT、AIといったビジネストレンドを受け、Lustreの活用領域もHPCからエンタープライズへと裾野を拡大中である。オープニングに登壇したデータダイレクト・ネットワークス(DDN)ジャパン 代表取締役 ロベルト・トリンドル氏は、そんな状況を受けて「ユーザーが増え、それにつれてソリューションベンダーも増えた。今後も中立的なイベントとして価値ある情報を提供していきたい」と挨拶した。


データダイレクト・ネットワークス・ジャパン 代表取締役 ロベルト・トリンドル氏

最初のセッションでは、コントリビューター大手米インテルのPeter Jones氏(High Performance Data Division)が登壇し、Lustreのロードマップを説明した。Jones氏は、最新版2.9で、サーバ/クライアントでのRHEL 7.2対応や、クライアントでのSLES 12SP1対応、共有鍵暗号化やサブディレクトリマウントなどの新機能が備わること、また、2.10以降ではMulti-Rail LNETやクオータ管理など興味深い機能が加わるとした。

続いて、富士通の住元真司氏(次世代TC開発本部シニアアーキテクト)が登壇。Lustreのイベント「LUG 2016」や「LAD'16 & Lustre Developer Summit 2016」のトピックスとして、同社がコントリビュートしたバックアップ機能「DL-SNAP」やInfiniBand対応の「IB Multi-Rail」を紹介した。

新スパコン環境を稼働させた京大、Lustre導入を進める気象庁



京都大学 京都大学学術情報メディアセンター コンピューティング研究部門 准教授 深沢圭一郎氏

午前中の注目セッションは2つの事例講演であった。1つ目は、京都大学の深沢 圭一郎氏(京都大学学術情報メディアセンター コンピューティング研究部門 准教授)による「京都大学新スーパーコンピュータシステムの初期性能評価」という講演。京都大学ではスーパーコンピュータのリプレースに合わせて、2016年10月から新たなスパコン環境を稼働させている。新たに加わったのはCRAYの「XC40」「CS 400(2017年1月稼働予定)」で、メインのストレージシステムとしてDDNの「EXAScaler」を採用した。ストレージは初期16PB+100GB/s、追加で8PB+40GB/sという構成で、すべてのシステムからアクセス可能。処理を高速化するBurst Buffer機能にも対応した。深沢氏は「実アプリでの初期性能評価ではSMTの効果が減少しMCDRAMの効果が見えた。最適化すれば性能はもう少し上がりそうだ」と評価結果を発表した。


気象庁 予報部 情報通信課 プログラム班 技術専門官 牧 美照氏

2つ目の事例講演は、気象庁の牧 美照氏による講演「気象庁 スーパーコンピュータシステム」だ。気象庁では数値予報計算のために1959年からスパコンを導入してきた。数値予報計算とは、収集した観測データにより大気状態を数値的に解析し、その大気状態を物理法則に基づいて時間発展させて将来の気象状態を予測する天気予報の提供に欠かせない計算処理だ。牧氏によると日々の気象・防災情報を決められた時間に国民に提供するために重要になるのが高性能、可用性・安定性、堅牢性だ。だがこれまで導入してきたファイルシステムでは、一部処理のI/O高負荷により、業務処理全体のI/O処理遅延が発生した場合に原因の特定が困難だったり、共有領域にコピーしたファイルが破損しても、それを検知できないなどの問題が発生したことがあったという。そこで次期スパコンの高速ストレージにLustreを採用する予定だ。「大規模共有ファイルシステムは気象庁業務の根幹をなすスパコンのシステムに不可欠」と強調した。

CAEでHPCを活用するマツダ、ポストムーア時代を見据える東工大


マツダ ITソリューション本部 エンジニアリングシステム部 CAE/CATグループ リーダー 今本 健児氏

午後からのセッションでは、まず、米インテルのOleg Drokin氏(High Performance Data Division)によるLustre 2.10以降の新機能と開発状況の説明がなされた。続いて、マツダの今本健児氏(ITソリューション本部 エンジニアリングシステム部CAE/CATグループ リーダー)による講演「マツダのHPCストレージ戦略」の講演が行われた。

マツダでは、エンジンなどのパワートレイン領域と車両領域のCAEでHPCを活用している。だが、非定常解析の増加や規制対応、精度向上といった要求から、ストレージに求められる要件が高まってきた。そこで計算規模の増加への対応と全停止のない安定的な運用を考慮して、2014年にDDN製品を導入。2015年と2016年に機器をそれぞれ追加して性能、可用性を高めながら安定運用を続けている。今本氏は「マツダのビジネス要件として、今後、AIやIoTが加わることを想定した戦略が必要と考えている」と話した。


東京工業大学 学術国際情報センター 教授 松岡 聡氏

続いて、東京工業大学の松岡 聡氏(学術国際情報センター 教授)が「ビッグデータ・機械学習・AIとHPCの統合からポストムーアへの道」と題して講演。松岡氏は、東工大が開発・運用するTSUBAMEの事例を紹介しながら、データ分析が広く求められるなかで、新たな視点での演算処理方法を評価すべきだと訴えた。従来のHPCの評価方法によると、SNSでのユーザーの関係を探るようなGraph分析ではうまく性能がでないという。東工大ではGPUやフラッシュNVMを活用して大規模なGraph処理で成果を上げている。「(集積度で性能を上げるのではない)ポストムーアに向けた取り組みが重要になる。また、東工大ではデータ解析のためにスパコンを用いた機械学習の高速化・大規模化にも取り組んでいる」と強調した。

次世代スパコンを稼働させた東大、Oakforest-PACSを運用するJCAHPC(東大+筑波大)

Lustreの機能強化やLustreソリューション自体については、CRAYやDDN、Intelといったベンダー各社がそれぞれの視点から解説した。また富士通の住元氏は、同社が提供する高性能スケーラブルファイルシステム「FEFS」や次世代共有ファイルシステムの開発状況を解説した。


東京大学 情報基盤センター 准教授 塙 敏博氏

また最後の事例講演として、東京大学の塙 敏博氏(情報基盤センター 准教授)が登壇し、「データ解析・シミュレーション融合スーパーコンピュータReedbushにおけるストレージシステム」と題して講演した。Reedbushは東大が今年から稼働を開始したXeon(Broadwell-EP)ベースのスパコンだ。2つのサブシステムで構成され、Nvidia Tesla P100を搭載したサブシステムを含め、2017年3月までにすべて稼働開始する予定だ。ストレージシステムは、Lustreベースの並列ファイルシステムと、Burst Buffer機能を使った高速ファイルキャッシュシステムで構成されている。塙氏は「最新のコモディティ技術を導入することで、高い性能を得るとともに短期間で安定稼働した。Burst Bufferの有効活用に引き続き取り組んでいく」とした。

クロージングには、筑波大学の建部 修見氏(計算科学研究センター 教授)が登壇。東大と筑波大で設立した最先端共同HPC基盤施設(JCAHPC)が開発・運用するスパコン「Oakforest-PACS」などに触れながら、HPCに対する社会的なニーズは高まっており、それにこたえていくことが重要だと強調した。

多数のユーザーが参加して盛り上がったJLUG。エンタープライズ領域での利用も進むなか、注目度はさらに向上していきそうである。

(マイナビニュース広告企画:提供 データダイレクト・ネットワークス・ジャパン)