高速・大容量ストレージ > メディア > 未来型医療を築いて 震災復興に取り組む
導入事例
2014/10/01

未来型医療を築いて 震災復興に取り組む

メディア

医療情報とゲノム情報を複合させたバイオバンクを構築

東北大学 東北メディカル・メガバンク機構
ToMMo

2011年3 月11日の東日本大震災発生後、被災地復興の企画原案の中で、未来型医療を築いて震災復興に取り組むことを目的とした東北大学「東北メディカル・メガバンク機構」が2012 年2 月に設立された。医療情報とゲノム情報を複合させたバイオバンクを構築し、その情報とその解析結果に基づく新しい医療の創出を通じて、被災した東北地区への医療関係者の求心力向上、産学連携の促進、関連分野の雇用創出、そして被災地区の医療復興を成し遂げる。その情報解析にあたっているのが、同機構ゲノム解析部門の教授である木下賢吾博士と長﨑正朗博士である。
いくつものスーパーコンピュータ・システムの立ち上げを成功させてきた2人は、東京大学医科学研究所のヒトゲノム解析センターでのスーパーコンピュータのシステム構築を下地として、単一のLustre ファイルシステムとして、導入時で12 PB という遺伝子研究分野においては日本最大のストレージ容量を誇るシステムを構築した。

チャレンジ

  • 遺伝子と医療データを併せたバイオバンクの構築
  • 疾病への感染と遺伝子、地域の関連性の調査及び効果的治療法の確立
  • 1000 人での3 世代に渡る継続的調査


2014 年7 月に本格運用を開始した、16,480 CPU コアの構成で400TFLOPS の総理論演算性能を誇る東北メディカル・メガバンク機構のスーパーコンピュータ・システムは、56Gbps の高速InfiniBand ネットワークを介し、記憶容量12PB を越えるストレージシステムに接続される。現在、被災地の住民から提供されるゲノムを対象にした解析に主に使われている。

現在数千人分の解析を行っており、日本人の標準的なゲノム配列のデータベースを構築していく。
その後、標準的なゲノム配列と一人ひとりのゲノム配列を比較して違いを検出し、ゲノムの差異と疾患原因との関係性を統計的に解析していく。これにより「パーソナライズド・メディシン」つまり一人ひとりにあった個人ごとの医療の提供を目指す(木下博士)。

この数千人分のデータは、既に 12PB の総容量を工夫して使用しなければならない程の規模になっている状況で、今後の拡張は必須である。必要なストレージ容量の増大が確実な中、コントローラー部分に多くの予算を使用し、今後はハードディスクの増設で対応可能になる拡張性を持たせることに成功した。データがオンラインでないと解析が不可能なゲノム・システムには高い性能と拡張性が求められる。このような拡張可能な設計となっているシステムを今回公募し、価格面やサポートなど総合的な評価を行い採択した(長﨑博士)。

疾病の原因を解析していく場合、欠けていることが多いのが健常時のデータである。その欠けているデータがこのシステムを使用して備えられていくことは、これからの国の医療の財産になっていく。この基礎が整備されると、その上に構築できる未来の医療のポテンシャルが大幅にアップすると信じている(長﨑博士)。大切でやるべきと考える未来の医療の基礎を、この大規模なシステムを使って構築していくことに誇りと喜びを感じている(木下博士)。両博士はそう締めくくられた。

システムイメージ

システムイメージ

総容量 12PB を誇る、遺伝子研究分野における単一のLustreファイルシステムとして日本最大のストレージ・システム

DDN 選択の理由

  • DDNの日本におけるライフサイエンスおよびゲノム研究機関における実績
  • Lustreファイルシステムのシステム構築、導入、管理、およびサポートにおける経験
    新機能のテストを含む、顧客のためのベンチマーク実績
  • 主契約者及びエンドユーザーとの強い関係、エンドユーザーの要求への深い理解
  • 今後5~7年のゲノム配列データの爆発的増加に対応可能な拡張性、及びそれに対するフェーズ単位でのアプローチ
    将来の拡張における費用対効果
  • 最良なトータルストレージシステムの提案
    ファイルシステムだけでなく、トータルなシステム管理に対する提案
  • すべての顧客の要件をカバーできるシンプルなシステム設計
    当初の想定構成と比較してシンプルかつ高い拡張性を両立
    システム運用の限られたスタッフ構成に対応
  • SFXなどの概念を取り入れた、既存のシステムに新しいアイデアを加えた性能最適化へのアプローチ
  • システム導入、システムの拡張、およびサポートオプションに対する高い柔軟性と実行能力


導入の効果

導入時でも遺伝子研究分野においては日本最大のストレージシステムである12PBの容量は、DDNから提示された長期に渡る明確で確実な製品ロードマップに基づき、今後さらに大規模のシステムへ柔軟な拡張が可能

DDNとエンドユーザーによる今後のチャレンジ

  • I/O ワークロード監視システム構築
  • WOS 分析データ共有配信システム構築

 

東北メディカル・メガバンク機構

木下 賢吾 博士
「ゲノム配列の違いを検出することで、一人ひとりに合った医療の提供を目指す」

東北大学・情報科学研究科・
応用情報科学専攻・
生命情報システム科学分野
(兼任)東北メディカル・メガバンク
機構・ゲノム解析部門
教授 木下 賢吾 博士(理学)
長﨑 正朗 博士
「欠けている健常時のデータを整備し、国の財産として未来の医療を築いていく」

東北大学
東北メディカル・メガバンク機構
ゲノム解析部門
バイオメディカル情報解析分野
教授 長﨑 正朗 博士(理学)

 

導入システム

・4つのサブシステムユニットで提供されるExaScaler と16 台の SFA12K-40 SFX(+ SFA7700 メタデータ用)
・データ共有用のオプションシステムとしてWOSを導入
・総記憶容量12PB
・遺伝子研究分野における単一のLustreファイルシステムとしては日本最大のストレージ容量
・DDNの過去最大の Lustre カスタムインテグレーション

SFAおよびEXAScalerについて

数多くの賞を獲得し、その優位性が実証されている DDN の革新的な Storage Fusion Architecture (SFA) は、最適化された RAID エンジンと組み合わされた最先端のプロセッサ技術、バス、メモリー、そして高度なデータ管理アルゴリズムを活用しています。
SFA12K 製品ファミリーは最大限のシステム性能を実現し、ストレージ への投資コストを削減する大規模な I/O インフラストラクチャとマルチメディアディスクドライブを採用することによって、コンピュータ関連投資から最大限の性能を引き出すことができるように設計されています。
SFA12K製品ファミリーは、増加し続ける膨大なデータの管理を簡素化することを目的とした専用製品であり、ユーザーの環境を従来よりもインテリジェントに、効率的に、なおかつ高いコスト効率で構築し、拡張していくことを可能にします。
EXAScaler は上記SFA 製品ファミリーに最適化されたLustre ファイルアプライアンスシステムで、小さな計算タスクから、何万ものコンピューティング・コアを並列で走らせる巨大な演算要求に至るまで、顧客の要求に応える最高の並列アクセス性能を提供します。


(本事例の取材は2014/9/18に行われました。)