HPC/AIの可能性を最大化する高速・大容量ストレージ > メディア > AIインフラストラクチャ:ストレージが重要な理由
技術資料
2018/03/30

AIインフラストラクチャ:ストレージが重要な理由

メディア

この記事は、DDN.comに掲載の "AI Infrastructure: Why Storage Matters" の内容の日本語編集版となります。


人工知能(AI)とディープラーニングの力を発揮するには、課題にGPUを投入するよりもずっと多くの為すべきことがあります。適切なマシンラーニング環境を構築するには、将来の要件がミッションを遅延させず、データサイエンスの段階から実行可能なビジネス成果を引き出す段階に進むことを確実にできるような、先見性と計画を必要とします。

ストレージはデータを保持するだけのものではない

AIプロジェクトに正しいストレージプラットフォームを適用することは、ビジネス価値を真に最大限に引き出すために不可欠です。究極の価値は、アプリケーション、コンピューティング、コンテナ、ネットワーク、ストレージなどのインフラストラクチャ全体が調和して、利用可能なデータをいかなるスケールでも活用できる場合にのみ達成されます。
主な制限要因はI/Oボトルネックです。従来のストレージソリューションは、AIデータライフサイクルの多くの段階で見られる、低レイテンシで、高度に並列の、混合ワークロードの要件に対応するようには設計されていませんでした。早期の開発や限られたトレーニングデータセットでは、これらのボトルネックは迅すぐには明らかにならないかもしれませんが、真にビジネスインパクトが引き出せるのは、これらのプロジェクトを膨大な量のデータに適用できる時です。
ユーザは、ローカルまたは一般的な共有ストレージのような短期的なソリューションは、拡張に関して大きな制限となることを理解しています。彼らはもはや管理することができないか、またはI/O性能の欠如のためにGPUベースのシステムが基本的にアイドル状態にあり、プロジェクトが時間と資本の両方で高価な再構築を必要とするという点に到達します。

それでは、急速な拡張を可能にし、価値の最大化を保証するため、ストレージに関して考慮すべき事項は何でしょうか?

ストレージに関して考慮すべき事項

・AIプラットフォームを最大限稼働させる:
多くのプロジェクトは、最初にGPUベースのコンピューティングシステムのパワーを有効に扱うことを考えますが、ストレージ側は無視しています。正しいストレージプラットフォームは、ストレージが応答するのを待っているアプリケーションの影響を受けて、GPUサイクルがアイドル状態のままでないようにします。
・将来のニーズに対応するための機能を取り入れる:
データを中央のリポジトリに集めることは、ディープラーニングモデルを運用準備が整った段階で実行できるようにするための重要な要素となります。このリポジトリにデータを収集するには、さまざまなソースからの情報をすばやくインジェストする能力が必要です。ストレージシステムへのインジェストとは、容量を拡張する能力に加え、Write性能と、大規模の分散したソースからの膨大な並列ストリームに対処することを意味します。
・データに柔軟かつ迅速にアクセス:
AI対応のデータセンターが初期のプロトタイピングとテストの段階から運用と拡張の段階に移行する中、柔軟なデータプラットフォームは、次のいかなる項目においても拡張できる手段を提供する必要があります―パフォーマンス、容量、インジェスト機能、フラッシュ/HDD比率、データサイエンティストへの応答性。このような柔軟性があれば、拡張段階でのデータの複製や複雑さを排除し、中断なしにネームスペースを拡張できます。

・小さくスタートし、シンプルかつ経済的に拡張する:
スケーラビリティは、パフォーマンスだけでなく、管理性と経済性の面でも測定可能です。成功するAIプログラムは、数TB(テラバイト)のデータで開始するように設計できますが、環境を再構築することなく、数PB(ペタバイト)まで簡単に増加できる必要があります。経済的に拡張する1つの方法は、ワークロードに応じてストレージメディアの使用を最適化することです。 AIプラットフォーム設計者は、AI用に特別に設計された、緊密に統合されたスケールアウトハイブリッドアーキテクチャを検討する必要があります。
・ストレージだけでなく、環境全体を理解しているベンダーと提携する:
ストレージがデータをどれだけ速く送り出すことができるかではなく、AIアプリケーションにパフォーマンスを提供することが重要です。選択されたストレージプラットフォームのベンダーは、インテグレーションとサポートサービスがストレージだけでなく環境全体に影響し、結果のより迅速な提供につながるということを認識していなければなりません。

出典:DDN.com "AI Infrastructure: Why Storage Matters" March 20, 2018
筆者:George Vacek, Global Director Life Sciences


リンク:
マシンラーニング 特集ページ(別ウィンドウ)