HPC/AIの可能性を最大化する高速・大容量ストレージ > メディア > AI導入はなぜ9割が失敗してしまうのか? AIをビジネスに生かすためのデータ活用戦略
ブログ
2021/10/06

AI導入はなぜ9割が失敗してしまうのか? AIをビジネスに生かすためのデータ活用戦略

メディア

(Photo/Getty Images) ※当記事は、Web「ビジネス+IT」に掲載されたものです。

AI導入はなぜ9割が失敗してしまうのか? AIをビジネスに生かすためのデータ活用戦略


ビジネスにおいてさまざまなデータを取り扱う上で、多様なAI処理に対応したストレージ導入がデータセンターの課題として急浮上している。それに伴いストレージの役割にもパラダイムシフトが起きており、これまでは入力データや生成データをためる「保管場所(記憶装置)」としての存在だったが、「データ活用基盤」としての価値に重きが置かれはじめている。今、企業が取り組むべきストレージ戦略とは。

スマホアプリの裏側でスパコンが動く時代

複雑な演算処理で高速にデータ処理・計算を実行するHPC(High-Performance Computing)、通称「スパコン」。その活用範囲は、かつては専門領域の研究者・開発者のみに限定されていたが、今では一般の生活者にとっても身近な存在となっている。

たとえば、私たちがスマートフォンにインストールし日常的に利用している各種アプリ、具体的にはファイナンス、映像加工・認識、医療、自動応答・翻訳、天気予報、教育などのアプリの裏側では、実はHPCやAIスパコンの計算プラットフォームが動いている。私たちは、アプリを通じてその演算結果を受け取っているのである。

このように、個人・組織が日常的に利用するアプリケーションを強力なGPUを採用した大規模計算システム・大規模データ基盤が裏で支えるのが、これからの時代だ。

そして、この変化に合わせてストレージ戦略も従来型のシステムのストレージから、大規模なスーパーコンピュータのI/Oサブシステムの技術を活かした形へ変貌を遂げようとしている。競争力の源泉となる近未来のデータセンターを実現するために、従来システムのストレージをどのように移行させ、どのようなデータ活用基盤を構築すべきなのだろうか。ここからは、AI・ディープラーニングにおけるストレージ導入の課題とともにそのポイントを見ていこう。

データセンターの課題は、多様なAI処理に対応したストレージの導入

データダイレクト・ネットワークス・ジャパン(DDNジャパン)の塩入ヶ谷寛氏は、昨今のHPC・スパコンの特徴を「今、欲しい情報がデータ化されていること」だと、次のように説明する。

「たとえば、天気予報はもともと気象庁の衛星画像が根拠となっていました。しかし最近は、衛星情報にSNS上のリアルタイム情報を組み合わせ、最新の天気を把握・予測しています。さらに、SNS上のデータだけでは『どの地点で、どの程度の雨模様か』といった定量化が難しいため、自動車のGPS情報・センサー情報(降雨時のワイパーの動きなど)も組み合わせることがあります」(塩入ヶ谷氏)

他にもファイナンス、映像加工・認識、医療、自動応答・翻訳、教育などのアプリの裏で、HPCやAIスパコンの計算プラットフォームが稼働しているという。「こうしてさまざまなデータを扱うようになったため、ストレージ基盤のトレンドにも変化が生じ、多様なAI処理に対応したストレージ導入がデータセンターの課題として急浮上しているのです」(塩入ヶ谷氏)



AI・ディープラーニングにおけるストレージ導入の課題 

実際に塩入ヶ谷氏のもとには、AI・ディープラーニングに関するストレージ導入の悩み、相談が多数寄せられるという。

その1つが、データの種類が多いことだ。データ生成元となるデバイスは、車、スマートフォン、家電、工場、カメラ、マイク、ウエアラブル端末……等々、じつに多様だ。さらに、そこから生成されるデータもテキスト、音声、画像、動画など多種多様で、AI解析の要件を満たすファイルサイズ、ファイル数も異なる。
さらに、データ整理(収集・加工・入出力など)や保存場所の選定(オンプレ/クラウド)にも時間を要する。
「プロジェクト全体の50~80%に当たる時間が、データ整理などの前処理の作業に使われるともいわれており、こうした時間をいかに短縮するかが非常に重要なファクターになっています」(塩入ヶ谷氏)

その他にも、ストレージ導入の課題には、プライバシー(収集データからの個人情報削除)、セキュリティ(侵入検知やウイルス対策)、インフラ導入に要する時間、インフラ導入後の問題などもあると塩入ヶ谷氏は指摘する。



AI導入に不可欠なストレージ選択のポイント


デロイトの2020年の調査によれば、企業のAI導入はビジネスの成功を占う重要施策であり大きな可能性も秘めているが、9割方が失敗に終わっているという。その原因としては「システムの開発・導入に時間がかかりすぎる」「AIを統合して最適化するのが難しすぎる」「プロトタイプから生産への拡張ができない」「AIを導入するための適切なテクノロジーパートナーがいない」などが挙げられている。ストレージ選定において、こうしたAI導入の複雑さが大きく影響しているようだ。

塩入ヶ谷氏は、こうした課題に対応するためにも、ストレージ選択がカギだと強調する。
「画像、テキスト、センサーなどのデータごとにストレージを分けて導入しているケースが散見されますが、それではデータをうまく組み合わせて活用できません。AIの研究者や開発者がデータを移動しなくて済むように、データはできるだけ1つに集約することが重要です。また、数年前まではCPUやGPUノードが重要視され『ストレージは保存できればいい』『ストレージの予算は後回し』といった風潮がありましたが、最近は『ストレージありき』で計算機やネットワークを検討する企業が増えています」(塩入ヶ谷氏)

そして塩入ヶ谷氏は、ストレージ選択のポイントとして、次の3点を挙げる。

  • AIインフラの導入を加速し、運用を簡素化する。
  • より速く、より優れたパフォーマンスをオールスケールで実現する。
  • グローバルマーケットでの豊富な経験と顧客データベースを持つ、マーケットリーダーを選択する。


AIインフラを加速し、運用を簡素化する「DDN A³Iソリューション」

こうしたすべてのユースケースに最適化されたAIプラットフォームが、DDNの「A³Iソリューション」だ。
もともとAI対応データセンター向けに設計されている A³I ソリューションは、AI・ディープラーニングデータのインジェスト(転送)と準備・トレーニング・検証・推論などのアクティビティを同時に処理するために完全に最適化されており、プラットフォーム導入・管理が容易なのが特長だ。
さらに、パフォーマンスと容量のスケーラビリティが高く、すべてのAI要件に対応する高効率で復元力のあるソリューションとなっている。

「DDN A³I のコンセプトは『すべてのユースケースに最適化』することです。完全に統合されたアプライアンスでAIインフラ導入を加速し、運用を簡素化できます。具体的には、数カ月ではなく数週間での導入を実現できます。また、共有並列アーキテクチャーにより優れたパフォーマンスをオールスケールで実現できるため、AIトレーニングを130倍高速化します。さらにグローバルマーケットでの豊富な経験と顧客ベースを持つマーケットリーダーを選択いただくことで、信頼できるサプライヤーとの連携でリスクを回避できます」(塩入ヶ谷氏)

また、「DDN EXA5(EXAScaler)」と呼ばれるLustreをベースとした並列ファイルシステムのソリューションは、クラウドの中でファイルシステムとして利用することも可能だ。クラウド利用においてストレージをより速くしたい場合は、マーケットプレイスからEXAScalerを選ぶだけで同ソリューションを使うことができる。

「NFS(Network File System)との比較では、他社NFSのパフォーマンスが33GB/sであったのに対し、DDNのEXAScalerではその3倍に当たる108GB/sを記録しました。さらに、他社NFSが33GB/sの速度を出すのにCPU使用率99%だったのに対し、DDN A³I を使えばCPU使用率を大幅に減らせることも確認されています」(塩入ヶ谷氏)

その高いパフォーマンスが評価されて、国内外の自動運転の研究開発基盤にもDDNソリューションが採用されている。さらに、同社のストレージソリューションはスモールスタート・ラージスケールアウトも可能だ。AIを活用したあらゆるプラットフォームのストレージとして、ぜひ検討していただきたい。



A³Iソリューション
https://ddn.co.jp/products/ai_storage/a3i.html


※当記事は、Web「ビジネス+IT」に掲載されたものです。