データセットが大きくなればなるほど、マシンラーニングの潜在的価値が高まります。しかし皮肉なことに、データセットが増加するにつれて、プロジェクトがコストや拡張の複雑さに関連する問題に遭遇する可能性も増えます。
マシンラーニング・プログラムがよく躓くのは、成功するための計画を立てていない時です。プログラムのプロトタイプとして、ミッドレンジのエンタープライズストレージを使用したり、ドライブをサーバーに追加したりするやり方は、より高速な稼働環境に移行する必要が出てきた時、持続不可能なアプローチであったことに気づくでしょう。
DDNの顧客は、結果を得るまでの時間を短縮し、競争力、収益性、顧客サービス、ビジネスインテリジェンス、研究効果を向上させるために、マシンラーニング技術を活用しています。
DDNシステムのパフォーマンスと柔軟なサイジングは、大規模なマシンラーニング・プログラムに特に適しています。CPU、GPU、および単純な線形回帰から深いニューラルネットまでの混合マルチアルゴリズム環境でデータを効率的に処理するために必要な混合I/O機能だけでなく、コア数の多いシステムに大量のトレーニングセットを送ることができます。
1台のラックで、数百TBから10PBまで拡張可能なストレージアプライアンスを使用することで、DDNのマシンラーニングユーザーは、テストベッドから実稼働システムまで、単一のプラットフォームで拡張することができます。
お客様がマシンラーニング・アプリケーションに対してDDNストレージソリューションをどのように活用しているかの例は以下の通りです。
・行政と学界の共同研究による観光のためのスマートシティ計画
・米国の大手銀行での電信送金やクレジットカード取引の不正検知
・フォーチュン100 SaaSプロバイダーでのデジタルアシスタント/自然言語処理
・自動運転車のためのルート最適化
・準リアルタイムのアフィニティ・マーケティングと、オンライン決済の不正検知
マシンラーニング・プロジェクトを開始される前に是非DDNにご相談下さい。
包括的かつシームレスなエンドツーエンドのストレージテクノロジのポートフォリオは、最高レベルのパフォーマンスとスケーラビリティを必要とするマシンラーニング環境をサポートする非常に柔軟なデータライフサイクル管理ツールを提供します。
■パフォーマンス/規模を求めてDDNをご選択くださるお客様が多いです
■ほとんどのマシンラーニング・プロジェクトで、EXAScaler® (Lustre*)かGRIDScaler® (Spectrum Scale™ (旧GPFS))の並列ファイルシステム・ソリューションが使用されています
■さらなるパフォーマンスが必要な場合はDDN IME フラッシュ・ネイティブ・キャッシュ・ソリューションもご選択いただけます
■数年間等の長期間のマシンラーニング・プロジェクトの場合は元々の容量の50倍になっている例もあるため、初期段階での設計が極めて重要になります
<Q&A>
Q. クラウドかオンプレミスかを選択するにはどうすれば良いですか?
A. プロジェクトによりますが、ストレージ容量が大きすぎない場合は、現段階ではオンプレミスを選択したほうが良いでしょう。あとは、レイテンシーをどのくらい許容できるか、つまりリアルタイム処理が必要かどうかにもよるでしょう。