HPC/AIの可能性を最大化する高速・大容量ストレージ > メディア > Hadoop 対応 エンタープライズ・ストレージ
技術資料
2017/03/24

Hadoop 対応 エンタープライズ・ストレージ

メディア

 

[ Hadoop ストレージの統合コストと複雑さを削減 ]

Hadoop が、接続したらすぐ使えるエコシステムでないことは明らかです。 ビジネスにかかわる重要な洞察を得るために、データがあらゆるステージで氾濫している中で、一番の課題は、ビッグデータ戦略を成功させうる、使用が簡単でコスト効率のよいストレージレイヤーを導入しながら、データをどのように保管するかということでしょう。

DDNはHadoop と現代のデータセンターのための唯一のオールインワン・ストレージアーキテクチャです



DDN のソリューションはコスト効率よく拡張できるよう設計されており、100TB から数百TB、数百PB までサポートします。 DDN のエンドツーエンドの統合ストレージソリューションは、 性能 (フラッシュ、 HDD)、
アクティブ・アーカイブ、 ディープ・アーカイブ、クラウド、 ディザスタ・リカバリまでカバーし、業界最高の価格と性能を提供します。 堅牢で機能が豊富なエンタープライズレベルのストレージが、一番貴重な資産であるデータを保護します。

ソリューションのメリット

  • 高性能 Hadoop クラスターに合わせた設計
  • POSIX と HDFS プロトコルを通じた統合ネームスペース

  • DirectProtect によりサイレント・データ・コラプションを自動的に検知、修正

  • 高性能 Hadoop ストレージソリューションを使用したソースデータの重複排除を回避

  • データ・ローカリティを回避しVMWare とそのコンテナーでの解析を実現

  • 右記をサポート: HDFS, YARN, MapReduce, Pig, Hive/Hiveserver2/HBase, Zookeeper, Flume, Spark, Sqoop

  • 単一ファイルシステムで、Hadoop クラスターを分離

  • シングルネームスペーで、SSDHDD、オブジェクトストレージ、テープ、クラウドをシームレスに階層管理

  • マルチサイトでの解析に合わせた設計

  • 既存のHadoop アプリケーションは変更不要

  • SAS、ニアラインSASSSD等の複数のストレージタイプで QoSをシームレスに管理

  • フラッシュ、ディスク、テープにまたがるポリシーベースでの自動ストレージ・ティアリングでストレージコストを最大90%削減

  • 地理的に離れた場所でもSync/Async レプリケーションを提供

  • マルチプロトコルをサポート(ネイティブアクセス可能): NFS, SMB, OpenStack Swift, S3

  • 幅広い Hadoop ディストリビューションをサポート

  • ネイティブな暗号化と安全な消去が可能

 

IN-PLACE 解析

なぜデータは最初に取り込まれた際に移動されなければならないのでしょうか? データがデータストレージレイヤーに到達し次第、問い合わせを行ってはどうでしょうか? DDN のIN-PLACE 解析は、データがストレージクラスターに大量に流れこむ中でも、まさしくそれを実現します。

 


DDN使用時のデータパイプライン イメージ



ポリシーベースの管理

DDN のソリューションはテープも含めた複数のストレージ階層を活用し、データ管理コストを大幅に下げることで、 情報ライフサイクル管理を推進します。強力で、ポリシーベースの自動化と階層化ストレージ管理により、 またパフォーマンス、場所、コストに応じてグループ分けされたデバイス(フラッシュ、SSD、ディスク、テープ)によって、企業は最適化された階層ストレージプールを持つことができます。DDN のソリューションはストレージ設置面積も削減することができ、必要なデータのみに圧縮することでリソースを最適化することができます。



ユニファイド・アクセス

オブジェクトベースのファイルインターフェース (SMB/NFS/POSIX) にアクセスできることと、ファイルベースのオブジェクトインターフェース (REST) の両方にアクセスできることは、ファイルベースで設計された旧来のアプリケーションをオブジェクトベースに統合するのに役立ちます。これにより、ファイルを処理するために設計されたアプリケーションを用いてオブジェクトデータにアクセスできます。また、ファイルデータをオブジェクトとして使用できるようになります。一つのネームスペースでファイルとオブジェクトへのマルチプロトコルアクセス (共通のユーザーID 管理機能)ができることで、複数のアクセスオプションがあり、異なるタイプのデータをサポートし、ホストすることができます。さらに、多様な用途やソリューション設計に対して最適化され、効率を上げ、コストも削減できます。

DDN Hadoop ストレージ・ソリューション

Hadoopの使用に最適化されたストレージである、GRIDScaler ファイルシステムはエンタープライズレベルのデータ保護、豊富な機能、また並列ファイルシステムの性能に関して、柔軟な選択肢を提供します。 数十、数百PBまでスケールアウトでき、同時に混在型I/Oでも高い性能を維持できる GRIDScaler は、完璧なデータ保護、データ安全性、データ管理オプションも提供することができる、強力なファイルストレージソリューションとなっています。

Hadoop に最適なDDNソリューション