日本オラクル特集記事

2017年 ビッグデータ10の予測 ~ IoTから深層学習まで

スマートフォンや自動車、機器センサーなど、今や身の回りでは様々なモノから日々多種大量のデータが発生しています。同時にそれらデータからの価値創出を目的に、ビッグデータはあらゆる業界で語られるようになり、IT担当者、ビジネスリーダーからそれぞれの顧客まで、あらゆる人が何らかのかたちでビッグデータと関わりを持つようになっています。

ビッグデータとクラウドという2つのテクノロジーによって、急激な変革が進んでいます。私たちが2017年にどのようなことが起こると予想し、今後をどのように見据えているのかをご紹介します。新たなトレンドやテクノロジーにしっかりと対応し、こうした重要な動きをうまく活かしていける態勢を整えておくべきです。

1. ユビキタスな機械学習時代の到来

今や、機械学習はデータサイエンティストたちだけのものではなくなりました。大量のデータに機械学習の技術を応用できるようになったことで、機械学習の重要性は大幅に高まり、幅広く導入されるようになっています。今後、ビジネスアナリスト向けとエンドユーザー向けの両方のツールで機械学習機能の利用が大幅に高まり、企業のみならず政府や自治体にも事業のあり方の変革がより一層求められていくでしょう。保険や家庭用エネルギーから医療、駐車場の料金メーターまで、あらゆるものに機械学習が取り入れられるようになり、普段の生活に変化をもたらすことにもなるでしょう。

2. データを動かせない場合には、クラウドを自社のデータセンターに持ち込む

すべてのデータを外部データセンターのクラウドへ移行できるわけではありません。個人情報や各種法規制の問題、データ主権への懸念などから、データ自体を動かせないケースはよくあります。データが余りに大量で、データの保管場所をクラウド移すことによって得られるメリットよりもコストの方が大きい場合もあります。こうした問題はクラウドを自社のデータセンターに持ってくることで解決できます。(例:パブリッククラウドをお客様のデータセンターに配置
それに伴い、今後ますます、複数カ所に保管されたデータをどう扱うかという、クラウド戦略の構築が必要になっていくでしょう。

3. 分析にとどまらず、ビジネスを遂行する目的でビッグデータを導入

ビッグデータ技術の初期の活用例では、主にIT費用の削減や分析ソリューションに重点が置かれていました。現在ではビッグデータに基づき、ビジネスにフォーカスした業界特有のニーズに対応できる新世代アプリケーションが登場するようになっています。それらアプリケーションの活用が進み、より一層本来のビジネス目的へのアプローチが短縮、容易になるでしょう。

4. Internet of Things(IoT)とビジネスアプリケーションの統合

Internet of Things(IoT)の対象は、単なる「モノ」ではなくなっています。例えば患者に対してより高度な医療を提供することから、モバイルアプリを介して顧客体験を強化することまで、デバイスを通じてやり取りするデータを監視し、得られたデータに基づく行動を取ることが、あらゆる場面で求められています。企業はIoTアプリケーションを簡単に開発できるようにして、こうしたデータを素早くビジネスアプリケーションに取り込まなければなりません。
今後企業は、新たなデータソースとリアルタイムの分析・行動に関する情報とを融合することによって、臨機応変に適応や学習が可能な新しいタイプのクラウド・アプリケーションを開発していくことになるでしょう。

5. データの仮想化によって「ダークデータ」に光

エンタープライズにはHadoop、Spark、NoSQLといったプラットフォームが存在する一方、こうしたプラットフォーム上でのデータサイロが急増しています。そのため、アクセスしづらい(しかも見つけにくい)が故に、貴重なデータが活用されないままに眠っている可能性があります。アクセスを一元化するために、全てのデータを単一の保管場所に移動させるということが実際には不可能であり、別のアプローチが必要なことに企業は気が付き始めています。
データを移動することなくリアルタイムのビッグデータ分析の実現が可能な手段として、新たにデータの仮想化が注目されるようになるでしょう。

6. 企業がデータの「ハイウェイ」を利用

Apache Kafkaはすでに普及が進んでおり、2017年には拡大のピークに達すると予想されます。Kafkaはビッグデータのイベントトピックの発行、Hadoopへのデータの取り込み、エンタープライズのデータ利用者への配信をシームレスに行え、すでに十分に実証された従来のバス型アーキテクチャ形式でありながら、非常に大量のデータセットや多様なデータ構造にも導入できる点が特徴です。このため、データを自社のデータレイクに取り込み、データ利用者が知るべきあらゆるイベントへの柔軟なアクセスを実現するためには、理想的なアーキテクチャと言えます。

7. プリパッケージの包括的クラウドデータシステムがブームに

企業がビッグデータの検証やイノベーションを推進する上で、データラボの重要性が高まっています。オンプレミスでもクラウドでも、データラボを始めから構築することは簡単ではありません。分析やデータサイエンス、データラングリング、データインテグレーションといった包括的なクラウドサービスをあらかじめパッケージすることによって、自前でソリューションを構築する煩雑が省かれます。

8. クラウド型のオブジェクト型データストアがHadoop HDFSの実際的な代替に

オブジェクトデータストアは可用性、ドメインやデータセンターの全てを通じたレプリケーション、災害対策、バックアップ等、望ましい性質を多数備えています。大量データにとって最も低コストでシンプルな保管場所であり、そうした場所をSparkのようなフレームワークで直接アクセスすることができます。今後ますますビッグデータ・コンピューティングの技術との統合が進むにつれて、オブジェクトデータストアがビッグ・データの保管場所となり、多くのケースでHDFSに対して実際的な代替となっていくでしょう。

9. 次世代のコンピューティングアーキテクチャが可能にするクラウドスケールのディープラーニング

仮想化レイヤーの排除、GPUやNVMeなどの高速化テクノロジー、ストレージやコンピューティングの最適配置、大容量でノンブロッキングのネットワーキング、これらはいずれも目新しいものではありません。しかしこうしたものすべてを融合するとどうでしょうか。これらが一体化することによってコンピューティングやI/O、ネットワーク性能が格段に向上させたクラウドアーキテクチャが可能になります。
そしてその結果として、既存のビジネスアプリケーションやプロセスと簡単に統合できるディープラーニングを大規模な範囲で実現できます。

10. もはやオプションではないHadoopのセキュリティ

Hadoopの導入や活用はもはや単に実験的なものではなくなり、徐々に事業運営に欠かせないものとして捉えられています。そうなるとHadoopのセキュリティは“あればいい”という段階ではなくなります。
今後、さらに強化されたマルチレベルのセキュリティソリューションを企業のビッグデータプロジェクトに実装できるようになるでしょう。

本記事はOracle.comに掲載されている以下の記事を抄訳しています:
http://www.oracle.com/us/technologies/big-data/big-data-predictions-2017-3436868.pdf