データハブを用いることで、アプリケーションやプロセス、センサーといったデータ生成元に対して、データ利用者であるアプリケーションやプロセスなどが個別に情報共有する必要がなくなります。データハブにインタフェースを一元化することで、効率的なデータ活用が可能になるのです。
一方のネットワークハブは、狭義ではネットワークシステムを構築する際に用いるスター型のネットワークの集線装置を指します。LANで用いられるEthernetのハブが代表的なものです。
マルチクラウドを支えるクラウド時代のデータハブ
データハブは、本質的にはデータ生成元とデータ利用者の間のインタフェースを一元化する論理的な構造を指しています。利用者側のアプリケーションやプロセスから見ると、データハブに接続するだけで多彩な生成元のデータを一元的に活用できるのです。データ活用の観点では、データハブと似たような概念やアーキテクチャとして、データウェアハウス、データレイクがあります。このうち、データウェアハウスは構造化されたデータを蓄積するものです。また、データレイクは非構造化データを蓄積するものです。 一方でデータハブは、多様なデータ生成元のデータを取り扱うことができます。データウェアハウスやデータレイクと組み合わせてデータハブを構築すると、構造化データも非構造化データも統合して分析できる仕組みを作れます。
こうしたデータハブの構成は、クラウドの利用が進む中で活用の幅が拡大しています。企業内のシステムでアプリケーションやプロセスを仲介する役割を果たすデータハブを、クラウドも含めたシステムまで拡張する考え方です。オンプレミスのシステムにプライベートクラウドやパブリッククラウドを追加するとき、データをそれぞれのシステムに個別に蓄積して利用するのではなく、共有して利用できるデータ空間としてのデータハブに蓄積します。これにより、データ活用の自由度を高め、データ移行の制約を取り払うことに役立つのです。
複数のパブリッククラウドとプライベートクラウド、オンプレミスを適材適所で使い分けるマルチクラウドの利用が広がる中で、クラウド対応のデータハブの価値が高まりつつあります。パブリッククラウドが提供するデータストレージ領域にデータを蓄積すると、同一クラウド内でのデータ活用には効率的である一方で、他のクラウドやオンプレミスシステムなどからデータ活用する際に性能・コストなどで制約が生じます。データハブをパブリッククラウドから独立して設けることで、各クラウドやシステムから共通してアクセスできる構成を採れます。一元的に管理したデータを様々なアプリケーションやプロセスで活用できるようになるのです。
ネットワークハブとデータハブが融合する
ネットワークハブは、従来はネットワークを構成する集線装置を指していました。近年はクラウドを活用するようになり、クラウドサービスやオンプレミスのシステムの集線装置としてネットワークハブを再定義する考え方が出てきました。物理的な集線装置としてのネットワークハブから、クラウドサービスやインターネット、オンプレミスのシステムをつなぐネットワークの集約点へと意味を拡張したものです。
マルチクラウドを活用するためには、複数環境をシームレスにつなぐネットワークが必要になります。そして、そのネットワークはセキュリティおよびパフォーマンスの要件を満たすことが求められます。マルチクラウドを前提として設計されたネットワークハブを利用することで、オンプレミスのシステムやプライベートクラウド、複数のパブリッククラウドを接続し、一元的に利用できるようになります。
こうしたネットワークハブの構成は、データを一元的に蓄積するデータハブの構成と相似の関係にあります。ネットワークハブの機能とデータハブの機能を融合させたクラウドサービスを利用すれば、マルチクラウド環境でデータを活用するためのインフラが整うと考えられます。