データの重み付けを考えること
多くの企業は、データの活用に取り組み、データがビジネスを動かすこともある。だからこそ、そのデータの重み、質量について考える必要がある。企業が蓄えているデータの「質量」とは、そのデータがビジネスに与える重要度を意味する。大量にあることで重要度があるデータもあるし、量は少なくても不可欠なデータもある。そして、そうした個々のデータに対する重み付けは、企業によってまったく異なるはずだ。自らの会社がどのようなデータを重要と考えるかは、その会社の経営方針に依存する。
次に、データを活用するITシステムに目を向ける。ここでデータが持つ質量の考え方が効いてくる。システムは、その企業で最も質量があるデータに紐付けることで、有効性が高まる。個々のデータの質量は小さくても、データが積み重なることで大きな質量になるデータがある。機械学習などによる分析をビジネスに活用するならば、こうした膨大なデータを確実に蓄積するストレージと、システムを紐付けることが必要になる。データ量として少なくても企業の経営を左右するような重要なデータは、そうした情報を格納することに適したストレージとシステムを紐付け て運用することになる。データの質量を意識することで、どのようなITシステムが求められるかが、明確に整理できるだろう。
一方でデータはいつどこで必要になるかわからないことも事実であり、まずは集めることが第一義になりがちだ。どんどん集めていくとデータの質量がデータを引き寄せ、使うか使わないかわからないままのデータが大量に集まる。クラウドの活用の1つの形が、データグラビティによってデータがとにかく集積している状況だと言えるだろう。AWSを使い始めたら、AWSにデータが集まっていく。AzureでもGCPでも同様だ。データグラビティによって、データを活用するシステムの適切さと関係なく、1カ所にデータが集まり膨大な塊になっていく。
データの重み付けを意識しないとデータはただ溜まっていくものとなり、それを利活用することができない。
データグラビティの弊害
重要なデータには、それぞれの活用に適したシステムがある。パブリッククラウドを使っていたとしても、その考え方は変わらない。例えば、パブリッククラウドAは画像認識のAI機能が優れていることから、画像の解析アプリケーションで活用してきたとする。それでは同じ企業が、次に生産機器が吐き出すIoTデータからトラブルの予兆分析をしたいと考えたとき、そのパブリッククラウドAの機能は最適なものだろうか。本来であれば、適材適所で最も効果が出るシステムやサービスを使いたい。この場合パブリッククラウドBが適切だとしても、データグラビティによって1つのクラウドサービスにデータが集められてしまっていると、最適なシステムやサービス の利用すら妨げられてしまう。データグラビティの弊害はこうしたところに顔を出す。
それならば、データの質量に従って、それぞれ別々のクラウドやシステムで運用すればいいではないかという考え方も頭をもたげる。局所的には個別最適の考え方は効率的だ。しかし、映像などの画像データとIoTデータをぶつけて分析したいときには、どうしたらいいか。画像データは膨大なデータ量をもち、簡単には移動することができない。多くのパブリッククラウドは、その中に蓄積した膨大なデータを外部に引き出すときに、しっかりとコストがかかる。画像とIoTデータを掛け合わせる分析をしたいとき、最適な分析機能がIoTデータを蓄積しているクラウドや、さらに別のシステムにあったとき、膨大な画像データを引き出して使うことは現実問題として躊躇する。これもデータグラビティの弊害だ。