矢沢陽介

矢沢陽介

データの民主化成功のカギを握る「セキュアとデモクラティックの両立」を読み解く

社内のデータを活用し、ビジネスアイディアを実現させ、イノベーションの創出をするために本当に必要なことは何でしょうか。データのセキュリティを担保しつつ、全社員に開放し、データが最大限に活用される基盤を実現するための勘所について、三菱総研DCS テクノロジー事業本部 データテクノロジー部長 矢沢陽介氏が解説します。

Updated by Yosuke Yazawa on August, 4, 2023, 5:00 am JST

データの民主化で、全社員がイノベーションを起こせるように

そういった状況に対して我々三菱総研グループが提唱するのが、データの民主化と言う概念です。ここで提唱しているデータの民主化というのは、一部のデータ分析者だけではなく全社員にデータを開放し、全社員でビジネスアイディアの実現やイノベーションの創出を目指すことです。

まず真ん中の集合・統合されたデータストレージに、各ソースや外部から発生するデータを集めておきます。IT担当者の役割は、このデータストレージに、継続的にデータが溜まるようにメンテナンスすることです。つまり全ての必要なデータが予め集まっているという状況を作りましょうということです。そしてそのデータは、各事業現場が、自分たちで好きな分析のツールを使って見られるようにします。そして気づきを得て、リアリティのある改善策を立案できるというわけです。こういった状況を、DXの文脈における企業のデータの民主化と我々は定義をしています。

ポイントは「データへのアクセスを開放し、データの主権を取り戻すこと」

これからデータの民主化を検討しようという際に押さえておきたいポイントは「データへのアクセスを開放し、データの主権を取り戻すこと」です。

まず一丁目一番地はオンプレミスやクラウドなど各所に点在してしまっているデータを関連付けて活用できるように、一カ所に集めるということです。物理的に実際に集約してしまうというやり方もありますし、データ仮想化という技術を使って論理的に集約し、物理的にバラバラなものをまるで一つのストレージのようにアクセスするという方法もあります。 ただし後者の論理集約型の手法を用いる場合はトランザクションの整合性を意識する必要がありますし、透過的にシステムにアクセスするために、性能による影響も考慮する必要があります。 コスト的に成り立つのであれば、最初から物理的に集約してしまった方がシステムとしてはシンプルです。

続いて、各ユーザーが利用するツールに対して寛容性を持つということです。データを民主化して開放する以上、ツールに対しての自由度は最大限に高める必要があるでしょう。今はクラウドの分析ツールが主流なので、各種外部クラウドからのアクセスを確保し、外のクラウドに対して開かれたものにする必要があります。ただ、データ基盤をクラウドの上に置く場合、参照されるデータは基本的に外に流れていきますので、アウトバウンド課金に注意をしてクラウドを選ぶ必要があります。

データを集めたけれど溜めるだけで使われないというのが、こういった取り組みをした時のバットケースです。何のデータなのかを知るデータカタログ、またデータがどこから来ていつ変更されたものが分かるデータトレーサビリティを、ユーザー自身が見えるようにして使えるかどうか判断ができるようにしておくことがポイントです。

デモクラティックとセキュアの両立は最重要ポイントです。つまりデータガバナンスの維持ですが、いかにアクセスコントロールを効かせて、トレーサビリティ、つまり誰が触ったかということを記録しておくかが大事です。ポイントは、トータルでのセキュリティマネジメント。さまざまな角度からアクセスを許容するということは、境界防御の考え方が通用しないということです。基本的にはゼロトラストの考え方を採用し、環境ではなくユーザーごとにデータへのアクセス権をコントロールすることをお勧めします。しかしながら実はこれは非常に複雑な構成になるので、知見のあるコンサルサービスを活用することも視野に入れて検討し、データの民主化を実現していただきたいと思います。

データ活用とセキュリティマネジメントについて詳しく知りたい

※この記事は、2023年5月31日に実施したオンラインイベント「データ民主化の方法論(Democratic Data Day Spring2023)」 における矢沢氏の講演の一部を記事としてまとめたものです。
(Modern Times編集部)