薄井研二

薄井研二

(写真:JLco Julia Amaral / shutterstock

無駄なデータ収集にコストをかけないために。「使えるデータ」を集めるプラクティス

データの民主化のためには、多くの人が効率よく安全にデータ分析できるように環境を整えていかなくてはなりません。ここではとくにロジスティクスについて目を向けてみましょう。

Updated by Kenji Usui on August, 25, 2023, 5:00 am JST

データを活用できている企業は、データの質にこだわる

さまざまな調査の結果、データを活用するにあたって分析者の多くがほとんどの労働時間をデータセットの構築や維持に費やしていることがわかっています。ロジスティクスと一言にいっても、データ分析においてどこからどこまでをロジスティクスと呼ぶのかは曖昧です。しかし明確に分析者の手間がかかっているポイントがあります。それは、使えるような形になったデータを構築し、維持する作業です。

ただ何も考えずに集めたデータを分析に使うことはできません。データは、分析に必要な情報を集めて、保存し、整理されて初めて使うことができるのです。ごく当たり前のことを言っているように聞こえるかもしれませんが、実際のところ、分析を意図した体制が整っていない企業のデータは、使える状態にないことがよくあります。データの抜けや漏れがあったり、更新されていないデータがあったり、いつどこで誰が変更したのかわからないような状態になっていたり……。質の低いデータから適切な意思決定を行うことは困難です。

データを活用できている企業は、質の高いデータを準備することに非常に多くの労力を割いています。データマネジメントを実施し、システムを整備することにコストをかけます。ビジネスの変化にともないデータ量は増え続け、構造はより複雑化しているからです。そしてそれほどまでに、データの質にこだわることには意味があります。