薄井研二

薄井研二

(写真:yurakrasil / shutterstock

ドメイン知識の無い分析は、間違った意思決定を招く

データを利用するためには、分析者がドメイン(領域に関する)知識を有しているか否かが重要になる。業界や領域の知識を持たない者が分析を行なった場合、バイアスを見抜けずデータが示す内容を見誤ることがあるのだ。現役データアナリストが解説する。

Updated by Kenji Usui on February, 9, 2024, 5:00 am JST

なぜデータ分析にはドメイン知識が必要なのか?

データ分析者にドメイン知識が必要であることは昨今よく指摘されています。データ分析者が特定の業界や領域のドメイン知識を持つことは、分析の意味をより深くし、ビジネスに対する価値を高めるからです。ドメイン知識を身につけることは、データをただの数字の集まりでなく意味のある情報として扱うことにつながります。

たとえば、医療データを分析する場合は医療の基本的な概念や規制に対する理解がなければ適切な洞察を得ることは簡単ではありません。医療に関する知識がない素人のする分析のほとんどが的外れになってしまうことを、ここ数年で多くの人が実感したのではないでしょうか。

これはビジネスにおいても同様です。商品や市場の特性、法律、規制、商習慣、サプライチェーン、ビジネスモデルなど、データ分析を行うにあたって考慮すべき事項は多くあります。ドメインに関する理解という下地が不足した分析は、正しい結論が得られないどころか誤った意思決定を加速させてしまいます。

なぜこのような状況が起きるのでしょうか?
たとえば、ドメイン知識の不足は課題を理解するうえで大きな障害となります。分析の課題がどのような背景から発生し、どのような分析を行えば解決にたどり着けるのか把握するためには、その分野を理解している必要があります。

また、データは常にドメインの商習慣などの影響を受けているので、それを理解せずに分析をすると間違った解析結果が導き出されます。つまり、データ分析における課題の設計・データの処理・データの解釈というすべてのステップでドメイン知識は影響してくるのです。

商習慣バイアス、業務の理解、サービス知識。3種類のドメイン

ドメイン知識にはどのようなものがあるのでしょうか。たとえば法律や規制、ビジネスモデル、プロダクトの知識……などなど個別に挙げれば限りがありません。ですから、ここでは3つのジャンルにわけて整理します。

1つ目は業界の知識です。法律や規制、商習慣のような知識がこれにあたります。医療や金融のように法律や規制が厳しい業界であれば、非常に重要になります。そうでなくても、商習慣のような知識は課題を理解するうえでは有用です。特に意思決定者とスムーズなコミュニケーションをとるためには、背景となる業界の知識が求められます。

データ分析をしていると無意識に世界がランダムに動いていることを仮定しがちですが、実際のビジネスの現場では法律や規制、商習慣などから偏りが発生していることが普通です。そういったバイアスを知らないでいると、誤った分析をおこないがちで危険です。

2つ目は業務の知識です。これは1つ目の業界の知識と近いようにみえますが、こちらは業務の内容に焦点を当てた部分です。たとえばWeb広告の分析を行うならweb広告運用の知識が必要、営業なら営業、カスタマーサポートならカスタマーサポートの知識が求められます。具体的にデータを分析して現場のマネージャーとコミュニケーションして業務改善をしていくならば、業務理解が重要です。

特に分析者の目線でいうならば、データドリブンが広まった現代では業務ごとによく行われている分析やKPIがありますので、そのような定番のやり方を知っておくと有用です。教科書的なテクニックは書籍や勉強会などで共有されているものも多くあり、学ぶことが可能です。

3つ目は自分たちのサービスの知識です。サプライチェーンやビジネスモデル、システムの設計などがこれにあたります。このような知識は自分たちのサービスを改善するときに強く求められます。プロダクトマネジメントにデータを活用するならば必須となるでしょう。その会社の事業特有の知識となるため一般化しにくく、社内での経験値が必要です。

(写真:Bignai / shutterstock

実際にデータを分析するには、データがどこからどのように作られているのかを知らなければなりません。そのためには自分たちのサービスの仕組みを理解しておく必要があります。これはデータベースの構成のような限られた話ではありません。誰がどのようにどのタイミングでデータを入力するのか、そのデータが自分たちの分析環境までどのような処理がされているのか把握するということです。

実際の分析の現場では、上記の3つをバランスよく学ぶことが求められます。どれか1つだけわかっていればよいというものではありません。たとえば、データの偏りはシステム・業務・業界どの要因でも発生しうるものです。妥当なデータ分析を行うためには、幅広く必要な知識を身に着けておく必要があります。もちろん、それらすべてを完全に理解することは不可能ですので、必要に応じて理解を深めていくといいでしょう。

ドメイン知識を身につけるための近道

実際にドメイン知識を学ぶためにはどのようにすればよいのでしょうか?正直なところ、分析者の環境に応じて必要なドメイン知識は千差万別ですので、誰もが使える具体的な解決方法を提案することはできません。ですからここでは「学び方」についてお伝えしておきたいと思います。

最も基本的な学び方は専門家に相談することです。同じドメインの分析者がいれば一番よいですが、そうでなくても、その分野で仕事をしている方に教えを請うことができれば、十分に知見を得ることができます。

業界の知識が必要であれば、分野のスペシャリストに相談すればよいでしょう。どのような場面でも分析対象のスペシャリストがいるはずですので、知っておくべき基本的な知識やそれを学ぶための方法を尋ねてみましょう。業界でよく読まれている書籍などを教えてくれるはずです。業務であれば、部門のマネージャに相談すればチームの研修資料があるかもしれません。システムの知識であれば、現場の開発者が参照しているwikiなどのナレッジが参考になるでしょう。

いずれにせよ「相談すること」がドメイン知識を得るうえではもっとも近道であるということです。データ分析者はなにかの分野のスペシャリストであることは多くありません。全く知見がないという状況もあるでしょう。そのようなときに無理に独学で知識を得ようとするのではなく、素直に専門家を頼ることが必要なのです。

「わからないことは専門家に相談する」というと、なんだか単純で当たり前のことをいっているように見えるかもしれません。ですが、分析の対象がコロコロと変わることの多いデータ分析者という仕事をうまく回すには、その当たり前をうまくやるというキャッチアップの技術も必要なのです。