近年、ビックデータ分析等といった言葉が流行り、街の書店でも関連書籍や雑誌の特集記事がよく見られるようになりました。
それでは、これは最近出てきたものなのかというと、そういうものばかりではありません。
確かに、専門書ではサポートベクターマシン、ランダムフォレスト等といった、私が医学部にいたときでも聞いたことがなかったような難しい言葉の分析手法がよく紹介されています。
しかも一般社会人を対象にしたビジネス用書籍にです!。
こういった分析が盛んに取り上げられるようになったのは、過去と違いPOSデータやログデータといったものが全てコンピュータで大量に蓄積できるようになったこと、コンピュータの演算能力の著しい向上等の寄与が強いと思われます。
これらの成果は、迷惑メールのふるい分けや、インターネットショッピングでの「あなたにオススメの商品」「これを購入した人はこれも購入しています」等といった機能に見られます。
このような分析手法が、統計の専門家ばかりが読むわけではないビジネス書籍に紹介されているわけですが、こういった書籍では理論的な説明等少し不足しているものが多い気がします。
分析手法の選択や結果のビジネスの場への適用は、企業の目指す目標や集計されたデータの性質といったものを総合的に鑑みて、段階的に進めるべきだと考えます。
例えば、会議で
「アソシエーション分析で信頼度と支持度を云々した結果、来週以降は商品の配置を変えたほうが良いと考えます」
と言われて、心から納得して
「ぜひやりましょう!」
とはならないのではないでしょうか。
ほとんどの方が、狐につままれたような気持ちで釈然としないまま終わってしまうことが多いかと思います。
その結果は、分析した内容の中途半端な日常業務への落とし込みと非効果的な結果につながりかねません。
これと似たようなことは、私自身苦い経験としてあります。
そこから得た教訓として
「裏でどれだけ難しい分析をしても、表ではグラフや簡単な分析結果を通して示す。」
というものです。
そして、
「たくさんデータがあっても、その構造を見やすくして、現場の方と一緒に意味を解釈する。」
となります。
まずは、偏見なく腰を据えてデータの持つ意味に向き合うべきです。
これまで述べたような分析手法は、向き合った結果本当に必要な場合のみ検討すべきものです。
複雑なデータを紐解いて、営業の方にも、事務の方にも、企業で働くすべての方々が理解しやすい形で新しい見方、隠されたデータのパターンを示す。
そして、本当に納得していただいた上で、その結果を日々の実務に落とし込む。
これが、様々な能力や背景を持つ人々の集まりである企業における統計分析で最も大事なことだと考えます。
加えて、このようなアプローチはアウトプットだけを見れば簡単な分析に見えますが、実は最も難しいことなのだと思います。
ですので、私自身これからも日々継続して研鑚する必要がありますし、今日より明日、明日より明後日と日々進化していく所存です。
(橋本圭司)