今日のマーケティングリサーチでは、よく世論調査やアンケート結果等で見かけるデータについて
「そのデータから本当にそういう結論が言えるの?」というところを統計学的に検証する方法について幾つか学びました。

中でも興味深かったのが
カイ2乗検定です。簡単な計算によって、調査結果の検証ができる有効なツールで、例えばこんな風に使えます(今日の宿題のケーススタディより抜粋)。
「A社が新しい商品を市場に投入する際に、その成否について事前に市場調査しようと考えた。ある市場調査会社B社は、
B社が調査した結果として「成功する」と予想した場合、80%の高い確率で実際にその商品が成功している、と主張している。そこで、A社はB社の過去の市場予測とその結果に関するデータを取り寄せた(下表)。」

「確かにこの表によると、B社が「成功する」と予測した60件のうち、実に48件、割合にして80%は実際に成功していることがわかった。でも、
本当にB社の市場予測は当たっていると言えるのだろうか?」
こういう表は日常でもよく目にします。大抵は表を眺めて何となく
「言われてみると確かにあたっているような気がするな」程度で納得しがちです(特に僕のような文系出身者はそれ以上、確認する術がありません。)
でも、カイ2乗検定を用いることで、この例で言えば
「B社の市場予測と実際の成否結果には統計学的に有意な水準で関連性があるか否か」ということが簡単な計算で検証することができます。
方法としては、まず各マスごとにExpected number(期待値)を計算します。例えば、左上のマスであれば、60 x 75 / 100 = 45といった具合です。

次に、カイ2乗値を計算します。同様に左上のマスであれば、(48 - 45)^2 / 45 = 0.20を求め、全部のマスの値を合計したもの(2.13)がカイ2乗値です。

そして、カイ2乗分布表(自由度 x 確率)から基準となるカイ2乗値を求めます。自由度は縦横のマスの数から1を引いてかけた数、このケースでは、(3 - 1) x (2 - 1) = 2です。また、確率とはどれくらいの確率で統計的に有意か否かを検証したいか?ということ。ここでは、95%とします。すると、カイ2乗分布表より、基準となる値は5.99となります。
最後に、計算したカイ2乗値(2.13)と分布表から求めた基準値(5.99)を比較し、前者>後者だった場合は、「統計的に縦軸と横軸に関連性がある」と言えます。このケースでは、2.13<5.99なので、実は
「統計学的に95%の確率でB社の市場予測と実際の成否結果には関連性がない」と言えることがわかります。
ちょっとした知識ですが、社内・社外向け資料を作る際などにも簡単に応用できる有効なツールです。また、これを使うとあちこちで氾濫するマーケティングデータにも惑わされずに簡単にロジックを検証できます。