バナー広告の効果やいかに　「カイ二乗値」求めてゴールを目指せ

2022年10月05日読了時間： 13分

11

前回の「χ²（カイ二乗）検定」の講義では「期待度数」の2行2列のクロス集計表を完成させた。今回はχ²の統計検定量「χ²値」を計算し、バナー広告のABテストにおいてクリックや購入との関係を求め、法政大学経営学部の西川英彦教授が“超初心者レベルの講義”で検証のゴールへと導く。

マーケティング調査でおなじみのABテスト。果たしてその「差」は有意なのだろうか……　※画像はイメージ（画像提供：Jirsak／Shutterstock.com）

［画像のクリックで拡大表示］

期待度数から算出するχ²の検定統計量

――ビデオカメラの2種類のバナー広告について、「クリックのABテスト」「購入のABテスト」それぞれクロス集計表に「期待度数」を入れました。この基準となる期待度数から、実際の調査結果がどれだけ離れているのか、その度合いを調べることで、

（5）「p値」を調べるのに必要な「検定統計量」を決められた計算式で求める

　という、この「検定統計量」を計算するのですね。

西川英彦教授（以下、西川）　そうです。ちなみに実際の調査結果のことを、調査によって観測された数値なので「観測度数」と呼びます。ここで「クリック」と「購入」のABテストの期待度数と観測度数の表を見比べてみましょう。

想定と実際のずれが大きければ（差はあるので）、帰無仮説（差はない）は棄却できそう

［画像のクリックで拡大表示］

西川　さて、この期待度数と観測度数がどれだけ離れているのか、その度合いをどんな方法で調べればいいと思いますか。

――例えば、それぞれ同じ位置にあるセルの「観測度数－期待度数」という数値の差を出して、その4つの合計を計算すれば、期待度数と観測度数の離れ具合が分かるんじゃないですか。

西川　では「クリックのABテスト」で計算してみてください。

――はい、単なる引き算ですから簡単です。

（510－500）＋（500－490）＋（490－500）＋（510－500）＝0

　あれ、期待度数と観測度数の差の合計は「0（ゼロ）」になっちゃった。

西川　「購入のABテスト」で計算しても、同じように「0」になります。正の値と負の値が打ち消し合ってしまいますからね。では、どうすればいいでしょうか。

――どうすればって言われても……。

西川　「標準偏差」の講義で、似たような場面に遭遇したことを覚えていませんか。

――ありました。あのときは「平均のずれ」である「偏差」を合計しても、プラス分とマイナス分が打ち消し合って「0」になってしまいました。だから……そうだ、「偏差」を2乗して「分散」を求めたんだ。

西川　そうです。今回も正の値と負の値が打ち消し合うのを避けるため、それぞれを2乗すればいいのです。

――なるほど。「クリックのABテスト」で計算してみます。

（510－500）²＋（500－490）²＋（490－500）²＋（510－500）²＝100＋100＋100＋100＝400

　今度は期待度数と観測度数の離れ具合が「0」になりませんでした。

西川　「購入のABテスト」でも同じように計算できます。ただし、これだけだと困ったことになります。

――困ったこと？

西川　この方法だと、観測度数や期待度数、つまり「サンプル数」が大きくなればなるほど、離れ度合いの数値も大きくなる。また「サンプル数」が小さくなればなるほど、離れ度合いの数値も小さくなります。つまり、データごとに異なる水準で検討しなければならなくなるので使い勝手が良くありません。

――そんなこと言われても……。

西川　先ほどの「標準偏差」の「分散」の場合も、似たような話がありませんでしたか。

――そう言えば、「分散」を2乗した際も、単位をそろえるために分散の値の平方根（√＝ルート）を求めました。

西川　そう。今回は平方根（√＝ルート）ではなく、「期待度数」で割ることによって、サンプル数の大小の違いに大きな影響を受けない水準として検討できるようにします。それをセルごとに計算してすべて足せば、「期待度数から観測度数がどれだけ離れているのか」の度合いを調べる検定統計量が計算できるのです。

　このχ²検定に使う検定統計量を「χ²値」と言います。χ²値の計算式は、次のようになります。

［画像のクリックで拡大表示］

――観測度数と期待度数のずれの度合いを調べるため、「（観測度数－期待度数）の2乗」を使って計算するから「χ²値」というネーミングなのですね。

西川　そのように言われています。それが講義の冒頭で「χ」には統計的に大した意味はありませんが、「2乗」には意味がありますと言った理由です。

　この計算式で計算すると、「クリックのABテスト」と「購入のABテスト」のχ²値は次のようになります。

［画像のクリックで拡大表示］

――「クリックのABテスト」は「0.8」、「購入のABテスト」は「6.27」になりました。

西川　この方法でχ²値を計算すると、期待度数と観測度数の差が大きければχ²値も大きくなり、差が小さければχ²値も小さくなります。

カイ二乗値によって実際の値（観測度数）が、帰無仮説の状況（期待度数）とどれほど離れているのかを検討できる

［画像のクリックで拡大表示］

――なるほど、こうやってχ²値を計算すれば、帰無仮説が正しいとする状況の期待度数と実際の観測度数がどれくらい離れているのか、検討できるわけですね。

西川　では、検定統計量の「χ²値」が分かりましたので、次は、

（6）算出された検定統計量の従う分布により、帰無仮説の状況が発生する確率「p値」を調べる

　このプロセスに移りましょう。

このコンテンツ・機能は有料会員限定です。

【オトクな春割】お申し込みは今すぐ！

記事が読み放題に

お申し込み

会員の方はこちら

この記事を無料で回覧・プレゼントする

第8回バナー広告のABテスト　「カイ二乗検定」で真の効果をあぶり出せ

第10回「t検定」で探るクーポンの有効性　2つのデータの差を徹底検証

この特集・連載の目次

全10回

文系マーケターのための統計入門

マーケティング調査のデータ分析や、マーケティング研究の最新情報が詰まった論文を読み解く際、避けては通れないのが「統計」の知識だ。しかし、数式やグラフがたくさん出てきたり、数学の知識が必要だったりと、特に文系マーケターの中には苦手意識を持っている人も多いだろう。逆に言えば、統計の基礎知識さえ身に付けておけば、かなり正確にマーケティング調査のプロセスや結果が理解できるようになる。この特集では大学で学生にマーケティングを指導する先生に、文系マーケターを対象として「これだけは知っておきたい」という統計の知識を、可能な限りかみ砕いて解説してもらう。