ランダムサンプリングの調査結果を左右するポイント

1.ランダムサンプリングとは
ランダムサンプリング(Random Sampling)とは、無作為抽出法あるいは確率抽出法(Probability Sampling)とも呼ばれいて、母集団の中から調査対象者を同じ確率で無作為に選び出す方法のことです。つまり、くじ引きのような方法で調査対象者を選び出す方法のことで、抽出する主体の主観は排除されなければなりません。

ランダムサンプリングの大きな特徴は、

(1) 確率論によって代表性が保証されている点
(2) 精度計算が可能であるという点

です。例えば、サンプリング誤差の計算可能となるのです。行政機関が行う世論調査のほとんどは住民台帳や選挙人名簿を活用したランダムサンプリングで行われています。

2.高感度調査との混同によるリスク
高感度調査とは、トレンドに敏感な(高感度な)消費者が消費をリードする、という仮説に基づいて、特定の商品ジャンル・サービスジャンルに関しての高感度層を抽出して調査する、というものです。具体的には、ファッションを例にすれば、ファッションの流行に敏感な調査対象者を各リサーチ機関の独自の基準で選び出して調査して結果を分析する、というメソッドです。

上記のような対象者抽出を行いますから、高感度調査は、母集団全体の一部を対象とした調査ということになります。そういう要因があって、母集団全体を対象にした調査とは異なった結果になることも頻発する、と想定されます。あくまでも高感度調査は、特定の商品ジャンル・サービスジャンルに関しての敏感層のみを対象とした調査なのです。

「高感度層」の定義に関しては、統一的な、かつ「性別・年齢別」といったような絶対的・普遍的な基準があるわけではなく、また各リサーチ機関によって異なっていますから、抽出条件も異なるでしょう。つまり、各リサーチ機関が過去の膨大なデータをベースにして、独自の抽出基準が作成されているということです。

従って、高感度調査の調査結果の信頼性は高い、と推定されるものの、抽出する主体の主観が完全に排除されているとはいい難い部分もありますので、ランダムサンプリングのように代表性が保証されているわけではありません。有意差検定においては、ランダムサンプリングとは異なった計算式を用いる必要がある、と考えられます。

以上のような理由により、高感度調査と母集団全体を対象にしたランダムサンプリングによる調査との違いを常に認識しておく必要があるでしょう。このことは、無作為抽出(ランダムサンプリング)と有意抽出との違いにおいても、同様のことがいえます。

3.復元抽出と非復元抽出の使い分け
ランダムサンプリングにおける復元抽出とは、一回調査対象になった対象者を再び調査対象に含めるという抽出方法です。
一方、非復元抽出とは、一回調査対象になった対象者を除外するという抽出方法です。わかりやすく説明するなら、福引で、出た玉を抽選器に戻すのが復元抽出で、戻さないのが非復元抽出ということになります。

復元抽出は、調査対象者の重複が認められる場合に用いられます。例えば、母集団全体を対象にした調査で、ランダムサンプリングあるいは有意抽出法(Purposive Selection Method)で抽出しなければならい場合は復元抽出が用いられます。例えば、世論調査・大規模な市場調査などでは、復元抽出が基本となります。世論調査・大規模な市場調査は、対象者の重複が認められます。また母集団全体を対象にしていますので、調査は全国や都道府県内や市町村内の広範囲で実施され、かつ、1年ごと、3年ごと、5年ごとなど調査と調査の期間が空いている場合が多いからです。現実問題として、同じ対象者が選ばれる確率は異常に低く、重複は、ほとんどない、といっても過言ではありません。
一方、非復元抽出は、重複が許さない場合の抽出方法です。母集団が特殊だったり、極端に小さかったり、調査頻度が高い場合に用いられる場合がありますが、これは対象者が重複する可能性が高いことを考慮した結果です。

既述しましたように、実際の世論調査・市場調査などの定量調査の場合は、ほとんどの場合は復元抽出が採用されていますが(過去の調査協力時期でスクリーニングする場合もありますが)、非復元抽出による調査では、別のリサーチ会社が抽出して対象としている場合が稀にありますので、留意すべき点して挙げておきます。

4.まとめ
「1.ランダムサンプリングとは」
「2.高感度調査との混同によるリスク」
「3.復元抽出と非復元抽出の使い分け」

について記述してきたことの重複にはなってしまいますが、ランダムサンプリング調査の結果には、代表性という統計学的裏付けがあり、サンプリング誤差などの精度の計算が可能となります。母集団の大きさ、サンプル数、回答比率によって、サンプリング誤差が算出され、その調査の信頼度がわかるのです。例えば、CS調査などで、満足度の回答比率が競合他社商品と拮抗している場合など、有意な差があるのか否かを判断できます。僅か1%の差で「優位である」あるいは「劣位である」という判断ミスを下すことはなくなります。
高感度調査については、母集団全体の一部を対象とした調査であるということ、厳密な意味でランダムサンプリングとはいえない、という2点を認識したうえで、大いに活用すべきでしょう。
復元抽出と非復元抽出については、ほとんどの定量調査は復元抽出で実施されますが、非復元抽出については、母集団が特殊だったり、極端に小さかったり、調査頻度が高い場合に、用いることを視野に入れるべきでしょう。

最後になりますが、ランダムサンプリングのベースは、母集団の決定にあります。選挙調査の場合は、有権者が母集団となり、簡単に母集団が決定できます。しかし、マーケティングリサーチにおいては、母集団を決定することが難しいケースが頻発します。例えば、商品購入者調査を実施する場合、過去半年以内の購入なのか、1年以内購入なのか、あるいは、単なる「過去購入」なのか、によって、母集団が異なってきます。この例であれば、購入時期の決定によって、調査結果は変わる、と想定されます。基本的には、何を知りたいのか、何を明らかにしたいのか、仮説が検証できるのか、という観点に立って、母集団を決定していく必要があります。母集団の決定は、調査の根幹といっても過言ではないのです。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)