マーケティング関連記事等

ランダムサンプリングの調査結果を左右するポイント

1.ランダムサンプリングとは
ランダムサンプリング(Random Sampling)とは、無作為抽出法あるいは確率抽出法(Probability Sampling)とも呼ばれいて、母集団の中から調査対象者を同じ確率で無作為に選び出す方法のことです。つまり、くじ引きのような方法で調査対象者を選び出す方法のことで、抽出する主体の主観は排除されなければなりません。

ランダムサンプリングの大きな特徴は、

(1) 確率論によって代表性が保証されている点
(2) 精度計算が可能であるという点

です。例えば、サンプリング誤差の計算可能となるのです。行政機関が行う世論調査のほとんどは住民台帳や選挙人名簿を活用したランダムサンプリングで行われています。

2.高感度調査との混同によるリスク
高感度調査とは、トレンドに敏感な(高感度な)消費者が消費をリードする、という仮説に基づいて、特定の商品ジャンル・サービスジャンルに関しての高感度層を抽出して調査する、というものです。具体的には、ファッションを例にすれば、ファッションの流行に敏感な調査対象者を各リサーチ機関の独自の基準で選び出して調査して結果を分析する、というメソッドです。

上記のような対象者抽出を行いますから、高感度調査は、母集団全体の一部を対象とした調査ということになります。そういう要因があって、母集団全体を対象にした調査とは異なった結果になることも頻発する、と想定されます。あくまでも高感度調査は、特定の商品ジャンル・サービスジャンルに関しての敏感層のみを対象とした調査なのです。

「高感度層」の定義に関しては、統一的な、かつ「性別・年齢別」といったような絶対的・普遍的な基準があるわけではなく、また各リサーチ機関によって異なっていますから、抽出条件も異なるでしょう。つまり、各リサーチ機関が過去の膨大なデータをベースにして、独自の抽出基準が作成されているということです。

従って、高感度調査の調査結果の信頼性は高い、と推定されるものの、抽出する主体の主観が完全に排除されているとはいい難い部分もありますので、ランダムサンプリングのように代表性が保証されているわけではありません。有意差検定においては、ランダムサンプリングとは異なった計算式を用いる必要がある、と考えられます。

以上のような理由により、高感度調査と母集団全体を対象にしたランダムサンプリングによる調査との違いを常に認識しておく必要があるでしょう。このことは、無作為抽出(ランダムサンプリング)と有意抽出との違いにおいても、同様のことがいえます。

3.復元抽出と非復元抽出の使い分け
ランダムサンプリングにおける復元抽出とは、一回調査対象になった対象者を再び調査対象に含めるという抽出方法です。
一方、非復元抽出とは、一回調査対象になった対象者を除外するという抽出方法です。わかりやすく説明するなら、福引で、出た玉を抽選器に戻すのが復元抽出で、戻さないのが非復元抽出ということになります。

復元抽出は、調査対象者の重複が認められる場合に用いられます。例えば、母集団全体を対象にした調査で、ランダムサンプリングあるいは有意抽出法(Purposive Selection Method)で抽出しなければならい場合は復元抽出が用いられます。例えば、世論調査・大規模な市場調査などでは、復元抽出が基本となります。世論調査・大規模な市場調査は、対象者の重複が認められます。また母集団全体を対象にしていますので、調査は全国や都道府県内や市町村内の広範囲で実施され、かつ、1年ごと、3年ごと、5年ごとなど調査と調査の期間が空いている場合が多いからです。現実問題として、同じ対象者が選ばれる確率は異常に低く、重複は、ほとんどない、といっても過言ではありません。
一方、非復元抽出は、重複が許さない場合の抽出方法です。母集団が特殊だったり、極端に小さかったり、調査頻度が高い場合に用いられる場合がありますが、これは対象者が重複する可能性が高いことを考慮した結果です。

既述しましたように、実際の世論調査・市場調査などの定量調査の場合は、ほとんどの場合は復元抽出が採用されていますが(過去の調査協力時期でスクリーニングする場合もありますが)、非復元抽出による調査では、別のリサーチ会社が抽出して対象としている場合が稀にありますので、留意すべき点して挙げておきます。

4.まとめ
「1.ランダムサンプリングとは」
「2.高感度調査との混同によるリスク」
「3.復元抽出と非復元抽出の使い分け」

について記述してきたことの重複にはなってしまいますが、ランダムサンプリング調査の結果には、代表性という統計学的裏付けがあり、サンプリング誤差などの精度の計算が可能となります。母集団の大きさ、サンプル数、回答比率によって、サンプリング誤差が算出され、その調査の信頼度がわかるのです。例えば、CS調査などで、満足度の回答比率が競合他社商品と拮抗している場合など、有意な差があるのか否かを判断できます。僅か1%の差で「優位である」あるいは「劣位である」という判断ミスを下すことはなくなります。
高感度調査については、母集団全体の一部を対象とした調査であるということ、厳密な意味でランダムサンプリングとはいえない、という2点を認識したうえで、大いに活用すべきでしょう。
復元抽出と非復元抽出については、ほとんどの定量調査は復元抽出で実施されますが、非復元抽出については、母集団が特殊だったり、極端に小さかったり、調査頻度が高い場合に、用いることを視野に入れるべきでしょう。

最後になりますが、ランダムサンプリングのベースは、母集団の決定にあります。選挙調査の場合は、有権者が母集団となり、簡単に母集団が決定できます。しかし、マーケティングリサーチにおいては、母集団を決定することが難しいケースが頻発します。例えば、商品購入者調査を実施する場合、過去半年以内の購入なのか、1年以内購入なのか、あるいは、単なる「過去購入」なのか、によって、母集団が異なってきます。この例であれば、購入時期の決定によって、調査結果は変わる、と想定されます。基本的には、何を知りたいのか、何を明らかにしたいのか、仮説が検証できるのか、という観点に立って、母集団を決定していく必要があります。母集団の決定は、調査の根幹といっても過言ではないのです。

標本調査で欠かせない無作為抽出と有意抽出の見分け方

1.無作為抽出とは

無作為抽出とは、最も簡潔な言葉で表現するなら、「くじ引きで対象を選ぶ」ということになります。つまり、母集団の中から、アットランダム(at random)に調査対象を選び、かつ、選ばれる確率は、どの調査対象も等しくする、ということで、ランダムサンプリング(random sampling)とも呼ばれています。あるいは確率抽出法(probability sampling)とも呼ばれています。

2.一見無作為抽出に見える有意抽出

無作為抽出法による調査は、政府、地方自治体、公益団体が実施している世論調査など代表的なものですが、無作為抽出法の対極にあるものが有意抽出法(purposive selection)です。英語のpurposiveを訳せば、わかるように「目的にかなったサンプリング」です。有意抽出法の代表例は、街頭でインターセプトされて実施されている街頭インタビューや街頭リクルート調査が挙げられます。一見すると、無作為に対象を選んでいるようですが、対象を選ぶ場合、性別、年齢、職業などいったスクリーニング条件がありますので、無作為抽出法とはいえません。従って、代表性がある、とはいいきれず、「代表性がある可能性は高い」としかいえないのです。この街頭インターセプトによる調査以外には、人名リストの中から対象を選んで調査する場合も、有意抽出法といえます。これら街頭インタビューや人名リストを使用した場合の抽出法は、便宜的サンプリング(convenience sampling)と呼ばれています。またインターネット調査も有意抽出法のケースが多いと想定されます。登録モニターの中から条件に合う対象を抽出していれば、便宜的サンプリングになるからです。しかし、住民台帳や選挙人名簿からランダムサンプリングによって対象を選んでインターネットで調査を行った場合は、無作為抽出法による調査であり、「代表性がある」といえます。

ところで、無作為抽出法は1種類しかないというわけではありません。例えば、単純無作為法は、調査員調査において調査地域が狭い場合に有効です。例えば、小さな市町村や集落などでは非常に有効となります。この単純無作為法を簡単に説明すると、住民全員が等しい確率で選ばれるようにインターバルを決めて抽出していく、という方法です。系統抽出あるいは等間隔抽出とも呼ばれています。例えば、1万人が居住する町で、1,000人を抽出する場合、インターバルは10になりますが、インターバル10は、実際、現地にいってみればわかりますがだいたい3軒置きくらいになり(地域特性によっても異なりますが)、調査員は効率的に稼働できます。しかし、調査地域が全国とか都道府県内全体という具合に広域になる場合、2段無作為抽出法を用います。この2段無作為抽出法を簡単に説明すると、第1段階で、調査地域内で調査地点を系統抽出し、第2段階で、その調査地点で、さらに等間隔で対象を抽出していく、という方法です。この方法ですと、調査員の調査地域の範囲が狭くなり、効率的な稼働が可能となります。しかし、調査地域をブロック別やエリア別で層化するケースがほとんどなので、層化2段無作為抽出法として活用されるケースがほとんどです。しかし、単純無作為法よりサンプリング誤差が大きくなります。

3.サンプルは何人必要となるか

調査を設計する際、標本数(サンプル)は非常に重要な要因となります。まず、どこまで分析するのか、あるいは、分析したいのか、という着地点が見えてなければなりません。性別・年齢10歳階級別まで分析が必要ということであれば、年齢を6つのカテゴリーに分けた場合、性別の2×年齢階級別の6=12カテゴリーになります。各カテゴリーの分布が統計データとして活用可能最低サンプル数は100s以上といわれますので、1,200sは必要となります。しかし、回収率が5~6割だとすれば、それを見込んで、

1,200s×10/5~6 = 2,000~2,400s

は必要ということになりますが、2,000~2,400sの調査を実施するとなれば、かなりのコストと時間が必要となります。代案としては、各カテゴリーが30s以上あれば、統計的な数値として安定してきますので、各カテゴリー30sとして分析する、といった割り切り方も出来ます。つまりサンプル数は、どこまで分析したいのか、予算はどれくらいあるのか、という妥協点を視野に入れつつ決められいるのが実情といえます。しかし、最もnが小さくなるカテゴリーにおいて30s以上確保できるように標本設計すべきでしょう。

4.無作為抽出が必要となる調査の種類

これまで記述の中で、既にいくつか無作為抽出を用いる調査を紹介していますが、国、都道府県、市区町村が行う世論調査は無作為抽出が原則といえます。実際に県民アンケート、市民アンケートといったようなものは、ほとんどが無作為抽出で実施されています。無作為抽出法による世論調査は、住民の意識、実態などを把握する場合に有効な手段なのです。これらの国や地方自治体が行う世論調査は、企業も参考資料として大いに活用すべきでしょう。

次に特異な例となりますが、施設などの来場者調査において、来場者に性別・年齢別などのクォータを付けずに、来場者を「○○人置き」(等間隔で)に調査するという系統抽出を取り入れた方法もあります。この方法であれば、ランダム性が保持できて、調査日の「全来場者」という母集団が推定できるというメリットがあります。

クロス集計は分析の基本手法!リフト値など活用方法の多さが魅力

1.クロス集計とは

アンケートの結果を、実数、パーセント数のような数値に置き換えたものが集計です。例えば、選挙調査で「内閣を支持しますか?」というクェスチョネアに対して、「支持する」50%、「支持しない」40%、「わからない」10%というように、〇〇%という数値に置き換えることが集計です。

集計は、単純集計とクロス集計の大きく2つに分けられます。単純集計は、GT(グランドトータル)とも呼ばれ、アンケートの回答全体の実数や比率のことで、集計の基本となります。内閣支持率の例で示しますと、回収数(n *1)が1,000だとすれば、500(n)が支持、400(n)が不支持、100(n)が「わからない」ということになります。これを比率で表すと、支持50%、不支持40%、「わからない」10%となるわけです。これが単純集計です。

*1 統計学では、 母集団の大きさを表す場合は、N(ラージエヌ)、その母集団からアンケートで得たサンプル数を表す場合は、n(スモールエヌ)を使用します。内閣支持率の例で説明しますと、調査地域が東京都の有権者であれば、N=東京都の有権者数、n=回収数1,000ということになります。因みに、nは、Number of casesの略です。

しかし、単純集計だけでは、全体の支持率はわかっても、どのような属性の人が内閣を支持しているのか、まではわかりません。支持率を「性別で知りたい」、「年齢別で知りたい」、「選挙区別で知りたい」などの属性で知りたい場合が必ずといってよいほど発生します。この属性別(基本属性=デモグラフック)のような層別で集計することがクロス集計です。当然、基本属性だけがクロス集計ではなく、買物調査の場合は、来店頻度別、CS調査の場合は、満足度別、広告効果測定調査の場合、テレビ視聴時間別など、調査の種類・目的によって様々な軸でクロス集計は活用されています。つまり、クロス集計は、GTの中身の詳細を知るということになります。

<内閣支持率を例にしたクロス集計の見本>

Q内閣支持率支持する支持しないわからない
全体GT (n=1,000)50%40%10%
性別男性(n=400)60%30%10%
女性(n=600)43%47%10%
年齢別30歳未満 (n=150)…%…%…%
30~40歳未満 (n=180)…%…%…%
40~50歳未満 (n=200)…%…%…%
50~60歳未満 (n=220)…%…%…%
60歳以上(n=250)  …%   …%…%

*一般的に、クロスの対象となるクェスチョネアを「表頭」、クロスの軸となる項目(アイテム)を「表側」といいます。

2.クロス集計のメリット

クロス集計は、アンケート分析の基本中の基本です。例えば、性別、年齢別での特徴や傾向などを分析するうえで、なくてはならないものです。性別×年齢別を軸した三重クロス集計も頻繁に活用されています。性別×年齢別を分析軸にすることで、男性・20代と女性20代の差異も明確にわかるようになるのです。

しかし、このようなデモグラフィックを軸にした分析以外に、新たな分析軸を発見することやクェスチョネア同士を組み合わせて分析軸を作成することも分析者として必要な能力となってきます。昨今は、エクセルなどの表計算ソフトのアドイン集計ソフトで、手軽にクロスする項目を選定して短時間で集計結果を得られて、分析者の仮説を簡単に検証できるようになったというメリットがあります(汎用機で集計し、コストが非常にかかる時代もあったのです)。

また、クロス集計分析は、多変量解析を行う場合のベースにもなりますので、マーケテイングリサーチャーとしては、GT分析と同様に基礎技術といえます。

3.クロス集計を基にできる分析

「1. クロス集計とは」「2. クロス集計のメリット」で既述していますように、クロス集計は、GTの中身を詳細に分析する、ということです。 その種類は以下のように大きく3つに分けられます。

(1)カテゴリー×カテゴリー   例. 表頭:内閣支持 × 表側:性別、年齢別、支持政党別など

(2)数量×カテゴリー         例. 表頭:数量データで得た年収 × 表側:カテゴリーの年齢別

(3)数量×数量               例. 表頭:数量データで得た年収 × 表側: 数量データで得た預金額*2

*2  (3)の例については、分析する前に、ある程度の予想が立てられます。「貯金が多ければ、年収も高いであろう」という相関関係を予測しても妥当だと考えられます。しかし、最終的には相関係数を求めて、相関関係があるのか否かを実証する必要があります。

以上の3つにクロス集計は分類されますが、業種や分析対象などによって活用するクロス集計は異なってきますが、一般的には「(1)カテゴリー×カテゴリー」が最も活用頻度が高いと想定されますので、「(1)カテゴリー×カテゴリー」のクロス集計事例を、下表のようなスーパーの食品売場で買い物をした購入者の購入品目同士の併買状況で示します。前提条件を、実際の購入者からアンケートでデータを取ったものとします*3。

*3数値ははダミーです。

<クロス集計の事例:併買購入品目間の併買率>

 表頭M.A.  表側M.A.赤ワイン缶ビールローストビーフチーズフランスパン・・・
赤ワイン 85%50%75%40%・・・%
缶ビール75% 60%30%35%・・・%
ローストビーフ45%70% 15%30%・・・%
チーズ70%40%20% 35%・・・%
フランスパン30%25%30%40% ・・・%
・・・・・・%・・・%・・・%・・・%・・・% 

表頭にも表側にもスーパーマーケットの食品売場で買った商品という項目を使っています(購入品目は、複数回答を前提としていますので、複数回答=M.A.(M.A.はMultiple Answerの略)間クロス集計となります。マルチトータル=M.T.≦100%となります)。従って、数値(%)は、併買率を示します。赤ワイン購入者の85%は缶ビールを、75%はチーズを購入しているということで、併買率は高いといえるでしょう。この比率を分析する限りにおいては、缶ビールの赤ワイン併買率も75%と高いので、アルコール類は同時に購入される比率が高いということがわかります。また赤ワインの場合、チーズの併買率も高いことから、チーズをワインの近くに置く、といったような陳列戦略も立てられます。

このようにクロス集計分析でも、購入商品の併買率がわかり、「併買商品が何であるか」を知ることで活用できます。しかし、併買については、リフト(Lift)値をPOSデータ(トランザクション*4形式データ)活用することによって算出し、より精度の高い結果が得られます。アンケートは、全数調査ではなく、サンプリング調査であるため標本誤差が生じますので、トランザクションの分析であれば、膨大なデータ数を活用しますので、精度が高いといえます。

ところで、「リフト(Lift)値」とは、商品間の購入関連性を分析するもので、バスケット分析(ある商品と併買される商品を見つけ出すこと)の中でも、支持度(Support)や確信度(Confidence)ともに重要な指標の1つです。リフト値の計算方法は以下の通りです。

*4 ここでは、「トランザクションデータ」とは購入履歴データという意味で使用しています。

<「リフト値」の計算方法>

・前提条件 : Xは、ある商品、Yは、X以外の商品を意味しています。

(1)第1段階 : 確信度(Confidence)の算出

計算式 : 確信度(Confidence) =  ( XとYを共に含むデータ数) ÷  (Xを含むトランザクションデータ数)

(2)第2段階 : リフト値の算出

計算式 : リフト(Lift)値  = 確信度(Confidence)  ÷  (Yを含むトランザクションデータ数)

このリフト値の解釈については、計算式を吟味すればわかるように、リフト値が高ければ、商品Xと商品Yの関連性で購入されているということを意味します。逆に低ければ、商品Yは、商品Xとの関連性で購入されていないということを意味します。では、リフト値がどれくらいあれば、関連性があるのか、という目安については、一般的には「1」より大きい場合だとされています。

確信度(Confidence)もリフト(Lift)値も併買品の関連性を発見するものですが、これら2つ以外に「支持度(Support)」というものがあります。支持度の計算方法は以下の通りです。

(3)支持度(Support)の算出

計算式 : 支持度(Support) = ( XとYを共に含むデータ数)  ÷ (全トランザクションデータ数) 

以上、3つの指標を紹介しましたが、これらの3つの指標とクロス集計の結果を総合的に分析することによって、今まで隠れていた商品同士の関連性が発見できる可能性は非常に高くなります。

4.注意しておきたいクロス集計のデメリット

クロス集計は、非常に有効な分析手法であることは間違いないのですが、当然、デメットもあります。まず、サンプリング調査の場合、分析に入る際にサンプル数(n)の制約を受けます。例えば、「性別×年齢別で細かく分析したい」と考えていても、女性20代といったような1つのカテゴリーのnが少なく、代表性を失ってしまうことが多々あります。女性・20代のnが10であったとすれば、分析するには無理が生じます。統計学に基けば、1カテゴリーのnが最低30は必要になってきます。従って、調査のサンプルサイズを決める際に重要なことは、どこまで詳細に分析するか、ということをあらかじめ決めておく必要があります。しかし、クロス集計分析の精度を高めれば高めるほど、サンプルサイズが大きくなり、コスト増となり、日程も長くなりがちです。サンプルサイズ、コスト、日程において妥協点を見極めておくべきでしょう。

次は、1カテゴリーのnについてです。既述したことですが、昨今は集計ソフト、表計算ソフトでクロス集計が簡単に出来るようになりました。しかし、クロス集計した場合、確実に1カテゴリーのnは少なくなります。つまり、標本誤差が大きくなるということを意味しますので、有意差検定の知識を身につけておかなければなりません。事前にクロス集計結果に検定結果を表示させるという仕組みを取り入れることも視野に入れておくべきことの1つだと考えられますが、nによって、どれくらいの標本誤差があるのか、常に意識しておく必要があります。

最後になりますが、クロス集計をペーパーで打ち出した場合、本のように分厚く、膨大な量になることが頻発します。分析者がクロス集計の結果を読み込み、解釈する時間は一向に短縮できていない、ということが現状だと想像されます。解決策としては、目的志向(最終的に何を明らかにすべきなのか、何がわかればよいのか、何をソリーションしたいのか、ということなど)でクロス集計項目を決定し、極力集計量を減らすことです。しかし、減量したクロス集計で目的が達成できない場合は、追加クロス集計をまとめて行うべきですが、このようなステップの方が効率的です。

誰もが一度は経験する単純集計の応用とクロス集計との関係性

1.単純集計とは
マーケティングリサーチ業界における「集計作業」とは、アンケート形式などの調査で得られたデータを集約・加工して、パーセントや数値などに置き換えて集計表を作成することを指しますが、データ全体の集計結果を「単純集計」(Grand Total)と呼んでいます。マーケティングリサーチ会社内部では、概ね「単純集計」を「G.T.」(ジー・ティ)という略語で表現しています。「マージナル・トータル」(Marginal Total)と呼んでいる会社もありますが、略語が「M.T.」となってしまい、Multiple Answers Total(複数回答合計)や Magnetic Tape(磁気テープ)などと判別がつかなくて、誤解の原因になる場合がありますので、会社内部では「G.T.」を使用した方がよいようです。

2.クロス集計との関係性
マーケティングリサーチ業界におけるクロス集計とは、分類項目別に回答結果を集計することです。地域別・性別・年齢別・職業別などのデモグラフィック(基本属性)別が代表的なクロス項目です。

このクロス集計のベースは単純集計です。単純集計結果の数値を見て、クロス集計する意味の有無が判断できます。一般的に、クロス集計を行う場合、以下のようなステップを踏みます。

・単純集計のアウトプット

・単純集計結果の精査

・クロス項目(表側項目)の決定

・クロス集計実施

以上は、基本的なステップですが、「単純集計の精査」の段階は重要です。例えば、性別のクロス集計を行おうとする場合、全体のnが100で、男性n=10、女性n=90だとした例においては、「性別による差は見られない」と考えるべきで、「性別のクロスの意味はなく、性別のクロスは行わない」という決定が下せるのです。クロス集計を行う場合の目安として、クロス項目の各カテゴリーのnは30以上とされています。n≧30ですと、標本誤差が急激に小さくなる、という統計学的な根拠があるからです。n≧100以上あれば、さらに望ましく、理想的である、と主張している統計学者もいますが、簡単にいってしまえば、nは大きければ大きいほどよい、ということです。しかし、n≧30は絶対的な基準ではなく、予算・調査期間等の関係で充分なnが確保できない場合があり、n≦30でクロス集計を行わざるを得ないケースも多々あります。そのような場合、標本誤差を念頭に置いて分析すべきでしょう。

しかしながら、クロス集計の実務においては、地域別、性別、年齢別、職業別などのデモグラフィック(基本属性)については、作業効率を上げるために、あらかじめクロス項目として機械的に決定されている場合がほとんどのようです。

既述していますように、単純集計はクロス集計のベースとなっていますが、実際、単純集計のみでクロス集計は行わない、というケースは、ほとんどありません。必ずクロス集計は行われる、対になっている、と考えるべきです。デモグラフィック別などで、どうしてもパーセントなどの数値を見なければ、マーケティング戦略立案に必要な分析が出来ない、という事態が発生するからです。従って、クロス集計に耐え得るnを確保することを心掛けて、データを収集しなければなりません。

3.より複雑な定量調査へ
マーケティングリサーチ会社は、恒常的に定量調査を実施していますが(定性調査専門のマーケティングリサーチ会社は別ですが)、必ずといってよいほど単純集計とクロス集計がアウトプットされています。
クロス集計項目については、調査の目的などによって異なりますが、基本的には、デモグラフィック(基本属性)別クロス集計がメインとなっています。これらのデモグラ分析に加えて、必要に応じて質問間クロス集計(質問同士のクロス集計)や独自に開発して作成したアイテム(分析軸)を使用する場合も多々あり、性・年齢別などいった多重クロス集計(Multiple Cross Tabulation)も行われますが、「何と何をクロス集計するのか」「どのような独自開発のクロスアイテム(分析軸)を作成するのか」という点は、各マーケティングリサーチ会社の分析ノウハウということになります。
しかし、クロス集計結果で、分析に限界があったり、課題を解決できなかったりする場合には、多変量解析を行うこともあります。が、調査企画段階から多変量解析を行う、と決定していた場合には、多変量解析を想定した調査票作成がなされます。

4.まとめ
ここまでは、マーケティングリサーチ会社における、専門性の強い単純集計、クロス集計、両者の関係性を書いてきましたが、両者は必ずしもマーケティングリサーチ会社のみで利活用されている訳ではなく、日常生活の中でも盛んに使われています。

例えば、ある小学校の平均身長を見る場合、学年別、性別、学年・性別で集計される、と想定されますが、この場合も、単純集計、クロス集計が行われるのです。小学校全体の平均身長を算出するという単純集計が行われた後、学年別、性別といったクロス集計が行われます。さらに学年・性別といった多重クロス集計も行われます。平均体重についても同様な作業が行われることでしょう。それぞれの学年の学力を客観的に見ようとする場合においても、算数、国語、社会、理科などの平均点を学年全体、クラス別、クラス・性別でクロス集計するものと想定され、あるクラスだけ極端に平均点が低い場合は、その原因が究明されることになると思われます。まさにマーケティングリサーチにおける課題発見のクロス集計と同じです。

このように単純集計とクロス集計は、身近なところでも応用されており、その事例は枚挙に暇がありません。生徒会長や学級委員長を投票で決める場合も、票の積み上げ、という単純集計を応用しているといえますし、好きな給食ランクキングも単純集計応用の結果であり、性別で見れば、クロス集計応用の結果であり、学年・性別で見れば、多重クロス集計応用の結果ということになります。一般的な定量調査と異なる点は、サンプリング調査ではなく、全数調査という点のみでしょう。

また国などの行政機関が実施している全国規模の定量調査においては、必ず国全体の数値を表す単純集計と地域別などのクロス集計が行われています。必要に応じて多重クロス集計も行われます。
例えば、日本最大規模の悉皆調査である「国勢調査」においては、単純集計(全体)のみならず市町村別やそれ以外の分類項目別でクロス集計が行われ、行政機関、民間企業、調査・研究機関、マーケティングリサーチ会社などで利活用されています。
外国人観光客数に関しても、全体の客数と都道府県別、国別といったクロス集計が行われて、発表されています。
各地方自治体で行っている町丁目別住民数の算出についても、「町丁目別」は、クロス集計項目の1要素であり、町丁目別住民数を積み上げて地方自治体全体で見れば、その地方自治体の人口の単純集計といえます。

このように単純集計、クロス集計は、データが数値化可能な調査においては、絶対といってよいほど用いられているのです。マーケティングリサーチ会社が行う定量調査に特化した分析メソッドではなく、日常生活を送っている人々に深く関わっている数字を解釈するための手法なのです。

アンケート調査を効果的に活用するために確認しておくべきこと

1.そもそもアンケートとは

「アンケート」とは、そもそもフランス語で、「実査活動を伴う調査」という意味ですが、日本では、調査票を使った調査全般を「アンケート」と呼ぶようになり、それが浸透して、一般化しています。

2.アンケートのメリット・デメット

(1).調査票作成方法によるメリット・デメット

アンケートの調査票は、アイテム・カテゴリーから成り立っています。アイテムとは、質問項目のことで、カテゴリーとは、回答項目のことです。多くのアンケートは、事前に回答項目が作成されていますが、これはプリコード式と呼ばれています。一方、質問項目に対して、調査対象者に自由に答えてもらい、その回答を分類して、カテゴリー化することはアフターコード式と呼ばれています。

プリコード式のメリットとしては、性別、年齢、住居形態、居住年数、居住地域といったような実態を把握するためには有効です。データの入力処理が容易になるからです。しかし、対象者の意識といったような場合、あらかじめ用意された回答項目のいずれかに入ってしまう危険性が潜んでいます(これは「バイアス(ここでは偏りという意味で使用)」と呼ばれている現象ですが、「バイアス」については、調査主体名バイアス、回答項目の順序効果バイアス、回答への助成想起バイアス、調査員バイアスなど様々なバイアスがあります)。

一方、アフターコード式のメリットは、自由回答(フリーアンサー=F.A.、オープンアンサー=O.A.と呼ばれています)が基本となりますので、調査対象者が自由に回答した意識などが吸収できるということが挙げられます。しかし、対象者の回答を全部読んで、カテゴリーに分ける、という膨大な作業が発生するというデメットがあります。また、アンケート内容に興味がない調査対象者から回答を引き出すことはなかなか難しいのです。このような事態を支援するために「プロービング」(答えるが出るように追求して質問すること)という回答を引き出す調査テクニックがあるくらいなのです。

プリコード式とアフターコード式のメリット・デメットを指摘しましたが、アンケートを作成する場合には、まず、質問項目の性格を吟味して、プリコード式にするか、あるいは、アフターコード式にするか、を決める必要があります。

(2).サンプリングのメリット・デメット

調査票作成段階においても、様々なメリット・デメットがありますが、アンケートの基盤はサンプリングです。アンケートは、母集団から無作為に一部を選んだ対象者の回答から、母集団全体を知ろうとするもので、ほとんどのアンケートではサンプリング(無作為抽出。ごく1部で有意抽出があります)が行われています。国勢調査のような国民全体を調査する悉皆調査は非常に稀なのです。

当然、サンプリングは、全数を調査する必要がありませんので、莫大なコストがかからないというメリットがあります。しかし、サンプリング誤差が生じてしまいす。例えば、「はい」という回答した比率は10±5%の間にある確率が95%といったような誤差です。誤差はサンプル数が少なければ少ないほど大きくなります。これはデメットですが、サンプリングを行った場合、「常に誤差がある」ということを認識して分析しなければなりません。

(3).調査員によるアンケートのメリット・デメット

郵送調査の活用、インターネット調査の普及によって、「コストや時間がかかる」というデメットのある調査員による調査は減少傾向にあります。が、一方で、調査員による調査は、調査票の回収率が郵送法よりも高くなるというメリットがあります。また、近年、増加しているミステリーショッパー(覆面調査)は、調査員に頼らざるを得ません。しかし、調査員の質を均一にすることは非常に困難です。ミステリーショッパーにおいては、調査の客観性を保持するために工夫に工夫を重ねているのが現実です。また、「(1).調査票作成方法によるメリット・デメット」で少し触れましたが、プロービング技術が調査員によって違ったり、各調査員が持つ独特の癖の違いもあったりするため、均一化する教育が必要となってきます。また、調査員と対象者との相性によるバイアスも発生しますので、調査員と対象者がラポール(親和関係)を素早く築いていくテクニックも習得してもらわなければなりません。

3.アンケートの種類とその違いによるメリット・デメット

調査手法は、調査する対象によって最適の手法を選ぶ必要があります。例えば、「世帯の消費額や世帯年収を知りたい」を調査したいということであれば、インタビュー法より留置法が適している、というようなことです。

以下は、主に定量的データ(数値や量のデータ)で分析するデータ)を知りたい場合の表的な調査方法です。

・個別訪問によるアンケート(インタビュー法、留置法など)

・郵送法によるアンケート

・電話によるアンケート

・インターネットによるアンケート

・街頭調査(インターセプト法)

・CLT(セントラル・ロケーション・テストの略で、ホールテスト、会場テストともいいます。会場に調査対象者を集めてアンケートを実施する方法のことです)

以下は主に定性的(あるいは質的)データを収集するための代表的な手法です。

・グループインタビュー

・デブスインタビュー(深層面接法のことで、対象者の潜在意識を探ることを目的としています)

・ミステリーショッパー(いわゆる覆面調査のことです。訓練を受けた調査員が身分を隠して、実際に商品を買ったり、サービスを受けたりして、その際の店舗内の様子、従業員の態度など評価するというものです)

・行動観察法

以上が代表的な調査方法ですが、主に定量的データを調査する場合の特徴(メリット・デメット)を表にまとめてみました。

「主に定量的データ」を調査する場合の特徴(メリット・デメット)

調査の手法コスト調査に要する時間       調査精度    補 足 説 明
インタビュー法××調査精度を最優先させたい場合に非常に 有効で、その点は大きなメリットとなります。しかし、かなりのコスト・時間が必要になるというデメットがあります。
留置法××調査員によってアンケートに回答した対象者を目視確認できないというデメットがあります。調査結果がインタビュー法よりクリアな差が出ないというデメットもあります。
郵送法×留置法と同様にアンケートに回答した対象者を目視確認ができない、また、回収率が悪くなるというデメットがあります。
電話法長時間の調査に不向きだというデメットがあります。また若年層の在宅率の低さによって、サンプルが高い層に偏る傾向があるというデメットがあります。
インターネット法無作為抽出でサンプリングが行われていないケースの場合、「代表性」という点において、統計学的な裏付けがないというデメットがあります。しかし、補正技術が研究されて、その課題は徐々に解決されているようです。
街頭法調査結果に、代表性がある、とはいい切れないというデメットがあります。しかし、ほぼ実態に近い結果が得られていると推測されます。
CLT街頭調査と同様に、代表性がある、とはいい切れないというデメットがあります。しかし、ほぼ実態に近い結果が得られていると推測されます。

注:◎は非常によい  ○は「よい」  △は「やや悪い」  ×は「悪い」 という意味です。

以上、アンケートの種類によって、特徴は異なってきます。まずは、「何を調査したいのか」という目的を明確にしたうえで、アンケートの種類(調査方法)を決めていかなければなりません。しかし、アンケートを実施する前に「セカンダリーデータを収集して、対象者に関する情報を得る」というステップが必要になってきます。セカンダリーデータとは、「他の目的のためにすでに収集されたデータのこと」を意味しますが、総務省統計局、国土交通省、厚生労働省、内閣府などの国や地方自治体が収集したデータを有効に活用し、その結果、「アンケートを実施しなければ、目的のデータが得られない」ということであれば、その際に、アンケート実施に踏み切るべきです。アンケート実施には、かなりのコストがかかるのです。

さらに最近「ビッグデータ」を活用する動きが活発化しているようですが、ビッグデータの活用でアンケートを実施する必要がなくなる領域も出現してくることでしょう。

5.アンケートの活用事例

アンケートは、数限りなくありますが、主に、国、地方自治体、企業が主なアンケートを実施する主体者です。

企業に焦点を当てると、主にB to C(Business to Consumer)企業において、消費者のニーズ、ウォンツ、満足度などを知るためにアンケートを実施しています。コンビニでは、レジで消費者の年齢・性別を購入品と紐付けて、データを入力し、販売戦略に役立てています。デパート、スーパー、量販店などでは、クレジットカードやポイントカードのデータを基に商圏を調べたり、コンビニと同様に販売戦略を練ってたりしています。しかし、このようなデータのみでは、消費者のニーズ、ウォンツ、満足度などいった定性的(あるいは質的)データを捉えることに困難があります。そこで、アンケートの出番となります。

(1).事例1…スーパー、量販店における消費者満足度調査

お買い物に来た消費者が何を買ったか、については、データが取れますが、品揃え、店舗内の清潔度、店員の接客態度などに対する消費者の満足度といった定性的(あるいは質的)なデータを捉えることは出来ませんので、アンケートへのニーズが出てきます。調査員を介して商品購入後の消費者に満足度などをインタビューすることは、有効な活用方法といえます。

(2).事例2…イベントなどの参加者の満足度測定及び今後の要望把握

コンサート、展示会、講演会、フォーラムなどへの参加者の満足度や今後の要望などをリアルテイムで把握することは、次回の開催する際の課題発見、当日中に修正すべき点発見に有効です。スマートフォンにアンケート画面を出して、リアルタイムで来場者に満足度・要望などを回答してもらうことは、非常に有効な活用方法です。

6.最後に

AIやIT技術を駆使して、人間の行動、表情等から感情を読み取る手法が確立しつつあります。例えば、買った物、お店等に対して好感を持ったのか持たなかったのか、測定できるようになったのです。アンケート調査も大きく変わっていくのだろうと推測されます。

相貌心理学の入門書-人は顔を見れば99%わかる-を読む

人は顔を見れば99%わかる: フランス発・相貌心理学入門 (河出新書)

過日、この本の広告を見て、非常に興味が湧いたので、早速購入し拝読致しました。多くのビジネス書においても、顔の輪郭、目・鼻・耳・唇などの各パーツの大きさ・形状・位置などと性格の関連性に触れていることがあり、人間の顔に興味があったのです。

それで、いきなり本題に入ってしまいますが、「相貌心理学」とは、「1937年、フランスの精神科医でもあり、臨床学者でもあったルイ・コルマンによって、顔と精神(内面)、顔と性格の相互関係を研究対象としてつくり上げれた学問」(本著より引用)です。
要は、1億人以上の顔分析データを集約して理論を体系化し続けている「科学的エビデンスがある学問の1領域である」ということです。

本著は、主に「相貌心理学」の概略が書かれた入門書ですが、この相貌心理学は、顔を3つのゾーンに分けて性格・性質をタイプ分析しますが、

・人事(人員適正配置)
・教育・指導
・人的販売
・営業活動

など多くのビジネスシーンで活用できそうです。また、今後深く研究すべき領域なのでしょう。

スライドバー式回答の活用について

上の図は、スライドバーを活用した回答方法です(マクロミル社様HPより)。

満足度等を測定する場合に、0~100点の間を回答する対象者がスライドさせるという方式です(PCの場合、マウスやタッチパッドで、スマートフォンの場合は指でスライドさせるという方式です)。

メリットとしては、

・回答精度が高まる ⇒ 微妙な点数の回答を得られる
EX. 78点

・回答する対象者へのストレスが軽減される ⇒ 微妙な点数をつけたいが、
納得できないカテゴリーに回答さぜるを得ない
EX.「かなり満足」だが、「大変満足」に回答さぜるを得ない

・感覚的・直感的な回答に向いている

・分布図が見られる(但し、キリのよい数値に固まると想定されますが)

・後処理でカテゴリー化が可能

等が挙げられます。すでに大手通販サイトが出品者・購入品・サービスの満足度
等の評価に関して導入しています。

ただ注意すべき点は、従来の評価尺度との乖離を補正する必要があろうかと考えられます。

以上ですが、対象者にとって楽しく回答してもらうということは、精度向上やストレス軽減にも繋がりますので、このスライドバー式回答法のような方式をクリエイトしていく必要性があると思われます。

ビデオリサーチ社の視聴率の見方について

ビデオリサーチ社では、テレビ視聴率を測定しています。随分昔に、ニールセン、という会社も行っておりましたが、撤退致しました。

さて、ここでビデオリサーチ社が公表している「視聴率ハンドブック/PDF」を拝読しますと、視聴率の大体の概要が記述させています。
http://www.videor.co.jp/tvrating/pdf/handbook.pdf

「視聴率ハンドブック/PDF」によりますと、ビデオリサーチ社が実施している視聴率は、ランダムサンプリングによるものですから、当然、サンプリング誤差があります。しかし、1分ごとの視聴率を番組の長さで割った数値を、平均視聴率として公表しているようなので、「視聴率ハンドブック/PDF」に記載されている誤差よりも実際の誤差は小さくなるものと考えられます。残念ながら、いくつかの値を平均した値の場合の誤差の計算方法は、小社が調べた限り、発見できませんでした。統計を研究なさっている先生に簡易式の計算方法を作成して頂けれると、有り難いです。

ところで、ネットをサーチしていましたら、以下のような記事を発見致しました。
http://biz-journal.jp/2017/05/post_18910.html

たぶん、この記事に書かれている誤差に関する記述は間違いではないでしょうか。確かに記事に書かれているサンプリング誤差はありますが、「視聴率ハンドブック/PDF」に記載されいる誤差の計算方法を用いてはならないと思われます。ビデオリサーチ社も、その点について言及すべきではないでしょうか。ビデオリサーチ社の見解を知りたいところです。

kindle direct publishing(KDP)にtryしてみました!!!!

○kindle direct publishing(KDP)にtryしてみました!!!! 難しいのかなあ、と危惧しておりましたが、うまくいきましたので、まずは、おおまかな流れをお知らせ致します。

1.著書製作(ワード、一太郎、テキスト等の電子媒体で)

2.1で製作されたファイルをkindle direct publishingにuploadするためのファイル(mobiファイル)に変換

3.kindle direct publishing(KDP)にアクセスして、upload(但し、AMAZONのアカウントが必要。もっていない場合は、アカウントを作成)

以上が大雑把な作業フローですが、細かいtaskとして、まずは、EINの取得があります。

                        記

EIN(Enployer Identification Number)の取得

日本に住む日本人の.kindle direct publishingでの売上げは、アメリカ国内での売上げとして計上されますので、印税がAMAZONから支払われる前に米国源泉所得として30%を天引されてしまいます。
日本に住む日本人は、天引される必要はありませんから、アメリカ国民ではない、という届出が必要なのです。この届出の書類が「W-8BENフォーム」で、この書類を作るために必要となるのが「TIN」(米国納税者番号)です。TINにはいくつか種類があり、海外に住む外国籍の人は、「EIN」を取得することになります。

「W-8BENフォーム」は、kindle direct publishing(KDP)のサイトで作成できるようになっていますから、ご安心ください。
必要事項を入力したら、print outして、「Signiture」欄に手書きでサインし、また、あなたのFAX番号を記入してください。日本の国番号は、「81」ですから、この「81」を頭に必ず付けてください。また、市外局番の頭の「0」は省いて記入してください。例えば、東京であれば、

81-3-××××-××××と記入します。

送り先は、1-859-669-5987です。頭の「1」は、アメリカの国番号です。

それで、約1週間ほどでEINの番号が発給され、あなたにFAXで送られてきます。この番号をkindle direct publishing(KDP)のサイトに登録すれば、30%の天引をされずに済みます。一度天引されたお金を後で取り返すのは、大変難しいそうですから、この手続きは、必ず行っておきたいところです。

○主にkindle用のmobiファイルの作り方について、書かせて頂きたいと思いますが、私の場合、日本語縦書の本を出版しようとしておりましたので、

・「ワードファイル」を「一太郎2103玄」で読み込み、

・それから、この「一太郎2013玄」の機能を使って、kindle 用mobiファイルを生成する

といった、最も簡単な方法を採用致しました(一太郎2013玄を持っていなかったので、7,000円ほどの出費になってしまいましたが・・・・)

○本を構成する要素として、本文と表紙があります。本文については、2回目で概略を書きましたが、kindle本においては、本文と表紙は別々のファイルとなり、別々にuploadします。

kindle direct publishingでは、この表紙のことを「マーケティングカバー」と呼んでいます。

マーケッテイングカバーの仕様は、

・jpegファイル or tiffファイル

・推奨する大きさは、縦 2,500ピクセル(最低1,000ピクセル以上)  横 1,563ピクセル
 (縦横比 1.6 : 1)

です。

私の場合、基本的には、お金をかけたくない、という思いがありましたので、既に所有しているソフトやソフト操作力で製作できないか、と考えた末、恐らく品質は落ちることなるかもしれませんが、

マイクロソフト社のPower Point

を活用することに致しました。Power Point2010であれば、pptファイル、pptx.ファイルをjpegファイル or tiffファイルに変換して保存が可能です。

この変換したjpegファイル or tiffファイルをマイクロソフト社officeに付属しているPicture Managerで開き、「画像の編集」を使って、推奨されている大きさに編集致しました。

もちろん、この方法は、Adobe Illustrator(アドビ イラストレーター)やAdobe Photoshop(アドビ フォトショップ)をお持ちであれば、そちらを使用した方がよいと思いますし、他にもフリーウェアも多々あろうかと想定されます。Power Pointの活用はあくまでも代替的だ、という認識を持っておりますので、推奨は致しません。しかし、

・お金がかからない

・私程度の技術力でも作成可能

という点が要諦なのかなあ、と思っております(但し、Power Point2010を所有しているという前提ですが・・・・)。

上記のようにして、マーケテングカバーを製作し、無事upload出来ました。

もっと詳しいことをお知りになりということであれば、下記URL(Amazon Kindle パブリッシング・ガイドライン)をご参照ください。

http://kindlegen.s3.amazonaws.com/AmazonKindlePublishingGuidelines_JP.pdf

○ざっくりとkindle direct publishing(KDP)について書いて参りましたが、基本的には、

お金をかけずに低技術レベルで出版にこぎつけようよ

ということが、その背景にあまりすが、あまりにもざっくりし過ぎていたかもしれません。その点は、どうかご海容くださいませ。

それで、今まで書いてこなかったことで、結構重要だよなあ、というPOINTを列記致します。

1.PR機能としてのKDPセレクト活用

2.売り出す本の価格設定

3.SNS等を活用したPR活動

因みに最近上梓した作品は以下です。

ノンバーバル・コミュニケーションの 活用法

「ワープロソフトを使って、プリントアウトして受け取った手紙は、あまり印象に残らない」という声を聞いたことはないでしょうか?
 
そういう内容の新聞記事を読んだことがありますし、トピック的なインターネット調査でも、同様な結果が出ていたので、誰もがそう感じているのかもしれません。

原因は何なのでしょうか?

1つは、あまりにも普及し過ぎて新鮮味がないからでしょう。もう1つは、情報量が少ないという理由が考えらます。

何故情報量が少ないのでしょうか?

同じ文章をプリンターで印刷したものと手書きしたものとで比較した場合、確かにバーバル(言語)な情報量は同じであるはずですが、実は手書きの方が決定的に情報量が多いのです。ノンバーバル(非言語)の領域の情報も伝えているからです。
字のうまさ・へたさ・丁寧さ・雑さ、字の配置バランスなどから、書いた人間に関するキャラクター、心理状態、手書きによって費やした時間で推し量れる「熱意」などの情報も同時に伝えるからです。

 「人は見た目が9割」(竹内一郎氏著 新潮新書刊)には、アメリカの心理学者アルバート・マレービアン博士の人が他人から受け取る情報の割合についての実験結果が記載されています。

・顔の表情 55%
・声の質(高低)、大きさ、テンポ 38%
・話す言葉の内容 7%
(実験結果は「人は見た目が9割」から引用)

 つまり、人が他人から受け取るバーバルな情報は、わずか7%であり、従って、著者は「人は見た目が9割」と主張しているわけですが、この実験結果を見れば、如何にノンバーバル・コミュニケーションが重要か、ということがわかります。

 手紙の場合は、人と会って話す場合と比べてノンバーバル・コミュニケーション量の割合は当然低くなりますが、それでもプリンターから打ち出したものよりは情報量が多いのです。

 こういうノンバーバル・コミュニケーションの妙を知っていれば、重要なクライントなり営業すべき潜在クライアントなりに直筆による手紙を出すことはビジネス展開において有利になる、ということが理解できます。

しかし、現実問題として時間という制約がありますから、すべてを直筆で書くということは不可能ですが、あなたの仕事の状況やあなたの判断に応じて直筆の手紙をお出しすることをお勧めします。

 あるアメリカの会社の社長は、自分が経営者に向かないとわかっていました。それで何をすべきか、考えた末、毎日全従業員に直筆の手紙を出すことにしました。すると、従業員のモチヘーションが上がり、業績がよくなりました。

直筆の手紙には、想像以上のパワーがあるのかもしれません。