誰もが一度は経験する単純集計の応用とクロス集計との関係性

1.単純集計とは
マーケティングリサーチ業界における「集計作業」とは、アンケート形式などの調査で得られたデータを集約・加工して、パーセントや数値などに置き換えて集計表を作成することを指しますが、データ全体の集計結果を「単純集計」(Grand Total)と呼んでいます。マーケティングリサーチ会社内部では、概ね「単純集計」を「G.T.」(ジー・ティ)という略語で表現しています。「マージナル・トータル」(Marginal Total)と呼んでいる会社もありますが、略語が「M.T.」となってしまい、Multiple Answers Total(複数回答合計)や Magnetic Tape(磁気テープ)などと判別がつかなくて、誤解の原因になる場合がありますので、会社内部では「G.T.」を使用した方がよいようです。

2.クロス集計との関係性
マーケティングリサーチ業界におけるクロス集計とは、分類項目別に回答結果を集計することです。地域別・性別・年齢別・職業別などのデモグラフィック(基本属性)別が代表的なクロス項目です。

このクロス集計のベースは単純集計です。単純集計結果の数値を見て、クロス集計する意味の有無が判断できます。一般的に、クロス集計を行う場合、以下のようなステップを踏みます。

・単純集計のアウトプット

・単純集計結果の精査

・クロス項目(表側項目)の決定

・クロス集計実施

以上は、基本的なステップですが、「単純集計の精査」の段階は重要です。例えば、性別のクロス集計を行おうとする場合、全体のnが100で、男性n=10、女性n=90だとした例においては、「性別による差は見られない」と考えるべきで、「性別のクロスの意味はなく、性別のクロスは行わない」という決定が下せるのです。クロス集計を行う場合の目安として、クロス項目の各カテゴリーのnは30以上とされています。n≧30ですと、標本誤差が急激に小さくなる、という統計学的な根拠があるからです。n≧100以上あれば、さらに望ましく、理想的である、と主張している統計学者もいますが、簡単にいってしまえば、nは大きければ大きいほどよい、ということです。しかし、n≧30は絶対的な基準ではなく、予算・調査期間等の関係で充分なnが確保できない場合があり、n≦30でクロス集計を行わざるを得ないケースも多々あります。そのような場合、標本誤差を念頭に置いて分析すべきでしょう。

しかしながら、クロス集計の実務においては、地域別、性別、年齢別、職業別などのデモグラフィック(基本属性)については、作業効率を上げるために、あらかじめクロス項目として機械的に決定されている場合がほとんどのようです。

既述していますように、単純集計はクロス集計のベースとなっていますが、実際、単純集計のみでクロス集計は行わない、というケースは、ほとんどありません。必ずクロス集計は行われる、対になっている、と考えるべきです。デモグラフィック別などで、どうしてもパーセントなどの数値を見なければ、マーケティング戦略立案に必要な分析が出来ない、という事態が発生するからです。従って、クロス集計に耐え得るnを確保することを心掛けて、データを収集しなければなりません。

3.より複雑な定量調査へ
マーケティングリサーチ会社は、恒常的に定量調査を実施していますが(定性調査専門のマーケティングリサーチ会社は別ですが)、必ずといってよいほど単純集計とクロス集計がアウトプットされています。
クロス集計項目については、調査の目的などによって異なりますが、基本的には、デモグラフィック(基本属性)別クロス集計がメインとなっています。これらのデモグラ分析に加えて、必要に応じて質問間クロス集計(質問同士のクロス集計)や独自に開発して作成したアイテム(分析軸)を使用する場合も多々あり、性・年齢別などいった多重クロス集計(Multiple Cross Tabulation)も行われますが、「何と何をクロス集計するのか」「どのような独自開発のクロスアイテム(分析軸)を作成するのか」という点は、各マーケティングリサーチ会社の分析ノウハウということになります。
しかし、クロス集計結果で、分析に限界があったり、課題を解決できなかったりする場合には、多変量解析を行うこともあります。が、調査企画段階から多変量解析を行う、と決定していた場合には、多変量解析を想定した調査票作成がなされます。

4.まとめ
ここまでは、マーケティングリサーチ会社における、専門性の強い単純集計、クロス集計、両者の関係性を書いてきましたが、両者は必ずしもマーケティングリサーチ会社のみで利活用されている訳ではなく、日常生活の中でも盛んに使われています。

例えば、ある小学校の平均身長を見る場合、学年別、性別、学年・性別で集計される、と想定されますが、この場合も、単純集計、クロス集計が行われるのです。小学校全体の平均身長を算出するという単純集計が行われた後、学年別、性別といったクロス集計が行われます。さらに学年・性別といった多重クロス集計も行われます。平均体重についても同様な作業が行われることでしょう。それぞれの学年の学力を客観的に見ようとする場合においても、算数、国語、社会、理科などの平均点を学年全体、クラス別、クラス・性別でクロス集計するものと想定され、あるクラスだけ極端に平均点が低い場合は、その原因が究明されることになると思われます。まさにマーケティングリサーチにおける課題発見のクロス集計と同じです。

このように単純集計とクロス集計は、身近なところでも応用されており、その事例は枚挙に暇がありません。生徒会長や学級委員長を投票で決める場合も、票の積み上げ、という単純集計を応用しているといえますし、好きな給食ランクキングも単純集計応用の結果であり、性別で見れば、クロス集計応用の結果であり、学年・性別で見れば、多重クロス集計応用の結果ということになります。一般的な定量調査と異なる点は、サンプリング調査ではなく、全数調査という点のみでしょう。

また国などの行政機関が実施している全国規模の定量調査においては、必ず国全体の数値を表す単純集計と地域別などのクロス集計が行われています。必要に応じて多重クロス集計も行われます。
例えば、日本最大規模の悉皆調査である「国勢調査」においては、単純集計(全体)のみならず市町村別やそれ以外の分類項目別でクロス集計が行われ、行政機関、民間企業、調査・研究機関、マーケティングリサーチ会社などで利活用されています。
外国人観光客数に関しても、全体の客数と都道府県別、国別といったクロス集計が行われて、発表されています。
各地方自治体で行っている町丁目別住民数の算出についても、「町丁目別」は、クロス集計項目の1要素であり、町丁目別住民数を積み上げて地方自治体全体で見れば、その地方自治体の人口の単純集計といえます。

このように単純集計、クロス集計は、データが数値化可能な調査においては、絶対といってよいほど用いられているのです。マーケティングリサーチ会社が行う定量調査に特化した分析メソッドではなく、日常生活を送っている人々に深く関わっている数字を解釈するための手法なのです。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)