GT集計(Grand Total)

回答結果が入力されているリスト(例えば、調査数が100サンプルの場合は100人分の回答が入力されている)をロウデータと呼びます。
ロウデータだけでは、各設問・選択肢の回答比率がどの程度なのか把握できないため、集計をする必要があります。

調査数全体における各設問の回答比率を算出したものをGT(Grand Total)や単純集計と呼びます。%は全体における比率を表し、nは回答個数を表します。
下記概要の調査を実施し、GT集計した結果は以下のようになりました。

調査概要
GT

GTは、調査数全体における各設問の回答比率を確認するだけでなく、調査結果全体の流れを把握する役目があります。
性年代均等割付で回収したデータのため、性別・年代は割付通りの回収になっていることがわかります。東京都と神奈川県居住者が25%で、埼玉県や千葉県よりも割合が高いです。
購入意向は、最も意向が強い「買いたい」と感じている方が2割いることがわかります。ただし。「意向あり・計」が44%「意向なし・計」46%とほぼ同程度と2極化しています。

調査数全体の結果からでは本当にこの商品を発売してもよいか迷いますし、どのような属性からの受容が見込まれるのか?という課題解決には至っていません。

クロス集計(Cross)

GT集計では調査数全体の傾向を把握しましたが、どのような属性からの受容が見込まれるか?という課題を解決する場合など調査課題や目的に応じて、2設問以上を掛け合わせて必要な集計軸を作成し分析を進めていきます。
クロス集計とは設問を掛け合わせることで、各集計軸の特徴を把握するために利用します。

GTで使用した調査のうち、商品の購入意向について、性別・年代別にクロス集計した結果が以下となります。

上記集計からは、性別にみると男性よりも女性の購入意向が非常に高いことがわかります。また年代別にみると、年代が高いほど購入意向が高く、30代以上では「意向あり・計」が過半数を占め、50代の購入意向が最も高いことがわかります。
この商品Aについては、「性別では女性」「年代では30代以上」の属性から受容が見込まれるということがクロス集計の結果からわかります。

多重クロス

上記の結果を「性年代別」(男性20代、女性30代など)で特徴を把握したい場合は、「商品購入意向」について「性別」と「年代」を掛け合わせる必要が出てきます。3つの設問を掛け合わせて集計するためこの場合は3重クロスと呼ばれます。掛け合わせる設問数が3設問以上になった場合を、多重クロス集計と呼びます。

調査設計時に、多重クロスを実施する想定でサンプル数を潤沢に集めている場合はよいのですが、多重になればなるほどセグメントごとのサンプル数が減っていき、分析可能数を下回ってしまうことがあるため注意が必要です。

分析を進めていくうちに回答データを細分化し、さらにコアな受容層を把握したくなるかもしれません。
例題においては、「性年代別」の3重クロスまでは、調査数が分析可能数(30サンプル)以上確保することができますので問題はありませんが、「東京都在住女性40代」における商品購入意向を集計しようとすると、調査数が30サンプルを下回ることになってしまい、有効な統計結果を得ることができなくなります。
「居住地」×「性別」×「年代」の集計軸が必要なのであれば、それに応じた調査全体のサンプル数が必要になります。

調査設計の段階で、調査サンプル数と集計軸を検討することは大変重要になります。調査全体のサンプル数は、分析に必要な集計軸の調査数が確保できるかを視野に入れて決定しておくことが必要になります。

アンドディへのお問い合わせ

こちらからお気軽にお問い合わせください。

お問い合わせ