アンケートに必要なサンプルサイズ(人数)はどうやって決める?【便利な計算ツールもご紹介】

サンプル数の決め方

アンケート調査を実施する際に、「いったい何人くらいに協力してもらう必要があるのか?」とお悩みの方が多いものと思います。

これをリサーチ用語で表現すると「どのくらいのサンプルサイズが必要になるのか?」となるわけですが、「サンプルサイズ」のところを「サンプル数」という人も結構多いですね。

サンプルサイズとサンプル数の違い

統計学の本では、母集団から取り出した(=サンプリングした)データの集まりが「サンプル(標本)」で、「サンプル」に含まれるデータの個数が「サンプルサイズ(標本の大きさ)」であると説明されています。

このページでは、正しい用語として「サンプルサイズ」の表記を用いていますが、「サンプル数」のほうがしっくりとくるようでしたら、そのように読み替えてください。

さて、サンプルサイズは、調査結果の精度を左右する要素ですが、このくらいあれば大丈夫という頃合いを見極めるのはとても難しいテーマです。

有効回答数が少なすぎると誤差が大きくなってしまいます。

かといって、大規模な調査をしようとすると、費用がかさんでしまいます。

しかし、これは結構ぜいたくな悩みでもあります。

今日のようにインターネット調査が一般的に実施されるようになる前は訪問面接調査や会場調査が主流で、ちょっとした調査をしようとすると少なくとも100万円、200万円はかかるというのが当たり前のことでした。当時は、結構大手のクライアントさんでもn=50人のアンケートの結果をもって意思決定をするということも珍しくはなかったように思います。

以前に比べると、インターネット調査の普及により、予算による制約は随分と改善されてきていますので、今はその分「誤差」の方にこだわって検討することができます。

そこで、今回は統計学的に信頼に足る調査結果を得るために必要なサンプルサイズを求める方法についてご説明します。あわせて、アンケートの担当になった方に便利に使っていただけるようエクセルファイルで作成したサンプルサイズ計算ツール(ダウンロード無料)もご紹介します。

ポイントその① 無作為抽出

テレビや新聞などで内閣支持率が上がった/下がったというニュースが流れる時に、無作為抽出という言葉を聞いたことがある方は多いものと思います

報道各社から発表される内閣支持率や政党支持率の多くはRDD方式による電話調査で実施されています。
「RDD」とは「ランダム・デジット・ダイヤリング(Random Digit Dialing)」の略で、コンピューターで無作為に選んだ番号に電話をかけて調査する方法です。近年は固定電話を持たない世帯も増えていますので、地域を限定しない全国規模の調査の場合、最近では固定電話だけでなく携帯電話も対象に含めるようになってきています。

このように、調査対象者をできるだけ無作為に抽出することで有権者の母集団における代表性を高めるようにしているわけですが、では、どの程度の調査対象(標本)を集めれば信頼できる結果と考えられるのでしょうか。

ポイントその② 中心極限定理

世論調査などサンプル調査の信頼性の根拠に「中心極限定理」があります。
簡単に説明すると、「無作為に抽出した標本の大きさが十分に大きければ、母集団データがどのような確率分布であっても、(ほとんどの場合)標本平均の分布は母集団の真の平均を中心とした正規分布に従う」ということです。

中心極限定理

母集団の分布は正規分布でなくても、そこから無作為に抽出した標本の平均をプロットすると正規分布に近づくというところがミソです。標本平均が正規分布なのであれば、母集団の真の平均からの誤差について確率的な推計が可能になり、サンプル調査でもある程度の幅をもって信頼できる結果が得られるわけです。
そして、どの程度の標本誤差を許容するかによって必要なサンプルサイズも決まってきます。

ポイントその③ 標本誤差

標本誤差は、一般的な95%信頼度(100回調査を行えば95回は同様の結果が得られると想定)では以下の値以下に収まります。

標本誤差の算出式

なお、

標本誤差の算出式のうち、「1」と置くことができる部分

の部分は、母集団がサンプルサイズに比べ十分に大きければ「1」とし

標本誤差の算出式を簡略化したもの

として差し支えないでしょう。

標本誤差と必要サンプルサイズ早見表

上の式を見ても分かる通り、標本誤差は回答比率が50%の時に最も大きくなります。
p=0.5とした場合、サンプルサイズの違いによる最大誤差は以下のようになります。

標本誤差早見表

サンプルサイズが10,000人であれば、ある質問に対する回答割合が50%の場合、誤差は±1.0%ですので、母集団における真の値は49.0%~51.0%と推定できますが、サンプルサイズが100人だと誤差は10%近くになると考える必要があるわけです。

そして、今度は、許容できる標本誤差を設定した上でサンプルサイズを決める場合、たとえばp=0.5として上の式を変換し、

必要サンプルサイズ計算式

で求められます。

標本誤差早見表

±5%まで標本誤差を認めるとサンプルサイズは384人で済みますが、±2.5%にすると1,537人が必要となります。
標準誤差はnの二乗根に反比例するので、標準誤差を半分にするためにはサンプルサイズを4倍にしなければならないわけです。
実際に調査サンプルサイズを決める際は、費用や時間のコストを勘案した上での現実的な判断が求められてきます。

アンケートの担当になった方用【サンプルサイズ計算ツール】

アンケートの担当になった方用に、エクセルで許容できる標本誤差などの数値を入力するだけで必要なサンプルサイズを計算することができる【サンプルサイズ計算ツール】をご用意しています。

ファイル名をクリックするとExcelファイルをダウンロードすることができます。

◆「サンプルサイズ計算ツール」