公開データのサーチから一歩進んだリ・サーチには経験とコツが必要
あなたは上司から「〇〇に関するデータを集めておいて」と頼まれました。
社内には該当するデータがないのでインターネットで検索してみますが、やはりピンポイントのデータは見つかりません。
その場合、とりあえず時間をかけ関連しそうなデータを片っ端から集めてそのまま提出するのではなく、一度立ち止まって上司にデータ収集の目的を再確認し、データ探索の対象を絞り込んだ上で欲しい情報にできるだけ近い形に編集してから渡してあげるべきでしょう。
公開データのサーチは誰にでもできそうに思いますが、データの意味合いを理解した上で図表化を含めて適切かつわかりやすく加工するリ・サーチには一定のスキルが求められます。
日々の業務のかたわら時間をかけて悪戦苦闘するよりは、外部の専門家に依頼した方が効率的なケースも多いのです。
官公庁の統計や団体等の公開データは宝の山
新聞やニュースでは毎日のように統計データを目にします。
ふだんマスコミ発表の数字はそのまま受け止めていることが多いかもしれませんが、もし仕事上でそのデータを使うとなれば、きちんと出典を確認して元データをチェックすべきでしょう。
例えば、企画書や報告書作成などで3CやPEST分析などマクロ的な市場環境や業界トレンド分析を行う際、人口や普及率などの基礎データは出典がはっきりした公的機関の統計情報を使うことが多いことと思います。
官公庁の統計データでしたら政府統計ポータルサイト「e-Stat」でだいたい探せますし、公開されているデータの種類も膨大です。
また、文献を含めた業界動向を調べる際には国立国会図書館の「リサーチ・ナビ」が役立ちます。
一つ一つの統計について集計結果の数が多いので、目的とするデータを見つけるのも大変ですが、いろいろ探しているうちに思いもかけなかった興味深いデータが見つかったりすることもあります。
一企業が実施するには荷が重すぎるような規模やテーマの調査データが公開されているわけですから、積極的に利用しない手はありません。
1次データと2次データ
ある新商品の市場規模を測るために、消費者の購入・利用意向を知りたい、という場合、その目的に一番適うのは自社でリサーチを実施することでしょう。
このように特定の目的のために新たに収集されるデータを「1次データ(Primary Data)」といいます。
それに対し、官公庁の統計や団体等が提供しているような既存データを「2次データ(Secondary Data)」といいます。自社内のデータであっても、例えば他商品の販売データなどの既存情報は2次データとなります。
2次データは「新商品の市場規模を測る」といったピンポイントの目的を果たすには不十分かもしれませんが、ターゲット層の人口分布や類似商品の販売データなどは十分参考にできるでしょう。
2次データを収集・加工するデスクリサーチも立派なリサーチ
一般的に1次データの収集、すなわちリサーチの実施は費用と時間がかかると思われていますが、調査手法やサンプルサイズなど企画次第で10万円程度から集計・分析まで1~2週間のリサーチも可能です。
従って、欲しいデータが得られるかどうかわからない状態で無闇に2次データを探し回るくらいなら、小規模でもリサーチを実施してさっさと1次データを収集する方が効率的ともいえます。
一方、2次データの収集を中心としたデスクリサーチでは欲しい情報が十分に得られないと思われるかもしれませんが、同じデータでも見せ方や加工次第でアウトプットの価値を高めることができます。
さらに、足りない情報については、現地フィールドワークや関係者ヒアリングなどを実施して補完することも可能です。
ただ、使える2次データを探し出すのは根気とテクニックが必要ですし、政府統計サイトに載っているようなデータは必ずしも使い勝手がよいとは言えず、欲しい情報の形に加工するためにはそれなりに手間がかかります。
ここで、2次データの簡単な利用例として、総務省「家計調査」データをみてみましょう。
5月の家計調査について元データを確認する
7月7日(火)の日経電子版で以下の記事がありました。
『消費支出、5月16.2%減 減少幅は最大』
総務省が7日発表した5月の家計調査で2人以上の世帯の消費支出は25万2,017円と、物価変動の影響を除く実質で前年同月比16.2%減った。減少率は比較可能な2001年以降で最大。4月に続き過去最大を更新した。
政府は4月に出した緊急事態宣言を、5月14日に39県、同25日に全国でそれぞれ解除したが、4月からの外出自粛や買い控えの基調は5月も続いたものとみられる。昨年5月は10連休の効果で消費が押し上げられ、その反動も大きかった。
全国で緊急事態宣言が解除されたのは5月の最終週でしたし、一部の業種の営業や他県への移動は自粛要請が続いてましたので、5月は消費低迷が続いていた、というのはその通りでしょう。
こちらは総務省「家計調査」の結果とのことですので、見出し部分の
・消費支出、5月16.2%減・・・「2人以上世帯」の「実質」の「前年同月比」のデータをチェックする
・減少幅は最大・・・「2001年以降」の「2人以上世帯」の「実質」の「前年同月比」のデータをチェックする
が正しいかどうか、念のため政府統計サイトで元データを確認してみましょう。
総務省統計局「家計調査」のページにいくと、トップ画面で
<最新結果(二人以上の世帯) 2020年5月分・時系列データ>
という項目があります。
まず、「2020年5月分」をクリックすると以下のページが表示されます。
表の右上の5月の数字を見ると、確かに「2人以上世帯」の「実質」の「前年同月比」の消費支出は「▲16.2」となっています。
ちなみに、その下のカッコ内の数字は前月比(季節調整値)のデータで、4月からは0.1%減だったということです。
次に、トップ画面に戻って
<最新結果(二人以上の世帯) 2020年5月分・時系列データ>
の「時系列データ」をみてみましょう。
月別の「実質増減率」について2000年1月~のCSVファイルをダウンロードします。
ファイルを開くと、「消費支出」の項目は2001年1月以降のデータが入っていました。
データの羅列では見にくいので、時系列でグラフ化してみます(下図)。
図を見れば一目瞭然で、5月の減少幅(-16.2%)は、比較可能な2001年1月以降で最大であることが確認できました。
なお、2015年3月の減少幅(-10.6%)も大きいですが、これは前年3月の消費税引上げ(8%)前の駆け込み需要の反動減と考えられます。
一方、2019年9月は翌月の消費税引上げ(10%)前の駆け込み需要もあって、2001年1月以降で最大の上昇幅(10.5%)でした。このことから、今年9月のデータは消費の反動減がキツイことが予想されます。
前年同月比のデータを見る際は、下図のように1年前の数字と重ねてみると解釈しやすくなります。
5月の消費の落ち込みは、確かに新型コロナウィルスによる外出自粛や買い控えの影響が大きいでしょうが、前年5月との比較である点も留意しなければなりません。
昨年5月は改元で10連休となり消費が伸びたこともあって、その反動で減少幅が増幅された面もありそうです。
また、細かい点ですが、5月最終日の31日が日曜日であったため、月末払いが6月1日に延びた分、5月の支出が減ったこともあるでしょう。
いかがでしょうか。
政府統計の中ではメジャーで比較的扱いやすい「家計調査」の中で、よく参照される「2人以上世帯における実質消費支出の前年同月比」という一例だけを取り上げてみましたが、元データに当たって自分でいろいろ加工していくと、自然と気づきが増えて解釈の幅も広がってくるかと思います。
家計調査には、1世帯当たりの品目別年間支出金額・購入数量といった項目もあり、地域別に比較すると面白い傾向が見られたりしますので、興味のある方はご自分で調べてみてください。
〇統計データの調べ方~宇都宮市 vs. 浜松市 ギョーザ購入額が多いのはどっち?
2次データ利用の際の注意点
政府統計などの2次データは積極的に活用していきたいところですが、1次データと異なり自分が欲しい情報に合わせて収集されているわけではありませんので、利用する際にはいくつか注意が必要です。
ここでは以下の3点を挙げておきます。
■調査概要を確認して統計数値の意味合いを理解する
■できるだけ複数のデータソースを当たる
■複数の統計を比較する際は、調査時期や単位の違いに留意する
調査概要を確認して統計数値の意味合いを理解する
その統計調査がどのような目的で実施されているのか、調査方法、対象者は誰か、サンプルサイズ、質問内容(調査票)といった概要を一通り確認しておきましょう。
特に公表されている統計数値が指数化されている場合は、その算出方法もチェックしておきたいです。
政府統計でしたら、以下の家計調査の例のように調査概要を詳しく確認できます。
できるだけ複数のデータソースを当たる
同じような調査目的の統計でも、調査方法の違いなどによって結果が変わってくることがあります。できるだけ多くの統計を当たり、それぞれの調査概要を確認した上で利用するデータを決めるようにしましょう。
また、自分が欲しい情報にピンポイントで合致する2次データが見つからない場合でも、関連しそうな統計をいくつか集めて総合的に判断することは可能でしょう。
例えば、家計調査は消費実態を表す統計の一つですが、販売サイドの実態をみる「商業動態統計」、あるいは実態ではなく消費マインドを探る「消費動向調査」や「景気ウォッチャー調査」などを合わせて見ることにより、消費の現状や今後の動向に関する理解が深まるかと思います。
複数の統計を比較する際は、調査時期や単位の違いに留意する
政府統計の中には、毎月行っているものから国勢調査のように5年おきに実施しているものまで、調査の実施頻度はさまざまです。
また、データ公表のタイミングは同じようでも、調査の実施時期はだいぶ異なることもあります。
一般的に、政府統計は発表が遅いようなイメージがありますが、経済統計は速報ニーズも高いのでかなり頑張っています。特に毎月実施している「景気ウォッチャー調査」や「消費動向調査」は調査実施から半月後くらいまでには結果が出されています。
関連する複数の統計について、グラフ化して並べて比較したりすると解釈も深まりますが、その際には調査時期を揃え、数値の意味合いの違いも押さえておくようにしましょう。
消費動向に関して毎月実施しているいくつかの政府統計について、期間を揃えて作成した時系列チャート集をご紹介していますので、興味のある方はご覧ください。
【次はこちらもおすすめ】