ベンフォードの法則

新聞を見ると、日付や天気予報(降水確率や最高・最低気温)、内閣支持率などの世論調査、企業業績や株価・為替相場などの経済指標、スポーツの記録や宝くじの当選番号など、紙面にはさまざまな種類の数字が載っています。

これらの数字だけピックアップして分布を調べてみたらどうなるでしょうか。

新聞紙上の数字だけでなく、川の長さや面積、あるいは人口や公共料金の請求額などといった幅広い自然・社会現象でみられる数字は、1から始まる数が最も多く、先頭の数の分布には一定の規則性があることがわかっており、ベンフォードの法則とよばれています。

Nから始まる数字の出現確率は

で、エクセルの関数式で簡単に求められます。
N＝1の場合はlog(2)＝0.301029…ですので、1から始まる数の出現確率は30.1%となります。同様に9までの分布は以下の通りとなり、1または2から始まる数字だけで半分近くに達することがわかります。頭で考えるともう少し均等に分布していそうにも思いますが、日常で目にする数字を思い浮かべると何となく納得できる気もしますね。