自然界では1から始まる数字が多く、9から始まる数字は少ない…2万件超のデータから判明した不思議な法則 数字は噓をつかないが噓つきは数字を使う
人口統計や河川の長さ、株価、物理定数など人為的に操作できないデータの多くが自身の法則にしたがうとベンフォードは述べた。
逆に、郵便番号やナンバープレートのように人工的に作られたり、身長や体重のように数値範囲が限定されたりしているデータではベンフォードの法則は適用されない。「死」を連想させる「4」から始まるナンバーの車はあまり見かけないし、ほとんどの人の身長(cm)の最高位の数字は「1」である。
ベンフォードの法則の中身が理解できたところで、この法則の歴史と活用例へと話を移したい。
写真=iStock.com/marchmeena29
※写真はイメージです
物理学者の小さな発見が2万件のデータに
フランク・ベンフォードは1910年にミシガン大学を卒業後、ゼネラルエレクトリックという会社に勤めることになる。ベンフォードはこの会社の研究所で物理学者として働いていた。
大きな数字を扱うため、対数表を使っていく中で、ベンフォードはある発見をする。
自然発生的に登場する数値では、最高位の数字が「1」の可能性が高く、「9」の可能性が低いのではないかという発見だ。
ベンフォードはこの傾向に興味を抱き、野球の統計や河川の流域面積、原子量、物理定数、都市の人口、新聞記事に登場する数字など、さまざまなデータを何年もかけて収集・分析した。
イラスト=芦刈将
なんとそのデータ数は20229件。
自然界は比でスケールするデータが多く、彼の発見はベンフォードの法則として形を変えた。類まれなリサーチ力で裏付けされたベンフォードの法則はその意外性も相まって、人々に知られるようになっていった。
ベンフォードによって広まった興味深い法則はのちの社会で応用されるようになる。
Page 2
このほかにも選挙結果を法則と照らし合わせて不正を訴追する例はいくつもある。
Fukusuke『教養としての数学史』(かんき出版)
選挙のような政治が絡む統計においては、ベンフォードの法則に従わなければ疑われ、従いすぎても疑惑を招いてしまうという状態に陥っている。
実際に不正が発覚した事例はほとんどなく、専門家たちはベンフォードの法則の限界を示している。それでもなおこの法則は、不正検出の第一歩を担い、より詳細な調査を求める足がかりとして機能している。
数字は嘘をつかないが嘘つきは数字を使う。
ユーモアと社会風刺に富んだアメリカの著作家、マーク・トウェインの言葉だ。
ベンフォードの数字への熱意から生まれた法則は、数字を悪用しようとする人間を今も監視し続けている。