好记性不如铅笔头

生活点滴, 随手记

【转】本福特定律

本文转自【 https://baike.baidu.com/item/%E6%9C%AC%E7%A6%8F%E7%89%B9%E5%AE%9A%E5%BE%8B/112331?fr=aladdin

CONTENTS

介绍

文名:本福特定律
外文名:Benford’s law
别名:本福德法则
发现时间:1938年

本福特定律,也称为本福德法则,说明一堆从实际生活得出的数据中,以1为首位数字的数的出现机率约为总数的三成。推广来说,越大的数,以它为首几位的数出现的机率就越低。它可用于检查各种数据是否有造假。

本福特定律说明在b进位制中,以数n起头的数出现的概率为logb(n+1) -logb(n)。本福特定律不但适用于个位数字,连多位的数也可用。
十进制首位数字的出现概率(%,小数点后一个位):

首位数 概率
1 30.1%
2 17.6%
3 12.5%
4 9.7%
5 7.9%
6 6.7%
7 5.8%
8 5.1%
9 4.6%

不完整的解释

一组平均增长的数据开始时,增长得较慢,由最初的数字a增长到另一个数字a+1起首的数的时间,必然比a+1起首的数增长到a+2,需要更多时间,所以出现率就更高了。

从数数目来说,顺序从1开始数,1,2,3,…,9,从这点终结的话,所有数起首的机会似乎相同,但9之后的两位数10至19,以1起首的数又大大抛离了其他数了。而下一堆9起首的数出现之前,必然会经过一堆以2,3,4,…,8起首的数。若果这样数法有个终结点,以1起首的数的出现率一般都比9大。

这个定律的严格证明,可以参见Hill, T. P. “A Statistical Derivation of the Significant-Digit Law.” Stat. Sci. 10, 354-363, 1996.。

应用

1972年,Hal Varian提出这个定律来用作检查支持某些公共计划的经济数据有否欺瞒之处。1992年,Mark J. Nigrini便在其博士论文”The Detection of Income Tax Evasion Through an Analysis of Digital Frequencies.”(Ph.D. thesis. Cincinnati, OH: University of Cincinnati, 1992.)提出以它检查是否有伪帐。
推而广之,它能用于在会计、金融甚至选举中出现的数据。该定律被华盛顿邮报上的一篇文章引用,该文章以此为基础声称2009年伊朗总统大选中有造假。
若所用的数据有指定数值范围;或不是以概率分布出现的数据,如正态分布的数据;这个定律则不准确。

发表评论

4 − 1 =

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据