二八法则,又名 80/20定律、帕累托法则,是19世纪末20世纪初意大利经济学家帕累托发现的。他认为,在任何一组东西中,最重要的只占其中一小部分,约20%,其余80%尽管是多数,却是次要的,因此又称二八定律。

帕累托分布(幂律分布)和高斯分布 (正态分布) 并列为两大主导自然和人类现象的概率分布。

打开网易新闻 查看更多图片

一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布,如同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量,等等。高斯分布的本质是独立性 (independence),大量同质独立事件将导致高斯分布 (由大数定律保证)。高斯分布(正态分布)意味着“中间群体”占大多数(70%-80%),过高或者过低的“特殊群体”占少数(20%-30%)。

打开网易新闻 查看更多图片

帕累托分布广泛存在于物理学、地球与行星科学、计算机科学、生物学、生态学、人口统计学与社会科学、经济与金融学等众多领域中,且表现形式多种多样。帕累托分布的本质是正反馈机制 (positive feedback loop)。 当事件不再独立(① 事件之间通信成本降低;② 事件之间的作用力增强),一个事件的产生对自身和其它同质事件的产生发生影响时,会导致帕累托分布。帕累托分布(幂律分布)意味着头部的“少数群体”(约20%)占据了“大多数资源”(约80%)。

而按照“系统论”和“系统动力学”的观点,万事万物都有相关性,独立只是相关性趋近于零的表现[3],所以幂律分布(对应于二八法则)比正态分布更为普适,后者只是前者的特殊表现——当相关性较小甚至于趋近于零时。

人类社会是一个有序的、自组织的、普遍联系的系统。在相对有序、彼此关联的人类社会,就会发现“二八法则是如此普遍的现象”。互联网、智能手机等工具将事件之间通信成本降低,同时也将事件之间的作用力增强,这使得更多的事件不再独立。

打开网易新闻 查看更多图片

接下来我们来看中国的GDP和国土面积分布是否符合二八法则?

中国当前有34个省级行政区(含港澳台),333个地级行政区(含台湾省9个)。

中国当前国土面积960万平方公里,2018年底GDP 90万亿(不含港澳台3地)。

验证一、省级GDP排行

按从高到低累计计算GDP占比,前3占30%,前7占50%,前12占70%,前16占80%。表面看起来距二八法则有很大距离,按二八法则20%的省份应占80%,现在30%前7只占了50%。

打开网易新闻 查看更多图片

考虑到直辖市的划分实际上是对个别市的特殊对待,现在将直辖市合并进临近省份观察(上海合入江苏,重庆合入四川,北京天津合入河北)。

打开网易新闻 查看更多图片

合并之后前9名占了70%,基本实现了三七法则,即30%的省份占了70%的GDP。

验证二、 市级GDP分布

考虑到直辖市对省级排名的干扰较大,我们将直辖市与地级市合并观察。

328个地级市前20%的数量66,前30%数量98.

市级统计结果GDP达到70%的城市累计数量为86,接近30%。所以在中国的GDP分布上呈现出的是三七法则,而不是二八法则。

我们知道当大量同质独立事件是符合正态分布的,完全正反馈的事件是符合二八法则的。而中国GDP的分布则是自然资源、行政规划、市场因素等诸多杂合而成的结果,所以并不严格符合二八法则而弱化为三七法则。

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

验证三、省级国土面积分布

不计算港澳台,31个省份的30%前9国土面积71.3%,非常严格的三七法则。

打开网易新闻 查看更多图片

验证四、市级国土面积分布

市一级领土面积累计到70%时市排名为76,约占市总数的23%。市排名到30%时国土面积累计到了75%,比省级的累计要大。猜测是市一级所受的干扰较少,更容易向二八法则靠近。

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

验证五、世界GDP分布

2018年GDP数据中10%的国家(前20名)占据了80%的GDP,其中5%的国家(前20名)占据了70%的GDP,再其中1%的国家(前2名)占据了40%的GDP。比二八法则还要集中得多。前18%的国家占据80%的国土面积。

打开网易新闻 查看更多图片

验证六、世界领土面积分布

地球半径6371KM,表面积S=4πR2 =5.1亿平方公里。地球表面积中71%是海洋,29%是陆地(不知道为什么又是接近三七法则)。陆地面积约1.5亿平方公里,南极洲1400万平方公里除外全世界约200个国家占据1.36亿平方公里领土。

世界领土面积的分布基本符合二八法则。

打开网易新闻 查看更多图片