首先,对统计局的同志们说一声辛苦了,虽然比预计的时间足足晚了一个月,但鉴于数据的庞大,以及精准性,慢工出细活还是很有必要的。
毕竟人口普查对今后中国经济发展,有着至关重要的指导意义。
不过我有几处数据不能完全对上号,看看有没有专业一点的小伙伴可以给我传道授业解惑的。
需要强调的是,一定是我错了,只是不知道错在哪里,大家帮帮忙看一下。
1. 新生人口数据不匹配
根据统计局给出的数据,0-14周岁的人口有25338万人,占总人口的17.95%。
也就是说从2006年到2020年出生的人口一共是25338万人。
那么2006年到2020年出生人口分别是多少呢?
统计局早就给了我们明确的数据:
前者是统计局的历年数据,后者是第六次人口普查修正的数据。
然后统计局表示,2020年新生人口是1200万。
好了,我们可以简单地做个累加,这15年里所有的新生人口加起来一共有23780万人。
但是第七次人口普查给出的数据却是25338万人,中间差了1558万人,偏差达到6.55%,相当于有完整的一年没有统计进去。
我想知道的是,这么大的数据偏差是怎么来的。
如果你再去对应15-59岁这个年龄段,一样可以发现这个问题,六普和七普有着巨大的数据鸿沟。
这不禁让人质疑,究竟是哪次统计有问题,还是两次都有问题?
有人说,这可能是黑户和死亡人口导致。
咱不敢说中国医疗水平有多发达,但新生儿童的死亡数量,从大数据的角度看,比例一定是相同的,所以每年的新生人口数量中,已经覆盖了死亡人口,这个不能说明问题。
至于黑户,这是有可能的,因为中国是在2015年全面放开二胎,也就是说从2006到2015年这十年里,存在一定数量的瞒报问题。
到了2015年以后,这些黑户开始陆续有了身份,然后到了2020年七普的时候一起暴露了出来。
那么我们依然从大数据角度做个简单的算术平均,差额1558万,相当于每年有155.8万的黑户没有身份,接近每年新生人口数量的10%。
难以想象,在2006年到2015年间,中国居然每年有1/10的儿童居然是没有身份的黑户?!
太不可思议了。
2. 15-59岁的人口比重的数据偏差更大
15—59岁人口为89438万人,占63.35%,与2010年相比下降6.79%。
这个年龄段的人口为什么会下降呢?
因为老去的人远比新生的人要多,一来一去,这个段位的人自然就减少了。
也就是说,在2010年六普时,50-59岁的人升级为2020年七普的60岁以上;同时5-14岁的人升级到15-59岁。
前者减去后者,就是15-59岁段位减少的人数。
那么这个差额是多少人呢?
根据统计局给出的数据,下降6.79%以后是89438万人,再通过熟练的四则混合运算,我们可以轻易地算出,这个差额是6515万人。
老夫作为灵魂画手,画了一张直击灵魂深处的巨作,更直观的表达这层含义。
用这个段位作为标的的好处是,你不用去考虑什么出生率的断崖,也不用考虑死亡率的激增等社会现象,只要根据前后数据的加减,就能得出一个很精准的数字。
接下来就是简单的搬砖环节了,我们把六普中5-14岁,也就是1996-2005年出生的人口,和50-59岁,即1951-1960年出生的人口分别累加,然后做个差值即可。
1951-1960年出生总人口为20724万人;
1996-2005年出生总人口为14961万人。
相差5763万人,与2020年七普给出的6515万人相差了752万人,反而比公布的数据要少了。
但实际上用最傻的办法,2010六普中15-59岁的人口全部加起来,是98582万人,相对这次官方公布的89438万人,差了接近9144万,接近10%的偏差。
这么大的差距,恐怕就不能再用黑户可以解释得通了。
实际上如果大家有心去把六普和七普的数据一一做个对比,会发现不少地方都有比较大的差距,具体什么原因咱就不清楚了,或许这也是为啥统计局晚了一个月搞发布会的根本原因吧。
只可惜,公布的数据和之前的比较,并不能完全一一对应,真是让人疑惑。
哦,当然,统计局表示“不存在数据修正的情况”。
今天这文章就是把新闻发布会上,统计局公开的几个数据,拿出来2个分析了一下,纯粹是数学分析,不存在对政策看法或者引申。
至于别的数据我也没认真地去做对比和计算,感觉意义不大了。
话又说回来,这么大的统计量,有一定误差是正常的,只是这个误差如果太大的话,就很难有说服力。
也有可能是我的计算哪里出了点问题,导致这样的结果,也无可厚非。
我相信统计局的同志们一定比我专业多了。
今天就先这样吧,明天让我们认真分析一下,就这些公开的数据,里面蕴含着哪些值得关注的地方。
比如,房价还会不会涨……
公众号:七叔东山再起
茶余饭后,酒足饭饱,时事政治经济,深度解剖,看这就足够了。