这次想讲一个关于数据的话题,主要还是因为这个东西对于我们日常,不管是看财经新闻也好,还是看一些经济问题的分析文章也好,都非常重要。因为谈经济问题离不开数据,但经济数据从统计的环节开始,就是一个需要大量人为主观取舍判断的东西。


它不像物理学数据,你量一个跑道的长度,100米就是100米,你不会说这个跑道长度还要有季节性调整,或者说还有什么统计口径的问题,现在的100米跟20年前的100米不是同一个100米。这个是大部分自然科学的特点,就是它在测度(这个概念很重要)的环节争议不会特别大,虽然不是没有(争议),但是社会科学,你从测度这个环节开始,就有大量的主观判断成分在了。


单纯的别人给你什么数据你就信什么,很容易上当受骗,这就是我标题取名为“数据的陷阱”的原因。如果说经济数据有什么真的需要被注意的地方,那绝对不是怎么分析数据,而是数据有没有陷阱,有没有被人为因素扭曲的问题。


所以,我希望开这么一个系列,来谈谈经济数据本身的问题,当然我也会讲如何理解和分析数据,但是我讲完之后你可能就会发现,相比于如何分析数据,知道数据是怎么统计来的重要得多得多。


另外一个,讲数据也是希望给大家传达一个方法论,就是聊经济问题,一定要定量地聊,不要定性地用感觉去聊。


最常见的,我们总说今年经济不好,未来经济不好等等,但这个好不好,都是一种感性的说法,到底啥叫好或者不好呢?GDP增长5%是不好,还是增长3%是不好?现在大家都悲观地认为中国经济要像日本一样长期停滞了,但其实你自己去看看2003年、2004年的财经新闻,那一轮大熊市的时候就已经开始有很多人说中国经济要长期停滞了。


每一轮经济衰退的时候大家都在感觉上觉得不好了,经济不行了,但是你一个人的感觉是测度不了整个经济体的状态的,所以我们要树立这么一个方法论的观念,就是经济问题不能离开数据去聊,不能完全定性地去聊,要定量地聊。


一、什么是GDP?


那我们这开篇,不用说,得讲讲GDP的问题。GDP的重要性不用多说,但同时市面上对GDP的错误理解和GDP本身的重要性一样重要,就是错误理解太多了,需要拨乱反正的东西太多了。


首先是名字的问题,GDP的英文是“Gross Domestic Product”,翻译成“国内生产总值”,这个“国内”和“生产”翻译的没啥问题,主要是Gross翻译成“总值”,这个有点问题。


Gross这个词,在英文中,并不是那种严格的数据意义上的“加总”的概念,数学上的加总在英文中是啥?是Sum这个单词。那么Gross在英文经济领域一般是指什么呢?其实是对应中文“毛”这个概念,Gross对应的是Net,对应的是“净”,比如说中文“毛利润”,就是对应英文Gross profit。那么中文“净利润”,对应的就是Net profit。所以Gross这个英文,你与其说是“总和”,不如说是“毛利”的概念。


那么毛利是啥?一般来说,就是你卖一个东西,得到的收入扣除掉你做这个东西用的原材料成本的钱,最接近毛利。当然,我们说“最接近”不是“完全等于”,但毛利这个数最接近的就是一个产品的价值扣除掉原材料成本的价值。


那这里其实就呼之欲出了,Gross这个概念是增加值,就是你拿一个5元的原材料加工一下,能卖15元,那么你的增加值是10元,那个5元我们叫中间产品,这也是大部分教科书会告诉你的,GDP核算要扣除中间产品的意思。所以我们更精准地翻译GDP,其实应该是“国内生产活动得到的增加值”


提这个区分,主要是因为在经济数据统计中我们还经常能看到一个词叫“总产值”,我们刚建国的时候不统计GDP,统计的就是总产值,你看很多地方写共和国经济史的数据,在计划经济时代用的都是总产值这个数,不是GDP,而且你会发现现在有很多国企还在统计总产值这个数。总产值就是不扣除掉中间产品的价值,你生产了1万元的冰箱,那总产值就是1万元,不管你用了多少元的原材料,哪怕你用了2万元的钢铁,你最后生产了一个价值1万元的冰箱,你的总产值也是1万元。


所以我们看到,相比于总产值,很显然,统计增加值,也就是GDP更合理一些,因为总产值有大量重复计算的问题,是一种非常粗糙的对生产活动的测度方式。但这里我们也能看出来,这么粗糙的测度方式,居然在离我们还不远的几十年前是一个国家赖以进行经济决策的关键数据,所以你想一想那时候经济管理的粗糙程度,这就是我们说测度这个问题的重要性。


当然,即使在国际上,GDP统计的普及也是二战之后的事了。


二、“提高消费占GDP的比例”这句话错在哪儿?


上面我讲了第一个总产值和增加值概念的区别,很显然现在统计的GDP比过去多年统计的总产值数要合理得多。那么第二个我想讲的关于GDP的问题,其实在以前的播客和很多场合我都讲过了,就是GDP统计的是生产活动,不是大家在市场上买卖交易的那个活动。这个问题主要指向大家天天喊的“提高消费占GDP的比例”这句话的错误。


这里我再简单重复一下这个逻辑,GDP统计的是生产,它里面所谓的消费和投资的划分是指生产了多少消费品和投资品的划分,如果你想提高消费品的生产,那么你肯定要同步地盖厂房,建造生产线,这些都是要统计到投资里面的,所以说这个世界上不存在单独提高消费品占比的情况,因为你提高消费品的生产,一定会同步提高投资品的生产。消费品的产量可以提高,但是消费品占GDP的比例是不可能提高的。因为你提高消费品的绝对金额一定会同步提高投资品的决定金额,那么你消费品占比的提高只有一种可能,就是投资品生产的减少导致了消费品占比的被动提高。我们看到的发达国家消费占GDP高其实就是这个原因导致的。


所以这里要意识到,所谓消费占GDP比例提高和我们老百姓提高消费力没有任何关系,我们老百姓多消费体现的数据是社零数据,社会零售品消费那个数据。而且你自己去看一下那个数据就会发现我们社零高的时候,恰恰都是投资占GDP比例高的时候。所以这个网上多年流传的错误说法,我看到目前即使是很多所谓专业人士也没闹清楚这个逻辑,都没好好看社零数据和消费占GDP比例的相关性,就一股脑地人云亦云了。


三、GDP是怎么统计出来的?


接下来我们说第三个问题,就是GDP是怎么统计出来的。这个可能很多人会好奇,这些资料是哪来的?怎么就能把这么大国家的所有生产活动都统计进去了呢?事实上也做不到真的全都统计出来,其实大量数据是推算出来的,后面我们再讲。


我们先说原始数据有哪些,一个是统计局的调查资料,就是统计局会去各行各业做调查,当然很多是抽样调查。第二个是国务院各部委负责管理的行业的数据,比如交通部肯定要管交通行业,央行或者金管局要管银行业,那么他们肯定会统计很多行业本身的资料,这是第二大来源。第三个就是财政数据,这个不用说了,财政收入支出的数据也是重要的原始资料。


我们知道,GDP有三种统计方法,生产法、收入法、支出法。那么实操上,我们主要是用收入法和支出法两种方法统计,只有一个行业目前是用生产法统计,那就是农业,主要是因为生产法在实操上太麻烦了,统计中间投入太麻烦了,农业的话因为基本上没有什么中间投入,都是劳动力种地,这都不是中间投入,所以相对好统计一些,所种即所得。


除了农业以外的其他行业都是用收入法统计的,收入法特别简单,让企业去填个表就行了,甚至都不用企业填,你根据企业的原始财务报表去稍微调整一下就可以了。主要是把财务报表上劳动者报酬、生产税、折旧、净利润这几个数找出来,一加总就是收入法统计的数,所以我们说收入法是实操上最简单、最方便的统计方法。


收入法统计里面,大家肯定会疑惑,如果依靠企业财务报表统计的话,那么那些个体户,摆摊的、卖炒饭的、卖葱油饼的,根本就没有财务报表啊,那咋统计呢?对,就是统计不了,那部分没法直接统计的,都是靠推算推出来的。


具体怎么推算,就得根据各个行业的特点了。比如建筑业就有很多没资质的企业,甚至是个体户、包工队、一帮黑社会,那咋办呢?统计局可能会去搞个抽样调查,随机找几个区域看看资质内企业的增加值占全行业的比重,抽样调查的工作量就没那么大了,小摊小贩的情况也能调查到,然后算一个比例出来,以后就用这个比例去推算全行业的,包括那些小摊小贩、个体户的GDP是多少。


当然,现实中很多时候是利用经济普查数据直接得到的比例,也不需要统计局去搞特别的抽样调查。我们五年一次的经济普查数据就是为了解决这些日常统计困难的补充用的数据。


那么这种间接推算占GDP的比例能有多少呢?我们现在有一个2013年的数据,当时的间接推算数据大概占总GDP的45%,就是说有一半的GDP我们其实是根本统计不到的,那些都是靠间接推算出来的。这里我要说一下,大家有没有发现一个国家的经济越是由少数大企业构成,经济数据的准确度就越高,你发现没有,如果一个国家都是小摊小贩、个体户,那么你都得靠推算得出GDP,经济越不发达的地方它的数据本身就越不准。这其实是一个很有意思的地方。


我们接下来说支出法,支出法就是我们总说的消费、投资各占多少,其中居民消费就完全是基于调查资料了,而且是抽样调查,所以这个数据推算的成分其实挺大的。投资和政府消费相对来说更准确一点,政府这个数据不用说了,投资的话主要也是依赖于企业的财务报表就可以统计出来,所以投资会相对准一点,消费可能准确度差一点。


三种GDP核算方法理论上应该最后统计出的GDP数是一样的,现实中肯定多少得有点误差,那误差是多少呢?我算了一下1980年的时候我们国家的GDP收入法和支出法误差是在1%~2%左右,从1995年开始,GDP统计误差基本稳定在0.5%~1%以内。这个是不是也符合我们说的经济越发达,GDP统计的越准确的结论?


而且听过我讲地方债那期播客的朋友不知道记不记得,我当时说1995年是一个很重要的年份,因为从这一年开始我们国家的经济被认为终于从供给短缺型的状态,转变成了需求缺乏型的状态了,就是有一个调查发现大部分零售商品的排队现象已经没有了。


四、地区GDP加总等于全国GDP吗?


接下来第四个问题,也是一个大家一直争论的话题,就是中国的地区GDP加总不等于全国GDP的问题。我们各个省以前都自己统计GDP,然后国家统计局负责统计全国GDP,两边各统计各的,最后每年统计出来的总数都不一样,这也是被很多人质疑说中国统计造假的一个重要原因。因为在过去大部分时间里面,各省市的GDP加总是高于全国GDP的,这个差异能差多大呢,最大的时候在2013年到2014年,差了4万亿,占当年的GDP比例已经达到6个点至7个点了,这应该说是差得够大了。


这里面不用说,肯定有地方上为了政绩在夸大自己的GDP的问题,我们天津就是一个典型,我所出生的天津的这个区,一直以来号称是中国人均GDP最高的地方,但我自己是完全没感觉到,后来GDP挤水分,直接挤没了将近40%。


这个事情后来在2019年基本上已经得到解决了。2019年GDP统计改革,各个地方的GDP就不再让自己统计了,全都由国家统计局下去统计,然后各省统计局配合,所以从2019年之后能看出来这个误差已经非常小了,现在误差可能就不到0.5%了。


但是有意思的一点是,2019年统计改革之后,我们发现不是所有地方的GDP都虚高,那些经济比较发达的地方,比如上海、福建、广东,GDP都上调了,这些有钱的地方GDP都是虚低的,故意少报了一些,那些穷的地方是虚高的,一般都是多报GDP。


为什么会出现这种情况呢?我个人感觉还是政治逻辑,因为在经济发达省份的领导人,大部分都是已经比较确定将来要提拔的干部了,去发达省份实际是“刷简历”的作用更大一些,所以他们到了这些地方不需要把经济发展得更好也能有光明的未来。但是那些经济不好的省份,如果你能把经济变得好一点,那么本来可能没有光明未来的人,一下子就不一样了,就打开上升空间了。


我们讲过海航,两位工作组组长接的是一个巨大的烂摊子,谁都知道这活不好干,但是最后两个人干成了,成了最年轻的副省长,所以能把硬仗打下来的才是能得到政治机会的人,这个就不用多说了。


五、GDP的特殊项目统计


第五个问题,就是GDP一些特殊项目统计的问题。这个稍微复杂一些,但我觉得也很重要,所以也讲讲。首先是无形资产,就是研发活动,这些算不算在GDP里呢?2017年中国开始把研发支出纳入到GDP里了,以前是不算的,这个本身就反映了我们对研发的重视。所以2017年GDP是有一次大调整的,调整之后变得更多了。


然后,我们知道你如果在北京打工,租一个房子住的话,那么租金肯定是要算进GDP里的,但是如果你是住在自己买来的房子里面,你不付租金,是不是就不统计GDP了呢?其实不是,这个时候我们会假设你为你自己的房子付了租金,然后也统计到GDP里的,这个就是统计当中经常出现的一个概念,叫设算收入


因为GDP本质上是统计的一个国家所有的生产和服务活动,你租自己的房子虽然没花钱,但是你相当于自己给自己提供了一个出租房屋的服务,你省下来的那笔租金就是你提供服务的报酬,所以你虽然明面上没花钱,但是通过你自己的房子也创造了一个服务的价值,所以也要统计到GDP里。


最后还有一个,目前争论非常大的问题,就是由家庭成员完成的家务活动算不算GDP。因为我们现在是把家政公司做家务提供的服务统计到GDP里的,这个不用说,那么按照类似租金的逻辑,你自己的家庭成员做家务是不是也应该统计到GDP里呢?


这个目前争议就非常大,现在大部分国家都是不统计的,但是包括我在内的吧,在这方面比较激进的观点都还是认为这个应该要统计到GDP里的,哪怕是金额做得低一些,但你不能一丁点不统计。因为这背后反映了我们的社会认为什么是有价值的活动的一个观念,甚至我们很多现代性的社会问题可能都来源于此,大家有没有想过,也许靠一个统计数据的人为调整,我们就能解决低生育率的问题。当然这里更多的是社会学和经济学混合的问题,就不展开了。


六、GDP这个数本身如何分析?


上面我想已经把大家相对比较关心的一些GDP统计方面的问题涵盖到了,最后第六个问题,我们就再讲一讲GDP这个数本身如何分析的问题。


实际上,关于GDP的总量分析,我觉得最关键的是先要找到某个我们整个经济体在当下的经济增速中枢是多少,就是我们单纯地比较GDP高低是没有意义的。我们现在经济增速在5%,很多人就在喊经济大衰退,但你看看同样是5%,日本那边去年到今年有这个水平的增长则被认为是走出经济衰退了,所以大家明白吧,你单看一个绝对增速值没有用,GDP的分析的第一个要点是,要知道不同的经济体所处的阶段不一样,所以经济增速的中枢是不一样的。


那么结合工业革命以来的各国历史数据,尤其是二战后GDP统计比较普及后的数据来看,一个经济体的现代化过程,基本都会经历三个增速中枢阶段,第一个阶段的增速中枢一般在8%以上,我们可以看到像美国、日本,都经历过连续十年以上的8%以上增速,当然美国这种老资本主义国家的早期数据肯定是推算的。但是,我们注意到,一个经济体如果能出现连续10年GDP增速保持在8%以上,应该说可以被认为是一个现代化开始启动了的阶段。


这里我想讲一下某些后发国家,总是反复地被人们认为要崛起了,典型的比如说印度,印度这两年GDP增速接近8%了,这两年总有人说印度有可能是下一个中国。但是如果你完整地看看印度的历史数据,你就会发现,印度从60年代到现在,基本上增速的高点也就在8%左右,增速的低点一般在3%~4%,有时1%,所以这你就能看出来,它的增速中枢从来没超过8%,一直都是在5%左右,然后每隔几年会大幅度地上下波动。


这种增速特征,很显然不是一个现代化启动的状态,这么低的基数,现在印度的人均GDP还只是中国的五分之一,完全还是一个农业国或者说是城乡结合部的状态,在这种状态下增速中枢只有5%左右的话,其实根本不可能出现经济起飞的情况。但是为什么每隔几年就有人说印度经济要起飞了呢,就是因为出于一种刻舟求剑式的数据比较,把印度周期高点的8%增速拿来说事,但是过几年印度又调到3%、1%了,所以你这样比的话完全没有意义。


根据历史经验,8%以上的增速中枢代表了现代化启动,或者说有机会进入发达国家行列了,中国对应的这个增速中枢就是在1978年~2012年,增速中枢是9%左右,保持的时间非常长,确实是很厉害的。


第二个增速中枢阶段,一般在8%~5%左右。这时基本的现代化已经完成了,已经解决了供给短缺问题,经济更多的问题是需求缺乏。我们可以看到,日本大概是在20世纪70年代石油危机之后进入到第二个增速中枢阶段。


这里我想说,虽然有很多分析在讲为什么中国经济增速跌破8%了,但我觉得最重要的还是自然增长的问题,你不可能永远这么高的速度。从定量的对比来看,我们可以注意到,中国实际上现在是进入到增速在5%左右这个第二阶段,其实你要准确地对应日本的话,应该是对应日本70年代石油危机之后的增速中枢。但是我们现在很多人总是把中国的经济衰退对应到日本90年代后泡沫破裂的状态,这就是一个我说的感性认知的结论问题。


因为你从感性层面出发的话,每次遇到经济下行周期,都会觉得经济未来会不好,从2003年开始就有人觉得中国经济不行了,那时候日本还没衰退30年,如果那个时候日本已经衰退30年了的话,搞不好2003年就有人开始认为中国要变成日本那样了,这都是不定量地聊经济导致的问题。所以你要看到,即使刻舟求剑地去拿中国和日本作比较,你也应该拿中国和日本70年代的经济衰退作比较,而非90年代的衰退。


第三个增速中枢阶段,一般来说就是2%~3%的GDP增长率,典型的就是美国了,中国还没到那个阶段,所以现在分析也没啥用。


讲完这个部分,对GDP的总量分析的原理也就差不多讲完了,我认为GDP增速的分析就是一个作用——告诉我们经济现在处在什么大的阶段。然后在这个大阶段过程中,我们短期会围绕着这个中枢上下波动,可能今年低一点,明年高一点,这就形成了所谓的短期经济周期。但是短期经济周期的衰退,我们从经验上来看一般都是持续2~4个季度,甚至都不够一个完整的GDP统计年度,所以我们最终会发现GDP的年度数据各国都是持续下降的,所以说,我认为GDP对于短期的经济分析没有特别大的意义,GDP是帮我们定位长期我们处在什么样的经济发展阶段的


以上是GDP的总量分析,那么GDP的结构分析呢?就是所谓的消费、投资、净出口占比的分析,还有各行各业的分析,这部分当然也重要,但更多的是在其他具体数据中去分析体现,就不是我们这一期播客的内容了。


本文来自微信公众号:外部性(ID:wogongxinifacai888),作者:李铁ironlee