昨天,国家卫健委网站上发布了一份公告:“从即日起,不再发布每日疫情信息,将由中国疾控中心发布相关疫情信息,供参考和研究使用”。

事实上,“新十条”公布以来,核酸检测从“应检尽检”变成了“愿检尽检”,之后,开始有人觉察到卫健委发布的感染数据与自己身边不断出现新冠阳性亲朋的实际情况严重背离。

作为一个极端例子,很多北京居民发现,在从身边总有一个新冠“阳性”到身边很少有人没“阳过”的这十几天里,卫健委的公开数据中,北京的确诊病例却一直保持在三位数,多数时间在400例上下。

互联网上,流传着利用搜索关键词制作的城市疫情峰值预测,充斥着各种由自媒体大V们发起的“小调查”,调查的内容通常只有简单的居住城市、是否感染……

这一切,直到12月23日。当日,据《青岛日报》报道,按照监测数据推算,青岛目前的每日新增感染量为49万-53万人,明后天会在此基础上以10%的增速增加。同日,东莞市卫生健康局的官方微信公号亦在推送中提到,“东莞感染者正以每天25万-30万人的规模增长,且增速越来越快”。

12月25日的浙江省疫情防控发布会上,相关部门透露,在人口6500万的浙江,日新增感染人数已突破了100万例,而根据卫健委的疫情通报,12月23日,浙江省新增本土病例30例。

直报系统无法正常工作

数据只能靠模型估算

地方数据与卫健委通报之间巨大的差额,是否有其合理性,大流行期间,靠谱的数据究竟从何而来,如何保障?

一位知情人向《知识分子》解释:出现这样的情况是因为卫健委公布的数据来自一套直报系统,而数据的来源是地方疾控基层的监测和流调团队。

政策放开之后,很多地区实质上已经几乎放弃了流调工作,相关的监测工作一时间也就几乎处于了停滞或是半停滞状态,在这种情况下,之前的那套系统便几乎很难正常工作了。

与几乎停工的新冠直报系统相应的,大规模核酸退场之后,感染数据也进入了模型估算时代。

在青岛的疫情通报中提到:“按照监测数据推测”;东莞的疫情通报则是“根据数字模型预测结合专家评估判断”。

而对于浙江日新增破百万例的数据,虽然新闻发布会上并未明言其数据来源。

一位中疾控的专业人士向《知识分子》推测:“他们应该是利用了医院的监测数据、目前尚存的核酸检测点的数据,加上部分地方开展的社区抽样调查的数据,之后通过一个模型进行了全省的预测和预估。”

利用有限的数据,通过模型计算进而获取可以反映群体规律的大致数值,这几乎是大流行中各国通用的感染数据获取方法。

“目前数据来源中最可靠的就是医院监测和现有的核酸检测,其次是社区调查,再其次是网络调查。”一位专业人士向《知识分子》解释。

对于这种方法,上述中疾控的专业人士解释道:“监测医院就诊人群的阳性率、重症数据,然后通过就诊率比例等等一系列模型,将就诊者中的感染情况回推到整个社会人群中。”

按照这位中疾控工作人员的介绍:对于政策放开后的监测方式,“曾有人提出过进行人群监测,但这类监测大多是进行回顾性的电话或入户调查,考虑到应答率和受访者的回忆偏移都会影响到最终的结果,误差会比较大,人群监测最终被放弃了。”

他进一步解释:在很多国家,有很好的抽样监测的基础,而在中国,本就基础薄弱,因为地区差异很大,加上宏观社会经济导致的人口流动,要寻找有代表性的哨点,有代表性的人群,面临着更大的挑战,“而如果仍然使用医院监测,院感也好,流感也好,本身的信息系统平台就是现成的,很容易可以加入新冠的监测”。

然而,源自医院的样本却往往因人群覆盖不足,只能估算一个粗略的结果。

以浙江新增感染百万的数据为例,前述的专业人士也向《知识分子》解释:“都只能借助模型和一些假设去推测,虽然这类结果可以给出波峰、转折点等信息,从而为决策者提供一个方向上的指导。但它所得到的,只能是一个大致的数量级上的结果,只会报告日增突破百万量级,而不会是具体有多少。”

从清零模式到放开模式的切换不仅仅是管或者不管、测或者不测、报道或者不报道的区别,需要有一整套准备工作的支持,才能实现平稳过渡。

大流行中,其他国家如何监测?

在美国,根据CDC公布的信息,其统计模型的数据来源,有医疗系统、有社区的抽样调查,还有来自居民的抗原检测结果主动上报(自报),甚至来自下水道的病毒监测的数据。

不过,即便如此,要做到精准的估计,需要一定时间内非常准确的流调信息,而这类信息,在大流行期间,几乎不可能获取。于是,在大流行冲击下,全球各国的数据监测系统中,感染数据被诟病的经历,很多国家都不鲜见。

今年的4月26日,根据美国官方公布的感染数据,全美累计报告新冠肺炎确诊病例超8100万。但美国疾控中心当日发布的另一份报告却显示:美国已有约58%的人口具有因感染过新冠病毒而产生的抗体——如果以美国约3.3亿的人口来计算,该国已有超过1.9亿人感染过新冠病毒。

感染数目的低估,是从2020年大流行伊始就广被诟病的一个问题。早在2021年,自然通讯的一篇文章中,加州大学伯克利分校一个团队便曾撰文批评美国的疾控系统低估了感染的数字,其真实感染数据有上报数据的10倍。而到了2022年6月,一篇预印本文章指出:他们针对纽约居民的抽样抗体检测显示的感染率是当时官方报告的31倍,那位作者把这种差距归因于居民们未曾上报的抗原检测结果——在美国,居家抗原检测的自报结果也是其检测数据的一个重要组成部分。

不过,即便广被诟病,作为一种数据的来源,抗原检测结果对一个模型仍然是利大于弊。“目前的模型对大量数据的容忍性很高,而且输入的不同来源的数据越多,预估出来的东西相对来说可能会越准确。”一位从事流行病学数据研究的专家解释。

在美国、英国、德国、新加坡、中国香港等地,2021年底的奥密克戎疫情暴发之后,政府都曾先后要求或鼓励居家抗原检测结果自主上报。

“需要人群当中感染的率达到一定的水平之后,抗原检测的准确率和阳性预测价值才能有一定的保障。目前,人群当中的感染率比较高了,这种情况下,抗原很适合作为我们了解人群中感染情况的一种方式和途径。”一位公共卫生专家告诉《知识分子》。

然而,在中国,虽然4月上海疫情期间曾经短暂地使用过一个专门的网络系统收集居民的抗原结果,但目前,在全国范围内,几乎没有再出现类似的阳性上报系统。

上述公共卫生专家同样提到了调查问卷的方法,“虽然因为采样人群的问题,或是问卷设计的问题,可能会有一定的偏差,但因为它的及时性,作为一种应急方式,还是有一定可靠性的。”

对于来自官方的调查问卷,很多人的意识中,只有12月18日开始,社交媒体上出现的一份“新冠感染情况问卷调查”,根据说明,这是“为了快速了解我国新冠感染情况,受国家疾病预防控制局委托,北京协和医学院面向全网开展问卷调查”。据介绍,目前该调研的第一轮已于12月21日结束,3日内,47万人参与了调查,其结果目前尚在分析中。

而在美国的一项由斯坦福大学、哈佛大学等5所大学与脸书共同进行的为期一年(2020-2021年)的美国新冠感染相关的调研中,收集到的回复就有2000万份。

“美澳等发达国家一直有一套相对成熟的监测系统,他们有针对学校、老人院,甚至退伍军人等不同群体的监测点。大流行期间,这些监测点就可以获得更高质量和更有代表性的数据。”而中国的监测系统却往往缺乏这样的高质量数据,一位疾控系统的工作人员告诉《知识分子》。

然而,“大流行期间,与其去花很多精力去做细致、准确、有代表性的调查,告诉你一个很准确的数字,其实意义不大,因为对决策而言,趋势和影响几乎已经足够了。”一位受访者告诉《知识分子》。

不过,亦有受访者提到:“我们需要知道当前感染的数量,第一波高峰、再感染,以及疫情后期的各种相关的数据;另一个重要的信息是病毒的测序,不同毒株的数量和分布情况…… ”

在世界卫生组织2021年发布的一份临时指南中提到:“公共卫生的监测数据以及对于病例情况的复盘调查可以提供关于这场疫情的传播能力和严重程度的重要信息,这些信息在有潜在新突变株的情况下尤为重要,(数据)有助于我们判断人群的免疫水平,从而决定是否需要实施甚至强化社交隔离措施。”