目前最全预测:中国各大城市首轮感染高峰期何时到来?

从11月开始,越来越多的地区的病例出现了大幅度失真。我们虽然能在网络上看到石家庄、保定、北京等大面积感染的情况,但是在卫健委的病例发布中却看不到这样的数据:

全国感染数逐日下降

可以看到,北京的新增病例正在逐渐减少;石家庄的新增感染者数量在11月24日时达到顶峰,随后迅速下降。

而保定……保定根本看不出有任何疫情,除了在11月26日新增了33个感染者以外,其他时间保定的新增感染数量基本稳定在个位数。

数据失真,无法反映实际感染情况

不仅是这三个城市,从全国范围看,新增感染者数量也在11月27日达到顶峰,并在最近十天来快速回落了。疫情防控的指挥棒消失后,病例增长数据立刻失效,此时我们怎样判断一个城市是否出现了群体感染,以及何时第一轮群体感染达到高峰呢?

搜索指数,在这时可以帮上大忙。早在十多年前,就有研究使用Google搜索指数来预测流感爆发情况。这些研究后面证明可能在预测上确实会存在问题,但是在实况监测上一直做得很好。

例如下图列出了从2022年以来香港特别行政区、台湾地区、新加坡和日本的“发烧”搜索指数与当地每周病例之间的关系。

搜索指数与新增病例数量高度相关

其中香港特别行政区和台湾地区的搜索指数是“發燒”,新加坡用的是“fever“,日本则用了“発熱”。

可以看到,当这些地区进入与疫情共存的阶段后, “发烧” 搜索指数的上升,从时间上看

基本都和当地的新增病例数同步,或者领先一周左右。

从上升幅度看

,除了新加坡的第一波病例带来的搜索指数与后两次疫情的病例增长略有错位以外,其他的三个国家或地区,不同波次的病例增长基本与“发烧”指数的搜索保持同比例。

那么,此时的北京、石家庄、保定的“发烧”搜索指数,分别是什么样的呢?

部分城市发烧搜索指数

上图列出了六个城市在不同时间的“发烧”搜索指数,且根据每个城市的2022年前两周进行了标准化。

可以看到,在今年的3月初和4月初,长春与上海分别出现了一个短期高点,长春在3月9日达到1.74,上海在4月10日达到1.57。这两个城市此时的“发烧”搜索,分别达到了基准水平的1.74倍和1.57倍。在时间点上,上海的“发烧”搜索最高的一天,与上海市新增感染者最多的一天完全一致,都在4月10日。

之后的一波“发烧”指数高峰发生在10月的乌鲁木齐,最高值出现在10月20日,达到了2.60。这段时间与乌鲁木齐出现疫情的时间同样吻合。

上海、长春和乌鲁木齐的例子显示
“发烧”搜索指数与较大规模的奥密克戎疫情高度相关。且当确诊人数不能完全反映当地实际状况时,“发烧”搜索指数依然忠实地呈现了疫情到底扩散到了什么程度。

哪些城市正在开始群体感染

在分析了多个地区的数据后,我们试着用 “发烧”搜索指数给出每个地区疫情开始的信号,主要包括两个部分:

1,“发烧”搜索指数在过去7天内的平均值大于过去五年内该季度平均值的2个标准差。

2,“发烧”搜索的Cox-Stuart检验在95%水平上出现显著上升趋势。这里的Cox-Stuart检验我们用到了7天数据。

当以上两个条件同时满足时,我们便把上升趋势出现的第一天定义为该城市迈向群体感染第一天。2022年11月以来,出现了群体感染的城市依次如下表所示:

已经开始群体感染的城市

可以看到,本轮疫情开始的时间比我们想象得更早。在“二十条”发布的第一天,也就是11月11日,河北省石家庄市和邢台市就开始迈入群体感染之路,至今已经持续近一个月,暂时也没能看到减缓的趋势。

第二批进入群体感染的是甘肃兰州、河南洛阳与河北保定,时间在11月17日到11月18日。

接下来的两个星期,邯郸、廊坊、唐山、沧州、衡水、张家口……除了承德市暂时保持稳定以外,河北省全境都已经开始群体感染。

河南的群体感染也在快速进行。洛阳之后,紧接着是新乡、商丘、南阳、郑州、周口、平顶山、开封。

甘肃在兰州之后,临夏、甘南两个自治州也在11月下旬开始群体感染。

北京是全国首个进入群体感染的大城市,时间点是11月27日。接下来,重庆、武汉、昆明、成都……

这只是一个开始,由于我们的方法实际上是在群体感染的确认出现七天之后向前回溯,因此若是一个城市的感染在12月2日之后开始,便不可能被该信号锁定。因此一些城市的感染虽然已经有明显的趋势,但也没有能被列入该表内,这些城市如下表所示。

即将开始群体感染的城市

这些城市会在未来一星期左右被正式确认进入群体感染。

首轮感染高峰将在何时出现?

我们又对台湾地区、香港特别行政区和日本的感染情况与“发烧”搜索指数进行了分析,发现一个可能可以帮助预测感染高峰期的方法:

1)将Google搜索指数分为疫情期间和非疫情期间,疫情期间的搜索指数对非疫情期间搜索指数均值做标准化后进行累加:

超额发烧搜索指数累积面积

其中S的含义是这样的:如果发烧的搜索是发烧人口的一个相对稳定的比例,且在非疫情期间发烧人口是总人口的相对稳定的比例,那么S就正比于疫情感染的人口占总人口的比例,我们把它叫做“超额发烧搜索指数累计面积”

2)下图列出了台湾地区、香港特别行政区以及日本的“超额发烧搜索指数累计面积”,即下图橙色面积、蓝色面积和灰色面积。

超额发烧搜索指数累计面积

我们发现在这三个地区,当疫情达到顶峰时,这个“超额发烧搜索指数累计面积”的数值全部刚好达到80。这两个地区第一波疫情结束时,香港特别行政区的面积达到了160,台湾地区的面积达到了200,日本的最终面积是250。

3)如果用百度搜索指数做类似的研究会有什么效果呢?我使用了本轮疫情进入群体感染最快、最早的石家庄、邢台和保定做了计算:

石家庄、邢台、保定相关指数

可以算出,从疫情开始后计算,石家庄的“超额发烧搜索指数累计面积”已经达到了76,邢台已经达到了67,保定也达到了71。

由此来看,百度搜索指数和Google指数分别算出的“超额发烧搜索指数累计面积”,至少是在一个差不多的数量级上。

4)考虑到保定、石家庄、邢台等地的发烧指数仍然在上升,以及百度搜索指数和Google指数的差异,我们比较保守地将100作为疫情达峰时的“超额发烧搜索指数累计面积”

,将250作为第一轮疫情结束时的“超额发烧搜索指数累计面积”

那么我们通过每个城市的搜索指数累计增长,累计速度,就可以算出现在每一个有疫情的城市疫情达峰的时间,以及疫情结束的时间。

这是计算的结果,列出了所有能在明年春节前达峰的城市以及这些城市在达峰前已经感染的人口比例(截止至12月13日)。

根据搜索指数测算的达峰时间

数据不足,方法简陋,仅供参考。