首页
>
资讯
>
【周末杂谈】数据与数据的含义
出自识林
2022-01-02
对新冠病毒变种奥密克戎的报道中一些数据的理解
报道中引用量化的数据,容易让人产生直觉和记忆,便于交流和传播。但往往传着传着,就只剩下数据而丢失其产生的条件了。简单的数好记,其产生的特定条件及代表的准确含义理解起来费劲、记起来难、说起来烦。一旦离开了条件谈数据,就容易产生误导和误解了。
最近,美国Fred Hutchinson癌症研究中心的计算生物学家Trevor Bedford博士在接受STAT媒体采访时,讨论了媒体在关于新冠病毒变种奥密克戎报道中一些数据引用的问题,现摘录如下四部分并加以简要的补充说明。
(1) 媒体称美国有70%的人至少接种了一针新冠疫苗,似乎离全民免疫还有一定距离。但美国CDC的新冠疫苗接种数据只包含15岁及以上的人。由于15岁以下人口的比例高于20%,所以CDC的数据实际说的是15岁及以上人的疫苗接种率接近90%。也就是说高风险人群已经相当接近全面免疫了。
(2) 媒体称奥密克戎变种比德尔塔变种温和,但并没有说明“温和”的衡量标准,例如:是衡量病毒对指定群体还是社会人群的影响。例如,英国伦敦帝国学院(Imperial College)的研究者们称奥密克戎“并不比”德尔塔温和,引起了广泛关注。这是一项对照研究,将疫苗接种者和再感染者作为对照,但是当今社会人群中的疫苗接种率已经与从前德尔塔变种流行时的接种率很不一样了。因而,“奥密克戎并不比德尔塔温和”的结论,更多是针对制定群体的对比研究的,而不一定是适用于社会现实。
(3) 基本再生数(R0)常常用来衡量病毒传播率。R0=1表示1传1,每一位感染者都会传给另一人。R0>1,表示扩散传播。R0越大,传播越广。若感染所需的时间固定,则R0越大,传播速度也越快。用R0可以解释目前观测到的奥密克戎变种引起的感染数激增,但难以解释为何激增后的激减。一个可能的解释是影响传播率的另一个因素在起作用,即感染所需的时间。若是这个时间缩短了,病毒在被感染者体内更快地得到放大,导致感染者可以更快地感染他人。虽然目前报道的数据还不足以支持这个说法,但这种量化模型的思考,为快速深入的认知激增后的激减这个问题,提供了具体可操作的方案。
(4) 媒体报道说美国CDC的数据显示目前新冠检测阳性中73%来自奥密克戎。这个说法是有问题的。CDC用的算法是根据全美过去两周的检测数据外推当今的检测情况的,是模型计算结果,不是现实的数据。该计算结果的统计学可靠性(置信区间 )是有很大不确定性的。严格讲来,CDC并不准确知道目前的检测阳性中有多大的比例是奥密克戎。
作为计算生物学家,Bedford博士对模型和数据,自然格外内行和重视。上面他讨论的这四点,固然都有道理,但不一定是“大是大非问题”,尤其是对平民百姓。这让我想起英国一首老歌“甜蜜的梦”中的一段歌词,“每个人都在寻求什么,有人希望利用你,有人希望被你利用。Everybody's looking for something. Some of them want to use you. Some of them want to get used by you”。有时不问具体,随大流,也挺好,省心。但若不然,Bedford博士所说的这几点也许就具有启发性,有助于了解数据背后的道理及准确含义。
作者:榆木疙瘩
识林® 版权所有,未经许可不得转载。如需使用请联系 admin@shilinx.com 。