冠状病毒:来自物理学的技术承诺更好的COVID-19模型——它们能实现吗?
数学建模的主题从未如此引人注目地出现在新闻中。最近,对用于预测冠状病毒大流行发展的技术的兴趣受到了新的关注,当时著名神经科学家卡尔·弗里斯顿主张使用所谓的生成或动态因果模型。
受物理学家理查德·费曼(Richard Feynman)的名言“我不能创造的东西,我不理解”的启发,生成模型据说可以让我们“深入了解”,捕捉大流行的数学结构,并推断出其原因。
弗里斯顿是一位研究人员,有令人印象深刻的记录,被其他科学家引用两次半就像诺贝尔奖得主费曼一样。弗里斯顿的模型预测,伦敦新冠肺炎病例数量将在4月5日达到峰值,死亡人数将在4月10日达到峰值,也就是疫情爆发后的两天现在的数据表明实际的峰值出现了。他还声称,他的模型可以在几分钟内从开始运行到结束,而传统模型“以今天的计算资源,需要一天或更长时间”。
这一切听起来令人印象深刻,但是不是好得令人难以置信?科学家们表达了这两种阴谋而且怀疑这位神经生物学家建议在流行病学领域使用物理学的建模思想,尤其是他对这个术语的使用“暗物质”描述模型中的未知因素。让我们快速看一下引擎盖下面。
什么是生成模型?
最简单的解释生成模型就是从一个简单得多的“拟合模型”开始。这基本上包括将你拥有的所有数据点(例如每天死于COVID-19的人数)绘制在一张图表上,并用数学方法计算出在哪里放置一条最符合它们模式的曲线。然后你可以继续这条曲线来预测未来的数据点。白宫在最近批评使用这样的模型来预测COVID-19死亡率的下降。
一个生成模型类似地,从现有的数据点开始,但也包括对这些点的可能原因以及它们之间的关系的描述。该模型不是简单地将一条线拟合到数据点上,而是使用了一种称为贝叶斯推理根据对与数据相关的概率的理解,指定在其计算中包括哪些变量以及包括到何种程度。
然后,您可以使用该模型规范生成新的数据点来生成预测,但您也可以使用它来确定哪些潜在因素对结果有强烈的影响。例如,这些模型被用来协助大脑功能性磁共振成像或神经元的模型种群.
那么弗里斯顿的生成模型到底能多好地预测大流行呢?正确预测4月5日伦敦新增病例高峰的头条结果听起来令人印象深刻,但有点误导。当你仔细阅读弗里斯顿和他同事的论文,你可以看到他们在4月4日做了这个预测,仅仅提前了一天。
不幸的是,该模型错误地预测了所有后来的数据点。它预测,到6月初,英国将有1.4万至2.2万人死亡记录在4万左右),在过去两周,我们每天的病例应该少于200例,而现实情况是超过200例1500人/天.
最后,该模型预测,每4到5个确诊病例中就有1人死亡,这要么使COVID-19几乎与埃博拉一样致命,要么意味着大约20个感染这种疾病的人中只有1人被确诊,在这一点上,这似乎极不可能。总之,这是一个相当可怕的预测。
但是,尽管这个模型有缺点,弗里斯顿的生成模型的想法确实有一个明显的优势。它天生就具备处理不确定假设的能力,因此您可以轻松生成不确定范围的结果,而无需多次运行模拟。
例如,这与我的同事和我一直在进行的COVID-19模拟所需的多次运行形成了鲜明对比伊达尔戈项目.也就是说,我尝试运行的所有模拟,包括COVIDSim模型由伦敦帝国理工学院(Imperial College London)开发的一种被用来为英国政府政策提供信息的计算机,可以在一个超级计算机节点上在一小时或更短的时间内完成。
需要更多数据
一般来说,生成建模的原理可以有效地确定不同的原因如何影响模拟结果。为此,概念模型需要包括所有相关原因,训练数据需要涵盖足够多的相关方面,以确定最重要的行为。
考虑到这一点,值得一提的是弗里斯顿声称,德国的COVID-19死亡人数更少,因为德国有更多的“免疫”。暗物质’——那些不受感染的人,也许是因为他们在地理上被隔离了,或者有某种天然的抵抗力。”我发现这是一个有趣的说法,尤其是作为一个对实际暗物质进行建模工作的人,暗物质是一种未知的理论物质,用来解释我们对宇宙物质理解的差距。
弗里斯顿的生成模型省略了90%以上与研究疾病传播相关的地点,如学校、超市、公园和夜总会。相反,在他的模型中,人们要么在家里,要么在工作中,要么在重症监护室或停尸房。
所以我认为弗里斯顿的"暗物质模型远远超出了免疫方面。要以任何准确的方式预测大流行,就需要更多的数据点和更广泛地描述影响这些数据点的原因。