Science:重新审视基因报告的“非黑即白”,借助机器学习破解致病变异“外显率”的百年难题
时间:2025-09-02
我们的DNA,正以前所未有的速度在被解码。然而,当我们翻开这本书,试图预测自己未来的健康轨迹时,却常常发现许多段落充满了模棱两可的 注释 。一个被标记为 可能致病 的基因变异,就像是悬在头顶的达摩克利斯之剑,它究竟会不会落下?何时落下?我们长久以来都渴望得到一个清晰的答案,但遗传学这门古老而又前沿的科学,在给出确切预测时却常常显得力不从心。这背后的核心难题,在于一个叫做 外显率 (Penetrance)的概念。
简单来说,外显率指的是携带某个特定基因变异的个体,在生命周期中实际表现出相关疾病的概率。一个外显率为100%的变异意味着 携带即发病 ,而一个外显率为10%的变异则表示,每十个携带者中只有一个会生病。然而,传统的评估方法往往依赖于少数几个患病家族或特定研究队列,这些样本不仅规模小,还存在 选择偏倚 (Ascertainment Bias) 因为研究人员更容易关注那些已经发病的家族,导致评估出的外显率常常被高估。更重要的是,传统方法习惯于将复杂的疾病简化为 有 或 无 的二元对立,忽略了疾病其实是一个从无症状到重症的连续谱。这种 非黑即白 的分类法,无疑削弱了我们对遗传风险评估的精确度。
面对这一困境,研究团队巧妙地将人工智能(AI)的强大算力与海量的真实世界临床数据相结合,提出了一种全新的、数据驱动的解决方案。他们于8月28日在《Science》上发表了题为 Machine learning based penetrance of genetic variants 的研究,为我们精确量化遗传风险,开启了一个充满想象力的新时代。这不仅仅是一次技术上的突破,更可能是一场关于我们如何理解基因、疾病与个体之间复杂关系的认知革命。