当前位置: 首页 » 资讯 » 新科技 » 正文

​谷歌 AI 研究推出 DeepSomatic:新型癌细胞基因变异识别模型

IP属地 中国·北京 编辑:江紫萱 Chinaz 时间:2025-10-21 18:17:24

谷歌研究团队与加州大学圣克鲁兹分校的研究人员联合推出了 DeepSomatic,这是一种创新的人工智能模型,旨在识别癌细胞中的基因变异。在与儿童医疗中心的合作研究中,DeepSomatic 成功发现了其他工具未能识别的10种小儿白血病细胞变异。

DeepSomatic 采用了一种针对癌症基因组的小型变异调用器,能够兼容 Illumina 短读段、PacBio HiFi 长读段和 Oxford Nanopore 长读段。这一方法在 DeepVariant 的基础上进行了扩展,能够检测单核苷酸变异(SNV)和小插入缺失(indels),支持肿瘤 - 正常和肿瘤单一工作流程,包括福尔马林固定石蜡包埋(FFPE)模型。

DeepSomatic 的工作原理是将对齐后的读段转换为图像般的张量,这些张量编码了堆叠情况、基础质量和对齐上下文。通过卷积神经网络,模型对候选位点进行分类,判定其为体细胞变异或非变异,最终生成 VCF 或 gVCF 文件。这种设计使得 DeepSomatic 在技术平台上具有高度的适应性,因为该张量能够总结不同技术间的局部单倍型和错误模式。

在数据集和基准测试方面,DeepSomatic 使用 CASTLE(癌症标准长读段评估)数据集进行训练和评估。该数据集包含6对匹配的肿瘤和正常细胞系,使用 Illumina、PacBio HiFi 和 Oxford Nanopore 进行了全基因组测序。研究团队发布了基准集和访问权限,以便其他研究者进行重用,这填补了多技术体细胞训练和测试资源的空白。

结果显示,DeepSomatic 在单核苷酸变异和小插入缺失的检测上都优于目前广泛使用的方法。例如,在 Illumina 测序的插入缺失方面,DeepSomatic 达到了约90% 的 F1分数,而其他方法仅为80%;在 PacBio 测序中,DeepSomatic 的 F1分数超过80%。研究团队还报告了329,011个体细胞变异的发现,进一步验证了 DeepSomatic 在插入缺失检测方面的强大能力。

研究:https://research.google/blog/using-ai-to-identify-genetic-variants-in-tumors-with-deepsomatic/

划重点:

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。