清华校友立功！谷歌发布首个全科医疗大模型，14项任务SOTA!

此篇文章，只做今日头条首发创作，请尊重作者合法权益，不经本人允许，不得搬运抄袭，违者必追究责任。文章千字以上，内容较为细腻，阅读前麻烦点一下关注，便于您后期持续关注相关内容。

医疗领域的人工智能技术正日益成为引领未来的关键力量，而在这个领域的最新成就中，全球首个全科医疗大模型——Med-PaLM M的发布无疑将掀起一股巨大的浪潮。由谷歌Research和DeepMind共同打造的这一多模态生成模型，不仅懂得临床语言，还能识别影像，甚至理解基因组学。

作为一项重要的突破，Med-PaLM M在14项测试任务中均展现出令人瞩目的表现，几乎接近或超越了现有的技术水平。更引人注目的是，根据246份真实胸部X光片的数据，高达40.50%的病例中，Med-PaLM M生成的报告被临床医生普遍认可，超过了专业放射科医生的水平。这无疑彰显了Med-PaLM M的临床应用前景，它不再仅仅是一个理论上的突破，而是真实可行的技术。

Med-PaLM M之所以能够如此令人惊叹，是因为它建立在谷歌自建的多模态医学测试基准MultiMedBench之上。

这一基准整合了12个开源数据集和14个任务，涵盖了多种生物医学数据模式和任务类型。通过这一基准，Med-PaLM M得以充分展示其通用生物医学AI的能力，不仅能够解答问题、生成报告，还可以执行视觉问题回答、医学图像分类以及基因组变体调用等任务。

Med-PaLM M的基本架构采用了多模态语言模型PaLM-E，同时融合了ViT预训练模型作为视觉编码器，形成了多种组合。而在训练过程中，作者进行了精细的微调，实现了多模式上下文输入，从而使得Med-PaLM M能够处理包含多个图像的输入。

这使得它在14项任务中表现出色，特别是在放射性报告生成方面，超过40%的报告比专业医生的更为准确。

然而，虽然Med-PaLM M取得了巨大的突破，但谷歌也坦诚地指出目前仍然存在一些限制。高质量的测试基准仍然是一个关键瓶颈，这直接影响了通用生物医学人工智能的发展。当前的MultiMedBench虽然起到了推动作用，但其数据集规模和多样性仍有限。此外，对于多模态AI模型的扩展也存在挑战，因为生物医学数据的稀缺性使得这一操作并不像在其他领域那么简单。

总体来看，Med-PaLM M的发布标志着通用医学人工智能迈出了重要的一步，但它的实际应用还需要面对多方面的挑战。它是否能够快速投入实际使用，还需要进一步的探索和努力。然而，无论如何，Med-PaLM M的出现已经为医疗领域带来了新的希望，为我们揭示了人工智能在医学领域的无限潜能。

总之，Med-PaLM M的发布对医疗人工智能领域具有里程碑式的意义。它的出现不仅仅是一项技术突破，更是对医疗领域未来发展的一次积极探索。