在微软,我们的愿景是通过最新的 AI 技术赋能科学家,释放他们的创造潜力,应对一些最紧迫的挑战。为了实现这一愿景,我们需要将生成式 AI 技术的全部力量与量子-经典混合计算结合起来,以增强科学方法的每一个阶段。无论是拓展知识研究、创造更好的假设,还是加速实验和分析,都需要一个专为科学设计的云平台。这就是为什么我们为化学和材料科学构建了 Azure Quantum Elements1。
近日,我们宣布推出生成式化学和加速 DFT(加速密度泛函理论),这将扩大研究人员利用这一平台的方式。这些突破性的功能将使科学家有机会将原本未来250年的化学进程压缩至25年完成。
通过生成式化学,我们希望拓宽科学探索的视野。研究人员可以使用基于数亿化合物训练的最新 AI 模型,生成并探索适用于特定行业应用的新分子,然后评估工作流程中建议的步骤,以更高效地在实验室合成最有前途的候选分子——这一过程只需几天而不是几年。
通过加速 DFT,研究人员可以通过模拟分子的量子力学性质,以前所未有的速度加速和扩展他们的化学发现流程——相比其他 DFT 代码,速度提高了一个数量级。
这使我们更接近科学发现的新范式,先进的 AI 技术和数字工具比以往任何时候都更易于科学家、学生和各行业的实验室使用。以下是我们关于研究人员如何利用这些突破性功能设计新分子,并推动从消费品和医药到制造和能源等整个行业变革的愿景,从而应对一些最紧迫的社会挑战。 01.致力于实现今日愿景
我们正在努力实现这一愿景。作为Azure Quantum Elements 有限预览的一部分,科学家和开发人员今天就有机会探索加速 DFT,并有望在未来几周内访问生成式化学。
我们已经在与全球消费品领导者联合利华(Unilever)的合作中将这一愿景付诸实践。联合利华每天为超过34亿人提供服务,他们正在利用微软的超级计算和AI服务支持其数字研发转型和产品创新。
02 .将 AI 技术融入科学方法的每个阶段
从全球性的目标如逆转气候变化和开创可再生能源,到个人层面的目标如更可持续地生活、使用更健康和安全的产品,我们都希望为创造一个更美好的世界尽一份力。时间对于实现这些目标至关重要,全球有超过800万名科学家在努力开创创新解决方案,推动进步。微软的目标是通过最先进的数字工具为他们赋能,充分利用每一位研究人员和实验室的集体智慧。
正如生成式 AI 技术通过协作工具如 Copilot 智能副驾驶® 释放了新的创造力浪潮并提高了生产力一样,我们现在将 AI 技术和自然语言处理能力带入科学领域。我们的目标是将 AI 推理整合到科学方法的每个阶段,从最初的研究和假设生成,到实验和分析:这需要下一代 AI 模型的强大能力,从假设到结果,加速科学过程。它从知识研究和假设生成开始,通过生成数百万潜在的分子候选解决方案来连接点,然后通过数字实验缩小候选范围并分析结果——这一切只需几天。我们在与太平洋西北国家实验室(PNNL)的合作中展示了这种方法如何在现实世界中取得成果,我们筛选了超过3200万个候选物,发现并合成了一种新材料,具有更好电池性能的潜力——这是这一新科学发现时代可能性的一个有形例子。
当由自然语言工具驱动时,这一新范式将有助于在每个阶段创建一个由 AI 作为科学助手的自主推理循环。它将通过将这些能力普及,重新定义我们如何接近创新,推动突破性发现。
03 .Azure Quantum Elements 的新功能
生成式化学将为负责发现和设计新分子的科学家们带来新一波的创造力。这将推动许多行业的突破性增长,无论是帮助石油和天然气公司发现更强的燃料添加剂以延长发动机寿命,还是帮助粘合剂公司创造一种新化学物质以增强粘附力并去除不需要的残留物。
我们可以将这种发现过程比作在一个大而拥挤且黑暗的仓库中用一个小手电筒寻找一个小盒子。我们一次只能将光集中在一个小区域,而仓库的其余部分则完全黑暗且未知。生成式 AI 技术为我们提供了一个更聪明的光源,能够指向新的方向,让我们看清以前可能未考虑或无法看到的地方。
研究人员可以向生成式化学询问具有所需特性的分子,例如能够快速降解或更容易回收的分子。他们还可以提供关于目标应用的信息,让系统帮助确定相关的分子特性。经过几个步骤后,他们会收到一组符合这些参数的候选分子,供进一步研究。
然而,仅仅生成候选分子并不足以通过 AI 技术改造发现过程。化学中的计算工具的基本标准是,它们能够帮助科学家发现新颖、可合成且在现实世界中有用的分子。这就是为什么我对我们生成式化学方法的实现感到兴奋,它不仅能建议以前未见过的分子,还能提供针对特定应用调整的有用特性,并且这些分子的合成在合理的步骤内是可行的。
因此,生成式化学将为研究人员提供在实验室中合成这些分子候选物时可以考虑的潜在步骤。这一关键组件的支持来源于我们 AutoRXN 软件的能力,通过逆向探索化学反应,帮助评估合成路径以创建目标分子。
在科学家指定了分子的所需特性之后,他们会收到数千个分子候选物。这些候选物可以通过AI推理和后续的高性能计算(HPC)模拟进行进一步精炼,最终筛选出最有希望在实验室合成并进行进一步实验探索的少数几个候选物。