- 英矽智能与沙特阿美于2023年LEAP科技大会期间签订战略合作协议(MoU),赋能AI驱动的可持续发展与抗衰老研究。
- 针对荣获诺奖的金属有机框架(MOFs)材料设计,英矽智能与沙特阿美合作构建了流程化的AI筛选与验证系统Sanity Pipeline,旨在提升MOFs的研发速度和精度,相关成果已于近期公布在ChemRxiv。
- Sanity Pipeline结合了高效预筛选和深度验证,核心模型由双方联合研发,包括用于高效MOF分解和结构分析的工具LibCIF,以及用于识别氧化态异常的检测器OxiChecker。
2025年10月,诺贝尔化学奖被授予北川进(Susumu Kitagawa)、理查德·罗布森(Richard Robson)和奥马尔·亚吉(Omar Yaghi)三位科学家,以表彰他们在金属有机框架(Metal-Organic Frameworks, MOFs)材料开发方面的开创性贡献,这一突破让材料科学从“偶然发现”进化为“可编程设计”。MOFs常被比作“分子积木”,由无机节点和有机配体构建而成,具有极其丰富的结构多样性和高度可调控的性质,在气体储存、分子分离、催化、污染物去除、空气集水、能源转换与存储、传感以及生物医药等领域展现出极为广泛的应用前景。
由于无机节点具有多样性,而有机配体的种类近乎无限,二者排列组合的可能性更是指数型增长,为MOF提供极其广阔的设计空间,同时为依赖人工枚举与试错的传统研发流程带来挑战。随着生成式人工智能和基础模型的快速发展,变革性的创新方案正在成型:通过学习海量数据库,AI模型可以实现逆向结构设计,以前所未有的速度定位具有潜力的新材料。
然而,要在材料科学领域充分发挥生成式人工智能和数据驱动方法的潜力,还需要在结构验证工具方面取得进展。为应对这一需求,沙特阿美与由生成式人工智能驱动的生物医药科技公司英矽智能(Insilico Medicine, 03696.HK)的研究人员共同推出AI筛选与验证系统Sanity Pipeline,旨在解决材料科学中结构有效性验证的关键挑战。该研究成果于近期以预印本论文形式在ChemRxiv上发表。
由于无机节点具有多样性,而有机配体的种类近乎无限,二者排列组合的可能性更是指数型增长,为MOF提供极其广阔的设计空间,同时为依赖人工枚举与试错的传统研发流程带来挑战。随着生成式人工智能和基础模型的快速发展,变革性的创新方案正在成型:通过学习海量数据库,AI模型可以实现逆向结构设计,以前所未有的速度定位具有潜力的新材料。
然而,要在材料科学领域充分发挥生成式人工智能和数据驱动方法的潜力,还需要在结构验证工具方面取得进展。为应对这一需求,沙特阿美与由生成式人工智能驱动的生物医药科技公司英矽智能(Insilico Medicine, 03696.HK)的研究人员共同推出AI筛选与验证系统Sanity Pipeline,旨在解决材料科学中结构有效性验证的关键挑战。该研究成果于近期以预印本论文形式在ChemRxiv上发表。
英矽智能与沙特阿美签署意向性合作协议
文章作者指出,“在大规模MOF数据库上训练的生成式AI模型面临一个关键挑战,即CIF文件中隐藏的几何不一致、连接方式错误,以及不合化学逻辑的氧化态。这些问题会导致训练数据产生偏差,降低模型可靠性,并导致生成不切实际的材料。虽然现有工具可以解决问题的个别方面,但仍然无法提供适合现代生成式工作流程的统一、可扩展解决方案。”
针对这一瓶颈,双方此次推出的多层级AI筛选与验证系统Sanity Pipeline结合了高速预筛选和深度验证,既支持高通量筛选,又能对缺陷进行精细检测。其核心模型由沙特阿美和英矽智能联合开发,包括用于超高速MOF分解和结构分析的工具LibCIF,以及用于识别氧化态异常的检测器OxiChecker。此外,该系统还整合了多种成熟的几何与晶体学验证工具,形成统一、可扩展的验证工作流。
LibCIF能够快速将晶体结构分解为节点、配体和分子片段,并执行结构检查。与现有解决方案相比,它实现了显著的速度提升,能够实时处理大规模数据集,因此尤其适用于对反馈速度高度敏感的场景,包括强化学习管线和大规模生成式AI结果筛选等。
OxiChecker则通过评估电荷中性和氧化态一致性,提供了补充性的化学验证。它采用多路径电荷分配策略,处理共轭体系和自由基体系中的模糊性,并针对常见无机和有机金属基团引入特定领域规则。和传统工具相比,OxiChecker可以不受化学键分类不明的影响,在噪声相对严重的生成式AI输出结果中维持可靠的表现。
通过整合多个高效组件,Sanity Pipeline构建了一个可扩展的验证链条,同时支持实时筛选和高精度离线分析,可根据使用场景在速度和准确性之间实现灵活平衡,为下一代材料发现和AI驱动的设计打下坚实基础。
目前,Sanity Pipeline系统已在技术交流社区GitLab公开发布,有望广泛支持新型材料发现及其向实际应用的转化。
作为英矽智能与沙特阿美携手推出的最新落地成果,Sanity Pipeline的发布进一步巩固了双方合作关系。自2023年在LEAP科技大会上签署战略合作协议(MoU)以来,双方协同合作,利用生成式人工智能技术,在可持续发展与衰老相关科学的交叉领域推动创新。
针对这一瓶颈,双方此次推出的多层级AI筛选与验证系统Sanity Pipeline结合了高速预筛选和深度验证,既支持高通量筛选,又能对缺陷进行精细检测。其核心模型由沙特阿美和英矽智能联合开发,包括用于超高速MOF分解和结构分析的工具LibCIF,以及用于识别氧化态异常的检测器OxiChecker。此外,该系统还整合了多种成熟的几何与晶体学验证工具,形成统一、可扩展的验证工作流。
LibCIF能够快速将晶体结构分解为节点、配体和分子片段,并执行结构检查。与现有解决方案相比,它实现了显著的速度提升,能够实时处理大规模数据集,因此尤其适用于对反馈速度高度敏感的场景,包括强化学习管线和大规模生成式AI结果筛选等。
OxiChecker则通过评估电荷中性和氧化态一致性,提供了补充性的化学验证。它采用多路径电荷分配策略,处理共轭体系和自由基体系中的模糊性,并针对常见无机和有机金属基团引入特定领域规则。和传统工具相比,OxiChecker可以不受化学键分类不明的影响,在噪声相对严重的生成式AI输出结果中维持可靠的表现。
通过整合多个高效组件,Sanity Pipeline构建了一个可扩展的验证链条,同时支持实时筛选和高精度离线分析,可根据使用场景在速度和准确性之间实现灵活平衡,为下一代材料发现和AI驱动的设计打下坚实基础。
目前,Sanity Pipeline系统已在技术交流社区GitLab公开发布,有望广泛支持新型材料发现及其向实际应用的转化。
作为英矽智能与沙特阿美携手推出的最新落地成果,Sanity Pipeline的发布进一步巩固了双方合作关系。自2023年在LEAP科技大会上签署战略合作协议(MoU)以来,双方协同合作,利用生成式人工智能技术,在可持续发展与衰老相关科学的交叉领域推动创新。