首页
港粤资本
投研信息
项目介绍
港粤活动
联系我们
加入港粤

麻省理工重磅《Science》:基于AI的逆合成路线设计,机器人全自动合成了15个药物分子

2019-11-22

  基础科学驱动价值投资

港粤资本

专注新技术应用场景的中早期投资

旗下直投基金、跟投基金、产投基金

布局结合新技术的创新性项目

重点关注教育、医疗、金融产业的创新公司

培育行业领军者

极速BP通道:bp@ifsc-gd.com

合成复杂有机分子的能力对于发现和制造功能性化合物(包括小分子药物)至关重要。几个世纪以来,化学合成已从艺术发展到科学。

像Robert B. Woodward和Elias J. Corey这样的二十世纪化学家帮助开发了设计合成的逻辑基础,计算机科学的进步使人类能够将这些规则教授给人工智能算法,使他们能够规划化学途径来分析目标分子。

虽然自动化学合成机器的工作已经被报道过(Science:化学计算机问世,药物合成进入自动化时代),但是能够将计算机辅助合成路线设计(CASP)、反应条件优化与评估、以及机器人执行等全流程进行整合的的自动化合成平台还未被开发。

8月9日,最新一期《Science》杂志发表了来自美国麻省理工学院(MIT)研究人员一篇题为“A robotic platform for flow synthesis of organic compounds informed by AI planning”的论文。

文章描述了一种结合AI设计合成路线和机器人执行的自动化合成平台,该方法基于美国专利和Reaxys数据库中的反应训练了人工智能算法,能够为给定分子提出合成路线,包括反应条件,并根据步骤数和预测产量评估哪条路径最佳。

同时,该系统拥有一个灵活的机器人手臂,能够执行所有合成操作流程,实现自动化合成。研究人员证明该机器人平台可以成功用于15个化学小分子药物的合成路线设计和自动化合成。

来源:Science. 利多卡因30倍速合成过程示例。其中反应器选择,反应器放置,试剂管线组装,工艺模块密封,工艺堆栈压缩,工艺模块释放,反应器拆卸和反应器存储的步骤以较少加速的插图突出显示。

合成路线规划模块 

Synthesis-planning module

计算机辅助合成路线设计(CASP)在进入实验室前已经被作为一种工具帮助化学家确定反应路线。如今,从反应数据库(例如Reaxys,SciFinder)中搜索已知化合物的已知反应已成为一项常规技能。

然而,除了最近报道的Chematica程序可以基于专业编码对新路线进行设计外,计算机设计合成路线几乎没有实质性的进展。数据科学和机器学习的最新进展带来了科学家对CASP的新兴趣,最近的一些研究,包括Segler等人应开发的Monte Carlo树加速了计算机辅助合成路线设计的发展。

MIT研究人员开发的新系统结合了三个主要步骤:首先,由人工智能指导的软件提出了合成分子的途径,然后专家化学家审查这条路线并将其细化为化学“配方”,最后将配方发送到机器人平台,自动组装硬件并执行反应构建分子。

研究人员为计算机辅助逆合成路线设计(CASP)开发了一个开源软件ASKCOS(图2B),该软件套件受到Reaxys数据库和美国专利商标局数百万反应的培训,旨在通过学习应用逆合成转化,确定合适的反应条件,并评估反应。

该算法利用Reaxys中1250万个单步反应归结出大约164,000个可靠规则。然后训练一个神经网络(NN)模型来预测这163723个规则中最能够转化应用到目标分子结构上的规则。

在每种情况下,系统询问是否存在将给定反应物转化为预期产物的任何条件。最终目标是将目标化合物追溯为可从供应商如Sigma-Aldrich获得的容易且廉价的小分子。

图1. A. 按需合成目标有机化合物的工作流程;B.结合化学信息学和机器学习的软件模块,用于设计和验证合成途径;C.机器人流动化学平台的照片。

推荐的合成路线部分涵盖CRFs文件(refined chemical recipe files),需要用户提供额外的信息来定义停留时间,化学计量和浓度来保证连续的流程。

为了执行这些合成,机器人臂根据CRF中定义的期望过程配置将模块化过程单元(反应器和分离器)组装成连续流动路径。

机器人还通过流体开关板将试剂管线和计算机控制的泵连接到反应器入口,系统开始合成。在指定的合成时间之后,系统使用清洁溶剂冲洗管线,并且机械臂断开试剂管线并将处理模块移至其适当的存储位置。

图2. 软件以safinamide为例说明工作流程:A. 查询目标分子; B. 预测合成路线;C. 预测的10种可能反应条件;D. 在最佳条件下预测反应主要产物;E. 链接到支持每个反应模板的文献先例摘要,包括导出Reaxys查询的选项。

流动化学机器人平台

Robotic flow chemistry platform

研究人员基于前人的即插即用单元操作设计了一个自动设置连续合成系统。如图3所示,该系统包含进程栈、反应器、分离器和溶剂树。

这个合成路线设计软件和自动化合成平台被用于15种药用相关的小分子的设计和自动合成,包括阿司匹林(91%)、secnidazole、利多卡因、地西泮,和能够证明能识别立体化学的(S)-华法林(78%,er 4:1)和safinamide,还合成了2种化合物库:5种ACE抑制剂,包括喹那普利和4种非甾体类抗炎药,包括塞来昔布。

这些目标需要总共8种特定的逆合成路线和9种特定的工艺配置。

图3. 流动化学机器人平台的组成模块(A)进程栈,其中模块与UPB连接以形成连续的流动路径(左)和显示加热的反应器的热图像(右); (B)试剂树和试剂歧管的正视图; (C)反应器主体正视图; (D)1.0毫升反应器处理模块; (E)双柱填充床反应器工艺模块; (F)一次性PFA反应器插件; (G)1.0毫升反应器背面的集成电子器件; (H)在线膜分离器; (I)UPB的特写镜头,其中装有1.0毫升反应器。

图4. 以阿司匹林,secnidazole,利多卡因,地西泮,(S)-华法林和safinamide 为例的合成预测和自动合成

总结

研究人员承认该系统目前还存在一些挑战:

1.对过程强化的需求(例如减少反应时间),减少固体形成以避免堵塞,在非水溶剂和非环境温度下溶解度的计算预测仍然困难;

2.预测合适的纯化方法也非常具有挑战性,尤其是对于非柱层析的方法;

3.文章展示的反应例子都是单步或者两步的,多步反应的优化会由于参数的传播而变得复杂。

总的来说,CASP和流动化学机器人的整合平台代表了完全自主化学合成之路上的里程碑,解放化学家的双手似乎越来越成为可能。

但目前为止,该系统只能使用已知的反应,研究人员希望AI最终可以用于根据已知结果预测全新的合成步骤。研究人员认为,化学空间巨大,最好的合成化学家可以使用的所有工具,但仍然很难合成一些复杂分子,因此期望这些自动化系统能够与最优秀的人类化学家合成相同范围的分子是不现实的。所以像这样的系统将是助手,而不是替代品。

参考资料:

1. Science 2019. DOI: 10.1126/science.aax1566.

2. Automating synthesis from planning to execution, C&EN

往期精彩回顾:

1

最近20年,登上Nature封面的中国研究成果

2

走进独角兽 · 贰丨晶泰科技—AI+新药研发领域标杆企业

3

港粤观察 | 政策对医药投资的影响

港粤资本成立于2014年,是一家专注新技术应用场景的中早期投资的投资机构。公司于2015年开始布局STEAM教育赛道,成功投资搭搭乐乐、麦高创想家、盛思科教等创客教育项目,也成功投资阳阳魔法学院、AI音乐学院、凯瑞宝贝等线上线下教育项目。投资项目中已有多个实现退出,并取得可观的投资回报。目前重点关注新技术、尤其人工智能在教育、医疗、金融等领域的应用项目。如果您是人工智能及大数据领域的优秀创业团队,欢迎联系我们港粤资本的投资经理,期待合作,共同成长。

港粤资本

 

本篇文章来源于微信公众号:港粤资本

相关推荐

中国首个新冠疫苗:陈薇少将带队,比预期提前 1 个月
2020-03-21
港粤观察丨职业教育市场将会孕育多少独角兽企业?
2019-03-05
医疗器械行业分析 4:体外诊断
2020-06-13

深圳市福田保税区桃花路1号创业中心3B1-06

网站备案号:粤ICP备18126401号-1

返回顶部