新闻事件
最近Chem杂志发表一篇人工智能设计药物和天然产物合成路线的文章,该工作使用一个叫做Chematica 的软件设计了七个药物和一个天然产物的合成路线,并首次在实验室验证了软件设计的路线、完成了这些化合物的合成。结果显示Chematica 花15-20分钟设计的路线不仅和已知路线显着不同,而且都有明显改进,或者产率更高、或者路线更短。这个平台的核心是其约五万个反应规则,但也加入了对反应中心附近电子、立体效应的评估,禁止一些不可能反应、惩罚选择性差、产率低的反应。除了这些反应规则这个平台还整合了网络理论、高速计算、人工智能、化学知识专家系统等,解决了以前设计系统化学知识不足、从反应网挑选路线效率低、缺少高等逻辑等问题。
药源解析
AI现在大举入侵,在新药研发的各个阶段和领域都有介入,从靶点选择到化合物设计。合成路线设计自动化虽然从60年代开始就有人做,但从来没有出现过可以与化学家竞争的设计软件。甚至在此之前从来没有人在实验室验证AI设计的合成路线是否可行,可见业界对其重视程度。合成新物质是有机化学的核心任务之一。在现代物理技术如核磁、质谱普及之前复杂化合物的结构鉴定都是非常困难的问题,而全合成是最可靠的结构鉴定技术。合成技术也令天然丰度较低的物质可以大量生产,自然界不存在的物质只要有用也可以通过合成技术得到。现在已知化合物中绝大多数是人工合成的。
设计合成路线的基本逻辑非常简单, 70年代由E.J.Corey形式化为逆向合成分析。这个过程和做饭很类似,假如有人让你设计一碗炸酱面你需要逻辑上倒推。要做炸酱面你需要炸酱和面条。要做炸酱你要有酱、油、肉等,要做面条你要面和水。你买了这些原料从逆向合成分析的最后一步开始,如果一切顺利最后你能得到一碗炸酱面。当然虽然逻辑简单,但细节还是非常复杂,不同人做结果完全不同。你想不到的别人可能想到、你做不出来的别人可能做出来、你认为不可能的别人能实现。
前两年阿尔法狗先后战胜几名世界顶级棋手,AI的威力开始令人刮目相看。但围棋的规则是刚性、明确的,而有机反应要复杂的多。同样是羰基alpha位手性中心消旋化反应,该氢的动力学酸性和多种因素有关如醛基比酯基更快,空间位阻、电子效应也影响很大。如果5个原子以外有个碱性氨基,这个中心消旋化进一步加速。这些微妙区别虽然可以编入程序但很难量化,经验丰富的人判断要准确的多。化学文献里面有大量不可重复的反应,这个机器也很难准确判断,如何去粗取精是个大问题。尽管有机化学很成熟,但仍有不少现象难以解释和预测,我就听说过几例复杂天然产物全合成因为最后一步脱TBS不成功被迫返工的例子,这也会令AI为难。
但是我认为AI进入合成化学的大趋势不可逆转。Chematica 如果与以流体化学为核心自动合成技术联合起来可能令很多日常化学合成自动化,现在已有厨房就能放下的合成机器人。以后机器人不仅可以操作而且可以自己设计合成路线。当然高端合成可能永远需要化学家的参与,现在四环素、大环内酯抗生素的深度改造还只有少数企业有能力做。优秀的化学家不仅可以从不可能中看到可能,而且有估算需要多少投入能证实或证伪一个策略的超人直觉。即不被暂时失败吓退、也不会在没有希望的路线过度投入,这些素质最难被AI掌握。合成化学更像烹调而不是围棋,AI可能很快会比90%化学家更高明,但击败Phil Baran要比击败柯洁困难得多。
来源:美中药源(微信号 meizhongyaoyuan) 作者:路人丙