用人工智能预测药物合成,默克生命科学在中国办了一场比赛
默克生命科学发起的“逆合成反应预测大赛”决赛 4 月 19 日在上海举办。逆合成反应预测,简单来说就是先写出问题的答案,再一步一步反过来推导出问题的过程。
传统的化学研究中,化学家逆向推导的工作量巨大。首先需要从目标产物的分子式开始分析,再通过搜索已知相似结构或文献报道中的合成路径,来确认目标产物需要什么样的原料、试剂和反应序列。
用简单的原料来合成复杂化合物具有难度。这个过程往往会浪费十几天或者更长时间,放慢新药研发速度。
默克生命科学中国董事总经理卫政熹告诉《好奇心日报(www.qdaily.com)》,整个过程就像是用不同的解题思路来尝试推导出答案。“得益于有机化合物和生物医药的发展,医药界积累的数据有明显增长,如何使用成为新的问题。”
人工智能被拿来提高效率。本次大赛,默克生命科学向高校和机构的研究学者提供了含有 180 万有机化学反应的数据库,参赛选手需要以此建模,利用人工智能分析目标产物,来预测合成反应物。
以代码构成的人工智能取代的是处理海量的化学反应方程,让计算机不断尝试越来越多的合成路径。从而解放科学家。
一等奖由来自北京大学“分子设计实验室”的 MDL 团队摘得,成员的背景涵盖化学、化学信息学、药物信息学与计算机。队中三名选手并非都是化学研究者,还包括了算法工程师等。本次比赛中,参赛的学生选手有 76.76% 来自计算机科学专业。
他们的作品基于深度学习模型 DeepRetroReact,直接来预测反应物,并基于反应规则来预测可能的候选反应物,再对生成的反应物进行打分,设计策略选取最佳的反应物组合。团队采用机器翻译的 Transformer 模型作为核心架构,根据 Product 和 Reagent 为每个反应加上反应类型标签,并加入了 atom 的信息,确保得到的结果在化学形式上更加合理。
程序员参与制药研发,被认为是未来的趋势,但卫政熹认为这一趋势还需要一段时间才能到来。“人工智能的应用相当有潜力,但目前来说,最大的帮助还是处理原本需要大量人力进行的重复性工作。从而缩短研发时间,降低研发成本。”
新药研发回报率过低,是近几年各大药企遭遇的困境。德勤在 2019 全球生命科学展望”的分析报告中称:全球 12 家大型生物医药公司通过药物研发创新获得的回报降到了 9 年来的最低水平,平均回报率只有 1.9%。
新药研发的流程复杂,周期较长,从基础研究,到药靶研究、生化研究、前临床开发、临床试验。人工智能在其中只能影响环节中的一小部分。目前中国人工智能技术在医疗领域的应用普遍只集中在影像辅诊板块。
虽然,人工智能在制药研究中还处于初期阶段,但投资已经涌入。2016 年中国人工智能制药研发市场投资规模为 100 亿元,两年后已经翻倍到 200 亿元,复合年平均增长率超过 40%。
选择在中国举办制药比赛也是因为默克看中中国庞大的医药市场和人才储备。卫政熹在采访中提到“人工智能领域全世界所有发布论文中有 40% 来自于中国,剩下 40% 来自于 Google”,默克希望借比赛机会打造人工智能和生命科学领域的交流平台。
过去两年内,跨国药企在中国投资频繁。2017 年,默克宣布在江苏南通投资 8000 万欧元建立生命科学中心。不仅仅是默克,去年 10 月,罗氏投资约 4.5 亿瑞士法郎(约 25 亿人民币)在苏州设立生产研发中心。此前,全球制药排名前十的辉瑞也将旗下全球第三个、亚洲第一个的生物技术中心建设项目落在了浙江杭州。
题图来源:pexels.com
我们做了一个壁纸应用,给你的手机加点好奇心。去 App 商店搜 好奇怪 下载吧。
作者暂无likerid, 赞赏暂由本网站代持,当作者有likerid后会全部转账给作者(我们会尽力而为)。Tips: Until now, everytime you want to store your article, we will help you store it in Filecoin network. In the future, you can store it in Filecoin network using your own filecoin.
Support author:
Author's Filecoin address:
Or you can use Likecoin to support author: