实现单基础模型通解多类有机反应预测
中化新网讯 近日,上海人工智能实验室与武汉大学联合提出LoRA-Chem,首次实现单基础模型通解多类有机反应预测,在保持大模型通用能力的同时,在专业任务表现上比肩甚至超越专有模型。
据介绍,LoRA-Chem框架跳出了传统基于特征的有机化学反应预测方法和图神经网络(GNNs)策略,以大语言模型为基础,借鉴低秩适应(LoRA)技术,打造“共享基础模型+可替换LoRA模块”的架构。当需要预测多个反应时,研究人员只需替换对应的LoRA模块,无需重新训练整个模型。同时,该模型还支持自然语言交互,输入反应物的IUPAC名称或SMILES字符串,模型就能通过“类似思维链提示”先识别反应类型,再预测结果。值得一提的是,该模型拥有较高的数据效率,仅需数千个训练样本,在消费级GPU上半天就能完成训练。
研究团队在多个经典反应数据集上验证了LoRA-Chem的实力,关键指标均达到或超越当前主流方法;同时训练多种反应预测任务后,单个任务性能虽略有下降,但仍与“单任务专用模型”持平,打破了传统模型“一事一训”的限制。此外,LoRA-Chem还展现出可扩展性,当基于性能更优的Qwen2.5-7B-Instruct模型微调时,其对同一化学反应的预测参数进一步提升。
另一方面,不同于传统模型微调后“专精一项、丢掉其他”的问题,LoRA-Chem在专注反应预测的同时,完整保留了LLM的原有能力。测试显示,搭载LoRA-Chem的模型在数学推理、语言建模、多学科知识等任务上,性能与原始模型几乎一致,这意味着它能融入现有LLM系统,成为合成化学研究的“智能助手”。
目前,团队已公开LoRA-Chem的数据集、训练代码和模型文件。未来,这一框架有望在药物合成、新材料研发等领域发挥作用,推动有机化学研究向“数据驱动+AI辅助”的模式转型。
12月4日,记者从中国石化新闻办获悉,11月27日在南京举行的2025世界智能制造大会上,工信部等六部委联合公布首批15家领航级智能工厂项目培育名单,中国石化镇海炼化是其中唯一入选的炼化企业。此外,中...
“十四五”期间,我国石化行业数字化转型成效显著,但仍面临深层挑战。近日在天津举行的2025中国石油和化工民营经济高质量发展大会——生产与科技服务业高端发展论坛上,专家指出,下一步,行业需聚焦数据治理、...
“一切涂料制造工艺深刻变革的核心驱动力,正是智能化、数字化、绿色化、自动化的深度融合。”日前,在江苏张家港举行的2025中国国际涂料智能制造产业链发展大会暨2025年中国涂料工业协会涂料装备分会年会上...
近日,沧州临港经济技术开发区“渤海化工网”(www.bhhgw.cn)正式上线运行,区内及周边企业的产品销售和原材料采购可实现足不出户“买全国、卖全国”。
近日,由中国有研集团有研工程技术研究院有限公司(以下简称有研工研院)自主研发的氢氦分离提纯装置应用于山西吕梁的天然气闪蒸气(BOG)提氦一期项目,经历长时间、低温环境运行考核,成功产出99.999%以...