发布时间:2025-12-05 浏览次数:
我院张玉娟教授课题组在“生命科学+人工智能”交叉领域持续取得重要进展,特别是在生物大数据挖掘、蛋白结构建模和分子功能预测等方面。通过与我校数学科学学院、上海交通大学等单位合作,连续在国际权威期刊上发表一系列研究成果,展现了生命科学在人工智能技术推动下取得的创新发展与科研突破。
揭示蛋白定位规律:ESM2模型实现特征可解释化,在《 Briefings in Bioinformatics》(中科院一区)发表题为Interpretable feature extraction and dimensionality reduction in ESM2 for protein localization prediction的研究论文。该论文提出基于大型蛋白语言模型ESM2的可解释特征提取与降维框架。该研究结合自注意力机制(Attention)与变分自编码网络(Res-VAE),有效提升了模型对蛋白序列语义信息的捕捉能力,并揭示了不同序列区域与细胞器定位的映射规律。该方法在多种亚细胞定位数据集上取得领先性能,兼具高精度与可解释性,为蛋白功能解析与细胞组学研究提供了新思路。在论文发表1年的时间,引用次数已达到43次。
蛋白泛素化修饰的跨物种泛化预测突破,在《PLOS Computational Biology》(中科院二区Top)发表题为EUP: Enhanced cross-species prediction of ubiquitination sites via a conditional variational autoencoder network based on ESM2的研究论文。该论文首次将蛋白大语言模型 ESM2 与条件变分自编码器(cVAE)结合,构建新一代泛素化位点跨物种预测模型。EUP在十种物种数据中实现高精度预测(最高准确率达0.945),并借助可解释算法(SHAP、Integrated Gradients)揭示了不同物种间保守的功能特征。团队同时开发了EUP在线预测平台(https://eup.aibtit.cn),实现了对蛋白泛素化位点的在线智能预测和可视化分析,推动了AI模型在蛋白质修饰机制研究中的落地应用。

图 EUP 的整体框架概览
AI赋能动物学研究,在《Zoological Research》(中科院一区top)上发表题为From beasts to bytes: Revolutionizing zoological research with artificial intelligence的综述论文,系统总结了人工智能在动物学研究中的发展脉络与应用趋势,深入探讨了计算机视觉、自然语言处理、深度学习和多模态融合在动物识别、行为分析、生态监测、进化关系解析等领域的典型案例,指出AI技术正在重塑动物学研究范式。该工作为构建面向复杂生命系统的智能化研究体系奠定了重要理论基础。AI正在成为理解生命复杂性的有力工具。通过模型的可解释化与跨物种迁移能力,推动人工智能真正融入生命科学研究,助力智慧科研与智能生命科学的发展。

图 人工智能在动物学不同领域的应用
论文链接:
DOI: 10.1371/journal.pcbi.1013268
DOI: 10.1093/bib/bbad534
DOI: 10.24272/j.issn.2095-8137.2023.263
供稿:张玉娟课题组
一审一校:朱 波
二审二校:乐 涛
三审三校:付长波