研發團隊表示,人工智能正在重塑科研底層邏輯、加速科學發現,“人工智能+科學”已成為趨勢,為解決人類面臨的重大科學技術難題提供了前所未有的機遇。
“磐石·科學基礎大模型”發布海報。中國科學院自動化研究所 供圖
最新發布的“磐石·科學基礎大模型”采用專業科學知識和數據進行訓練、服務于科學任務的智能底座,實現對波、譜、場等多種科學模態數據的深入理解,具備科學文獻萃取融合、科學知識表征推理和科學工具編排規劃等核心能力。真正擁有跨學科“操作系統”
當前,“人工智能+科學”研究普遍采用領域數據微調通用大模型、各自構建單一領域專用工具的模式,面臨科學數據孤島、專業推理能力不足、研發生態封閉三大挑戰。
聚焦這些挑戰,中國科學院聯合研發團隊充分發揮完整自然科學學科體系、全棧式人工智能創新鏈、重大科學設施與科學數據等優勢,開展體系化布局,推動“人工智能+科學”向平臺化、體系化的新范式加速變革。
“磐石·科學基礎大模型”可實現對數據和模型等各類資源的管理,以及對計算仿真等各類工具的調度,深度賦能“假設提出-方案規劃-仿真推演-實驗驗證-規律發現”的科研全流程。
這意味著,“人工智能+科學”已真正擁有跨學科“操作系統”。科研工作者可在科研各環節輕松調用模型,實現人工智能在科學研究中的無感嵌入。面向科學領域進行深度定制
研發團隊介紹,“磐石·科學基礎大模型”始終圍繞科研人員的核心需求,以強大、全面的科學專業能力支持科學發現。
在核心架構方面,“磐石·科學基礎大模型”采用異構混合專家架構,在中國國產開源大模型基礎上面向科學領域進行深度定制,集成自主研發的一系列面向共性科學數據模態的專用模型,并融合AlphaFold、MatterGen等領域專業模型。
在科學能力方面,“磐石·科學基礎大模型”已系統掌握數理化天地生六大學科核心定理、定律與專業知識,并實現對波、譜、場等多種科學模態數據的深入理解。
具體測評中,在基礎學科領域國際通用的數據集里,“磐石·科學基礎大模型”達到數學、物理、化學、材料、生物各學科門類當前最佳性能;在通用人工智能助手測試基準(GAIA)、事實性問答數據集(SimpleQA)等國際權威測試中,展示領先的科學專業工具調用和科學推理性能;在人類終極考試(HLE)中取得優秀成績。
“磐石·科學基礎大模型”相關介紹圖示。中國科學院自動化研究所 供圖
基于“磐石·科學基礎大模型”,研發團隊還開發出“磐石·文獻羅盤”和“磐石·工具調度臺”兩個科學智能體。
其中,“磐石·文獻羅盤”旨在輔助科研人員精讀文章、撰寫綜述、評估科研選題與技術路徑,已接入1.7億篇科技文獻與實時開源科技信息,可深度理解包含公式與圖表的科學數據,一次性透徹梳理上千篇文獻。在其支持下,以往需要3至5天才能完成的文獻調研工作可縮短至20分鐘。
“磐石·工具調度臺”旨在降低科研工具的使用門檻,可自主規劃及調用超過300個科學計算工具,實現工具的協同編排和便捷調用,可自動識別科研任務、智能編排并調度最優工具鏈,提升科研流程效率,支持用戶靈活接入自有智能體與工具,快速搭建專屬科研應用。在多學科領域開展深入應用
目前,“磐石·科學基礎大模型”已在多個學科領域開展深入應用,大幅加速科研進程。
在生命科學領域,研發團隊依托“磐石·科學基礎大模型”構建X-Cell數字細胞大模型,實現從基因序列和中心法則到細胞表型的整體建模,推動數字細胞實現靶點發現全流程自動化。X-Cell正在支持調控網絡分析、虛擬細胞實驗和靶點發現應用。以蛋白質相互作用的藥物靶點發現為例,相對現有范式科研效率加速超過10倍。
在高能物理領域,依托“磐石·科學基礎大模型”,北京正負電子對撞機的研究人員正在實現粒子物理研究任務的自動分解與高效規劃,生成覆蓋粒子物理工作流各階段的分析程序,從而有效提升粒子模擬速度與重建效率,為探索物質基本組成和宇宙基本規律提供助力。
在力學研究中,“磐石·科學基礎大模型”發揮強大的科學數據理解和預測能力,高效計算高鐵模型在多種流體環境下的表面壓力場,為高鐵構型設計提供數據支持。
此外,“磐石·科學基礎大模型”正幫助科學家在化學合成中提升實驗效率、在分子結構預測中實現更加準確的預測結果、在天文觀測中實現智能化的全球資源調度與分析……并在服務真實科學需求的過程中,持續迭代提升模型的實用性與可靠性。
“磐石·科學基礎大模型”相關應用案例。中國科學院自動化研究所 供圖
研發團隊表示,“磐石·科學基礎大模型”已初步成為科學知識的全能手、文獻的超級分析師、專業問題的精算家,并將逐漸成長為科研攻堅的參謀和智囊,服務科學、賦能科研。
中國科學院自動化研究所透露,為推動“人工智能+科學”協同創新,該所已聯合40余家科研院所、高等院校及企業合作伙伴共同啟動“科學基礎大模型生態聯盟”計劃,并積極推動國產算力適配,著力構建開源開放、自主可控的“人工智能+科學”新生態,將為全球學術共同體貢獻中國方案。
關鍵詞: