編者按:日前,復旦大學特聘教授、上??茖W智能研究院(下稱“上智院”)院長、啟明創(chuàng)投投資企業(yè)無限光年創(chuàng)始人漆遠與中國科學技術(shù)大學科技傳播系副主任袁嵐峰進行對話。漆遠表示,要把真實的問題和底層的技術(shù)創(chuàng)新結(jié)合在一起,他以伏羲氣象大模型、女媧生命大模型、燧人物質(zhì)大模型為例,分享了用人工智能破解高價值產(chǎn)業(yè)場景中關(guān)鍵科學問題的實踐。圍繞如何讓更多人及行業(yè)都受益于AI技術(shù),他指出,工程優(yōu)化和開源生態(tài)才能系統(tǒng)化實現(xiàn)普惠智能,并介紹了基于這一思維打造的科學智能的生態(tài)基座。漆遠也分享了他對AI for Science的終極目標及現(xiàn)實目標的思考。
啟明創(chuàng)投微信公眾號經(jīng)授權(quán)轉(zhuǎn)載。
復旦大學特聘教授、上??茖W智能研究院院長、無限光年創(chuàng)始人漆遠
隨著人工智能技術(shù)以前所未有的速度滲透到各個領(lǐng)域,科學研究也迎來了顛覆性的變革。傳統(tǒng)的科研范式正在被AI所重塑,AI for Science(人工智能驅(qū)動科學研究)應運而生,成為科學界最受矚目的焦點。那么,AI for Science何時才能迎來如同DeepSeek般的爆發(fā)式增長,真正實現(xiàn)技術(shù)普惠,改變?nèi)藗兊纳睿?/span>
在東方衛(wèi)視的全新科技觀察節(jié)目《錨點》中,復旦大學特聘教授、上海科學智能研究院院長、無限光年創(chuàng)始人漆遠與中國科學技術(shù)大學科技傳播系副主任袁嵐峰展開了一場深入對話,并給出了他的答案:AI for Science的“DeepSeek時刻”就是實現(xiàn)“AI機器貓”——他希望AI for Science可以造就出服務(wù)千行百業(yè)的產(chǎn)品,成為各領(lǐng)域人士觸手可及的賦能工具,也真正走進老百姓的生活。
01/
AI是科研的新范式
也是公司的新范式
節(jié)目伊始,袁嵐峰就拋出了核心問題:AI for Science何時才能迎來自己的DeepSeek時刻?漆遠認為,這個時刻正在加速接近,正處于爆發(fā)前夜。他所領(lǐng)導的上智院,正是這樣一個聚焦AI for Science的戰(zhàn)略性新型研發(fā)機構(gòu),人工智能專家、領(lǐng)域科學家和工程師在這里緊密協(xié)作,共同探索AI在科學領(lǐng)域的無限可能。
在上智院,以伏羲氣象大模型、女媧生命大模型、燧人物質(zhì)大模型為代表的垂直領(lǐng)域科學大模型正將AI的觸角伸向科研最前沿。這些以華夏文明始祖命名的系統(tǒng),承載著用人工智能破解高價值產(chǎn)業(yè)場景中的關(guān)鍵科學問題的使命。
伏羲氣象大模型的實戰(zhàn)價值在2024年超強臺風“貝碧嘉”的預測中得到驗證。當多數(shù)機構(gòu)預測臺風將在浙江臺州到江蘇啟東一帶沿海登陸時,“伏羲”提前5天鎖定上海浦東為最可能登陸點,并通過每6小時更新的動態(tài)預報持續(xù)修正軌跡。該系統(tǒng)目前已與中國太平洋財產(chǎn)保險股份有限公司、中國遠洋海運集團有限公司等企業(yè)合作,為遠洋航線規(guī)劃提供氣象支持,同時應用于新能源領(lǐng)域的光伏、風電效率優(yōu)化。
以生命科學的微觀基因、宏觀表型兩大基礎(chǔ)場景為抓手,女媧生命大模型致力于為基因創(chuàng)新藥研發(fā)、數(shù)字孿生診療等產(chǎn)品平臺提供基礎(chǔ)模型能力,打破傳統(tǒng)遺傳調(diào)控、生物力學計算模式,實現(xiàn)跨越式的生命狀態(tài)預測。面向可有效干預致病基因、比傳統(tǒng)藥物更能精確針對病因的siRNA,團隊使用多模態(tài)基礎(chǔ)模型合法解析專利后生成siRNA數(shù)據(jù)庫,并基于數(shù)據(jù)庫構(gòu)建了一個AI基礎(chǔ)模型,用于對siRNA藥物進行虛擬篩選,在實驗驗證階段將多靶點藥物的療效預測誤差從40%降低到了8%。
燧人分子基礎(chǔ)大模型聚焦物質(zhì)科學的核心挑戰(zhàn),致力于構(gòu)建理解分子世界的通用工具。在電池研發(fā)領(lǐng)域,模型構(gòu)建了929個分子的潛在篩選庫以訓練生成模型,加速鋰電池電解液新型配方的探索;在環(huán)保材料方向,其從700多萬種虛擬分子中篩選出滿足各項性能要求的可持續(xù)高分子材料單體,助力提升一些常見材料的降解性能,降低環(huán)境污染;藥物研發(fā)則是另一重要應用場景,通過AI與計算方法的結(jié)合,團隊一個月內(nèi)發(fā)現(xiàn)某難成藥靶點的動態(tài)結(jié)合口袋(傳統(tǒng)實驗室或Alpha Fold 3難以捕捉),并篩選出實驗驗證的活性分子。
“AI是新的范式,是科研的范式,也是公司的范式,”漆遠說:“把自己的身體浸入水中,你才能夠真正地探索,找到鎖定的錨點,才能夠把真實的問題和底層的技術(shù)創(chuàng)新結(jié)合在一起。這是為什么我做科研又創(chuàng)業(yè)的一個重要原因?!?/span>
這種實踐哲學在DeepMind與Isomorphic Labs的合作模式中得到印證:盡管DeepMind作為谷歌旗下研究院專注基礎(chǔ)研究,但其與Isomorphic Labs構(gòu)建的“研究-應用”雙輪架構(gòu),通過向藥企提供AI藥物研發(fā)服務(wù)已創(chuàng)造超30億美元商業(yè)價值。這種跨界協(xié)同機制揭示了AI范式的雙重屬性——既是突破性的科研方法論,也是可持續(xù)的商業(yè)模式創(chuàng)新,為破解AI for Science“如何從實驗室走向產(chǎn)業(yè)”的命題提供了關(guān)鍵啟示。
02/
工程優(yōu)化和開源開放才能
系統(tǒng)化實現(xiàn)普惠智能
DeepSeek的出現(xiàn)之所以備受關(guān)注,不僅在于技術(shù)突破,更在于工程優(yōu)化和開源生態(tài)帶來的普惠智能,讓更多人和行業(yè)能夠使用AI技術(shù)。
當DeepSeek大模型將訓練成本壓縮至傳統(tǒng)方法的1/10、推理成本降至每百萬token一元時,背后是低秩分解技術(shù)削減參數(shù)冗余、通信計算并行化提升資源利用、GPU/CPU異構(gòu)調(diào)度打破工具枷鎖的工程突破。燧人分子基礎(chǔ)大模型研發(fā)中,上智院團隊重構(gòu)基于Fortran語言的工具包以及GPU通信架構(gòu),使分子動力學模擬效率提升10倍,直接節(jié)省90%計算成本?!八惴ㄏ袼枷?,而沒有工程就沒有‘肉身’”,漆遠如是說。
關(guān)于AI for Science的開源開放,漆遠以AlphaFold為例指出:該模型在開發(fā)階段依托開源基因組數(shù)據(jù)和底層分析工具實現(xiàn)突破,成功后又將預測的蛋白質(zhì)結(jié)構(gòu)開源共享。全球19個國家、200萬研究者基于其開源成果,推動了藥物研發(fā)、疾病機制分析等領(lǐng)域的應用創(chuàng)新。這驗證了“使用開源-貢獻開源”的良性循環(huán)對科學智能發(fā)展的關(guān)鍵作用。
這種突出工程和開放的系統(tǒng)化思維正驅(qū)動上智院構(gòu)建科學智能的生態(tài)基座。相對于DeepSeek這樣的大語言模型,垂直領(lǐng)域科學大模型更多樣化,尤其需要工具鏈和數(shù)據(jù)平臺的支持。
一站式AI4S特色智算軟件平臺由上智院-無限光年聯(lián)合實驗室攜手復旦大學各院系打造,如同科研版的Cohere,集平臺、模型和應用工具于一體,可服務(wù)多家高校與科研機構(gòu)。目前平臺已集成DeepSeek、AlphaFold 3等前沿模型,并完成6家國產(chǎn)GPU與10個領(lǐng)域模型的深度適配。
科學語料平臺由上智院牽頭、多方聯(lián)合共建,于2024世界人工智能大會首度公開亮相,具備從數(shù)據(jù)采集、加工到管理和建模的全鏈路能力,保證數(shù)據(jù)的高效加工、可信和安全互通。目前平臺已開源siRNA藥物研發(fā)數(shù)據(jù)集、有機分子QM計算數(shù)據(jù)集、伏羲中期天氣預報大模型數(shù)據(jù)集等一系列高質(zhì)量科學語料。
此外,上智院和復旦大學連續(xù)三年通過舉辦世界科學智能大賽開放科學問題,吸引年輕人和企業(yè)參與,共同推進科學智能的創(chuàng)新和應用。
03/
AI for Science的下一個“錨點”
是“AI機器貓”
“科學智能要問:一個真正的產(chǎn)品是什么,如何解決社會需求?”漆遠表示DeepSeek一個月內(nèi)用戶破億,核心之一在于有產(chǎn)品化的思路,即追求可用、成本要低,AlphaFold 2和AlphaFold 3是非常好的科技突破,卻未必能被稱之為產(chǎn)品。
在他看來,AI for Science的終極目標是實現(xiàn)“AI愛因斯坦”,即能夠發(fā)現(xiàn)新的、未知的科學規(guī)律。但在實現(xiàn)這個宏偉目標之前,更現(xiàn)實的目標是打造“AI機器貓”——一種能夠賦能千行百業(yè)的普惠智能。他以伏羲氣象大模型在臺風預測中的成功應用、女媧生命大模型在siRNA藥物設(shè)計中的突破為例,強調(diào)了AI for Science在解決真實問題方面的價值。
“‘AI愛因斯坦’是一個比喻,是指能夠做科學的發(fā)現(xiàn),但它不是一個人的發(fā)現(xiàn),其實是大家在群策群力解決一個非常有挑戰(zhàn)的科學問題。而DeepSeek更像一個機器貓,能夠賦能很多人、很多行業(yè),在你需要的時候變出一個工具幫你解決問題。”漆遠形象地解釋道。
展望未來,漆遠希望AI for Science可以造就出服務(wù)千行百業(yè)的產(chǎn)品,成為各領(lǐng)域人士觸手可及的賦能工具,也真正走進老百姓的生活。
來源 | 上??茖W智能研究院