編者按:日前,復(fù)旦大學(xué)特聘教授、上??茖W(xué)智能研究院(下稱“上智院”)院長(zhǎng)、啟明創(chuàng)投投資企業(yè)無(wú)限光年創(chuàng)始人漆遠(yuǎn)與中國(guó)科學(xué)技術(shù)大學(xué)科技傳播系副主任袁嵐峰進(jìn)行對(duì)話。漆遠(yuǎn)表示,要把真實(shí)的問(wèn)題和底層的技術(shù)創(chuàng)新結(jié)合在一起,他以伏羲氣象大模型、女?huà)z生命大模型、燧人物質(zhì)大模型為例,分享了用人工智能破解高價(jià)值產(chǎn)業(yè)場(chǎng)景中關(guān)鍵科學(xué)問(wèn)題的實(shí)踐。圍繞如何讓更多人及行業(yè)都受益于AI技術(shù),他指出,工程優(yōu)化和開(kāi)源生態(tài)才能系統(tǒng)化實(shí)現(xiàn)普惠智能,并介紹了基于這一思維打造的科學(xué)智能的生態(tài)基座。漆遠(yuǎn)也分享了他對(duì)AI for Science的終極目標(biāo)及現(xiàn)實(shí)目標(biāo)的思考。
啟明創(chuàng)投微信公眾號(hào)經(jīng)授權(quán)轉(zhuǎn)載。
復(fù)旦大學(xué)特聘教授、上海科學(xué)智能研究院院長(zhǎng)、無(wú)限光年創(chuàng)始人漆遠(yuǎn)
隨著人工智能技術(shù)以前所未有的速度滲透到各個(gè)領(lǐng)域,科學(xué)研究也迎來(lái)了顛覆性的變革。傳統(tǒng)的科研范式正在被AI所重塑,AI for Science(人工智能驅(qū)動(dòng)科學(xué)研究)應(yīng)運(yùn)而生,成為科學(xué)界最受矚目的焦點(diǎn)。那么,AI for Science何時(shí)才能迎來(lái)如同DeepSeek般的爆發(fā)式增長(zhǎng),真正實(shí)現(xiàn)技術(shù)普惠,改變?nèi)藗兊纳睿?/span>
在東方衛(wèi)視的全新科技觀察節(jié)目《錨點(diǎn)》中,復(fù)旦大學(xué)特聘教授、上??茖W(xué)智能研究院院長(zhǎng)、無(wú)限光年創(chuàng)始人漆遠(yuǎn)與中國(guó)科學(xué)技術(shù)大學(xué)科技傳播系副主任袁嵐峰展開(kāi)了一場(chǎng)深入對(duì)話,并給出了他的答案:AI for Science的“DeepSeek時(shí)刻”就是實(shí)現(xiàn)“AI機(jī)器貓”——他希望AI for Science可以造就出服務(wù)千行百業(yè)的產(chǎn)品,成為各領(lǐng)域人士觸手可及的賦能工具,也真正走進(jìn)老百姓的生活。
01/
AI是科研的新范式
也是公司的新范式
節(jié)目伊始,袁嵐峰就拋出了核心問(wèn)題:AI for Science何時(shí)才能迎來(lái)自己的DeepSeek時(shí)刻?漆遠(yuǎn)認(rèn)為,這個(gè)時(shí)刻正在加速接近,正處于爆發(fā)前夜。他所領(lǐng)導(dǎo)的上智院,正是這樣一個(gè)聚焦AI for Science的戰(zhàn)略性新型研發(fā)機(jī)構(gòu),人工智能專家、領(lǐng)域科學(xué)家和工程師在這里緊密協(xié)作,共同探索AI在科學(xué)領(lǐng)域的無(wú)限可能。
在上智院,以伏羲氣象大模型、女?huà)z生命大模型、燧人物質(zhì)大模型為代表的垂直領(lǐng)域科學(xué)大模型正將AI的觸角伸向科研最前沿。這些以華夏文明始祖命名的系統(tǒng),承載著用人工智能破解高價(jià)值產(chǎn)業(yè)場(chǎng)景中的關(guān)鍵科學(xué)問(wèn)題的使命。
伏羲氣象大模型的實(shí)戰(zhàn)價(jià)值在2024年超強(qiáng)臺(tái)風(fēng)“貝碧嘉”的預(yù)測(cè)中得到驗(yàn)證。當(dāng)多數(shù)機(jī)構(gòu)預(yù)測(cè)臺(tái)風(fēng)將在浙江臺(tái)州到江蘇啟東一帶沿海登陸時(shí),“伏羲”提前5天鎖定上海浦東為最可能登陸點(diǎn),并通過(guò)每6小時(shí)更新的動(dòng)態(tài)預(yù)報(bào)持續(xù)修正軌跡。該系統(tǒng)目前已與中國(guó)太平洋財(cái)產(chǎn)保險(xiǎn)股份有限公司、中國(guó)遠(yuǎn)洋海運(yùn)集團(tuán)有限公司等企業(yè)合作,為遠(yuǎn)洋航線規(guī)劃提供氣象支持,同時(shí)應(yīng)用于新能源領(lǐng)域的光伏、風(fēng)電效率優(yōu)化。
以生命科學(xué)的微觀基因、宏觀表型兩大基礎(chǔ)場(chǎng)景為抓手,女?huà)z生命大模型致力于為基因創(chuàng)新藥研發(fā)、數(shù)字孿生診療等產(chǎn)品平臺(tái)提供基礎(chǔ)模型能力,打破傳統(tǒng)遺傳調(diào)控、生物力學(xué)計(jì)算模式,實(shí)現(xiàn)跨越式的生命狀態(tài)預(yù)測(cè)。面向可有效干預(yù)致病基因、比傳統(tǒng)藥物更能精確針對(duì)病因的siRNA,團(tuán)隊(duì)使用多模態(tài)基礎(chǔ)模型合法解析專利后生成siRNA數(shù)據(jù)庫(kù),并基于數(shù)據(jù)庫(kù)構(gòu)建了一個(gè)AI基礎(chǔ)模型,用于對(duì)siRNA藥物進(jìn)行虛擬篩選,在實(shí)驗(yàn)驗(yàn)證階段將多靶點(diǎn)藥物的療效預(yù)測(cè)誤差從40%降低到了8%。
燧人分子基礎(chǔ)大模型聚焦物質(zhì)科學(xué)的核心挑戰(zhàn),致力于構(gòu)建理解分子世界的通用工具。在電池研發(fā)領(lǐng)域,模型構(gòu)建了929個(gè)分子的潛在篩選庫(kù)以訓(xùn)練生成模型,加速鋰電池電解液新型配方的探索;在環(huán)保材料方向,其從700多萬(wàn)種虛擬分子中篩選出滿足各項(xiàng)性能要求的可持續(xù)高分子材料單體,助力提升一些常見(jiàn)材料的降解性能,降低環(huán)境污染;藥物研發(fā)則是另一重要應(yīng)用場(chǎng)景,通過(guò)AI與計(jì)算方法的結(jié)合,團(tuán)隊(duì)一個(gè)月內(nèi)發(fā)現(xiàn)某難成藥靶點(diǎn)的動(dòng)態(tài)結(jié)合口袋(傳統(tǒng)實(shí)驗(yàn)室或Alpha Fold 3難以捕捉),并篩選出實(shí)驗(yàn)驗(yàn)證的活性分子。
“AI是新的范式,是科研的范式,也是公司的范式,”漆遠(yuǎn)說(shuō):“把自己的身體浸入水中,你才能夠真正地探索,找到鎖定的錨點(diǎn),才能夠把真實(shí)的問(wèn)題和底層的技術(shù)創(chuàng)新結(jié)合在一起。這是為什么我做科研又創(chuàng)業(yè)的一個(gè)重要原因?!?/span>
這種實(shí)踐哲學(xué)在DeepMind與Isomorphic Labs的合作模式中得到印證:盡管DeepMind作為谷歌旗下研究院專注基礎(chǔ)研究,但其與Isomorphic Labs構(gòu)建的“研究-應(yīng)用”雙輪架構(gòu),通過(guò)向藥企提供AI藥物研發(fā)服務(wù)已創(chuàng)造超30億美元商業(yè)價(jià)值。這種跨界協(xié)同機(jī)制揭示了AI范式的雙重屬性——既是突破性的科研方法論,也是可持續(xù)的商業(yè)模式創(chuàng)新,為破解AI for Science“如何從實(shí)驗(yàn)室走向產(chǎn)業(yè)”的命題提供了關(guān)鍵啟示。
02/
工程優(yōu)化和開(kāi)源開(kāi)放才能
系統(tǒng)化實(shí)現(xiàn)普惠智能
DeepSeek的出現(xiàn)之所以備受關(guān)注,不僅在于技術(shù)突破,更在于工程優(yōu)化和開(kāi)源生態(tài)帶來(lái)的普惠智能,讓更多人和行業(yè)能夠使用AI技術(shù)。
當(dāng)DeepSeek大模型將訓(xùn)練成本壓縮至傳統(tǒng)方法的1/10、推理成本降至每百萬(wàn)token一元時(shí),背后是低秩分解技術(shù)削減參數(shù)冗余、通信計(jì)算并行化提升資源利用、GPU/CPU異構(gòu)調(diào)度打破工具枷鎖的工程突破。燧人分子基礎(chǔ)大模型研發(fā)中,上智院團(tuán)隊(duì)重構(gòu)基于Fortran語(yǔ)言的工具包以及GPU通信架構(gòu),使分子動(dòng)力學(xué)模擬效率提升10倍,直接節(jié)省90%計(jì)算成本?!八惴ㄏ袼枷?,而沒(méi)有工程就沒(méi)有‘肉身’”,漆遠(yuǎn)如是說(shuō)。
關(guān)于AI for Science的開(kāi)源開(kāi)放,漆遠(yuǎn)以AlphaFold為例指出:該模型在開(kāi)發(fā)階段依托開(kāi)源基因組數(shù)據(jù)和底層分析工具實(shí)現(xiàn)突破,成功后又將預(yù)測(cè)的蛋白質(zhì)結(jié)構(gòu)開(kāi)源共享。全球19個(gè)國(guó)家、200萬(wàn)研究者基于其開(kāi)源成果,推動(dòng)了藥物研發(fā)、疾病機(jī)制分析等領(lǐng)域的應(yīng)用創(chuàng)新。這驗(yàn)證了“使用開(kāi)源-貢獻(xiàn)開(kāi)源”的良性循環(huán)對(duì)科學(xué)智能發(fā)展的關(guān)鍵作用。
這種突出工程和開(kāi)放的系統(tǒng)化思維正驅(qū)動(dòng)上智院構(gòu)建科學(xué)智能的生態(tài)基座。相對(duì)于DeepSeek這樣的大語(yǔ)言模型,垂直領(lǐng)域科學(xué)大模型更多樣化,尤其需要工具鏈和數(shù)據(jù)平臺(tái)的支持。
一站式AI4S特色智算軟件平臺(tái)由上智院-無(wú)限光年聯(lián)合實(shí)驗(yàn)室攜手復(fù)旦大學(xué)各院系打造,如同科研版的Cohere,集平臺(tái)、模型和應(yīng)用工具于一體,可服務(wù)多家高校與科研機(jī)構(gòu)。目前平臺(tái)已集成DeepSeek、AlphaFold 3等前沿模型,并完成6家國(guó)產(chǎn)GPU與10個(gè)領(lǐng)域模型的深度適配。
科學(xué)語(yǔ)料平臺(tái)由上智院牽頭、多方聯(lián)合共建,于2024世界人工智能大會(huì)首度公開(kāi)亮相,具備從數(shù)據(jù)采集、加工到管理和建模的全鏈路能力,保證數(shù)據(jù)的高效加工、可信和安全互通。目前平臺(tái)已開(kāi)源siRNA藥物研發(fā)數(shù)據(jù)集、有機(jī)分子QM計(jì)算數(shù)據(jù)集、伏羲中期天氣預(yù)報(bào)大模型數(shù)據(jù)集等一系列高質(zhì)量科學(xué)語(yǔ)料。
此外,上智院和復(fù)旦大學(xué)連續(xù)三年通過(guò)舉辦世界科學(xué)智能大賽開(kāi)放科學(xué)問(wèn)題,吸引年輕人和企業(yè)參與,共同推進(jìn)科學(xué)智能的創(chuàng)新和應(yīng)用。
03/
AI for Science的下一個(gè)“錨點(diǎn)”
是“AI機(jī)器貓”
“科學(xué)智能要問(wèn):一個(gè)真正的產(chǎn)品是什么,如何解決社會(huì)需求?”漆遠(yuǎn)表示DeepSeek一個(gè)月內(nèi)用戶破億,核心之一在于有產(chǎn)品化的思路,即追求可用、成本要低,AlphaFold 2和AlphaFold 3是非常好的科技突破,卻未必能被稱之為產(chǎn)品。
在他看來(lái),AI for Science的終極目標(biāo)是實(shí)現(xiàn)“AI愛(ài)因斯坦”,即能夠發(fā)現(xiàn)新的、未知的科學(xué)規(guī)律。但在實(shí)現(xiàn)這個(gè)宏偉目標(biāo)之前,更現(xiàn)實(shí)的目標(biāo)是打造“AI機(jī)器貓”——一種能夠賦能千行百業(yè)的普惠智能。他以伏羲氣象大模型在臺(tái)風(fēng)預(yù)測(cè)中的成功應(yīng)用、女?huà)z生命大模型在siRNA藥物設(shè)計(jì)中的突破為例,強(qiáng)調(diào)了AI for Science在解決真實(shí)問(wèn)題方面的價(jià)值。
“‘AI愛(ài)因斯坦’是一個(gè)比喻,是指能夠做科學(xué)的發(fā)現(xiàn),但它不是一個(gè)人的發(fā)現(xiàn),其實(shí)是大家在群策群力解決一個(gè)非常有挑戰(zhàn)的科學(xué)問(wèn)題。而DeepSeek更像一個(gè)機(jī)器貓,能夠賦能很多人、很多行業(yè),在你需要的時(shí)候變出一個(gè)工具幫你解決問(wèn)題?!逼徇h(yuǎn)形象地解釋道。
展望未來(lái),漆遠(yuǎn)希望AI for Science可以造就出服務(wù)千行百業(yè)的產(chǎn)品,成為各領(lǐng)域人士觸手可及的賦能工具,也真正走進(jìn)老百姓的生活。
來(lái)源 | 上??茖W(xué)智能研究院