編者按:啟明創(chuàng)投投資企業(yè)深勢(shì)科技近日取得多個(gè)進(jìn)展:在《麻省理工科技評(píng)論》中國(guó)·第二屆生命科學(xué)創(chuàng)業(yè)大賽總決賽中榮獲技術(shù)突破獎(jiǎng);深勢(shì)科技分別與晶泰科技、另一家啟明創(chuàng)投投資企業(yè)芯宿科技達(dá)成戰(zhàn)略合作,與前者的合作旨在共建藥物研發(fā)領(lǐng)域的開(kāi)放生態(tài),助力智能化、自動(dòng)化賦能臨床前藥物研發(fā)全流程,與芯宿科技的合作將聚焦源頭創(chuàng)新,通過(guò)深度合作為研發(fā)新型藥物和蛋白拓展新思路并提供全新的科研范式。由此看來(lái),通過(guò)基礎(chǔ)科學(xué)的不斷突破加速生命健康產(chǎn)業(yè)的科技成果轉(zhuǎn)化與商業(yè)化落地顯得尤為重要。
深勢(shì)科技創(chuàng)始人兼首席科學(xué)家張林峰在接受新華網(wǎng)專訪時(shí),指出基礎(chǔ)研究的重要性日漸提高,且從原始創(chuàng)新到產(chǎn)業(yè)落地的周期變短,他分享成立深勢(shì)科技是為了幫助科研人員加速基礎(chǔ)研究進(jìn)程,站在AI的肩膀上做科研創(chuàng)新。他進(jìn)一步分析了AI大模型的工業(yè)應(yīng)用前景,并強(qiáng)調(diào)通過(guò)生態(tài)協(xié)同建立全新的工業(yè)軟件平臺(tái)。啟明創(chuàng)投微信公眾號(hào)經(jīng)授權(quán)轉(zhuǎn)載。
深勢(shì)科技創(chuàng)始人兼首席科學(xué)家張林峰
以人工智能為代表的新一輪科技革命和產(chǎn)業(yè)變革方興未艾。這樣一個(gè)時(shí)代,呼喚勇立技術(shù)潮頭的搏擊者,也一定能造就這樣的搏擊者。
作為深勢(shì)科技首席科學(xué)家,張林峰是一個(gè)簡(jiǎn)單純粹的人,一直執(zhí)著攀登技術(shù)巔峰。作為深勢(shì)科技創(chuàng)始人,張林峰懷有技術(shù)人共有的一個(gè)夢(mèng)想,去追尋科技的星辰大海,做一家源自中國(guó)、面向未來(lái)、引領(lǐng)世界的公司。
AI for Science是公認(rèn)的發(fā)生在當(dāng)下的科學(xué)革命,張林峰帶領(lǐng)著團(tuán)隊(duì),成為這場(chǎng)科學(xué)研究范式的踐行者。近日,新華網(wǎng)專訪了張林峰。采訪中,他結(jié)合從事基礎(chǔ)研究的經(jīng)歷,分享了AI技術(shù)的最新趨勢(shì),以及AI對(duì)底層科研、對(duì)工業(yè)革新的推動(dòng)作用。
01/
AI加快基礎(chǔ)研究轉(zhuǎn)化效率
根基不牢,地動(dòng)山搖。國(guó)家將基礎(chǔ)研究作為科技自立自強(qiáng)的根基,足見(jiàn)其重要性。
無(wú)論是在北京大學(xué)讀本科,還是在普林斯頓大學(xué)留學(xué)深造,張林峰所學(xué)的一直都是基礎(chǔ)研究中的基礎(chǔ)學(xué)科。十多年深鉆細(xì)研,張林峰不僅坐住了“冷板凳”,更洞察到了其中的新變化。
基礎(chǔ)研究是科學(xué)體系的源頭,它能變不確定性為確定性,變未知為已知?!盎A(chǔ)研究是一個(gè)國(guó)家核心競(jìng)爭(zhēng)力所在。當(dāng)下,國(guó)家需要的發(fā)展動(dòng)力越來(lái)越指向基礎(chǔ)研究,指向原始創(chuàng)新?!睆埩址逭J(rèn)為,基礎(chǔ)研究的重要性毋庸置疑。
除了重要性,張林峰還發(fā)現(xiàn),從原始創(chuàng)新到產(chǎn)業(yè)落地的效率和速度大大加快。“以前,如果說(shuō)是30年的話,現(xiàn)在從原始創(chuàng)新到應(yīng)用落地的這樣一個(gè)鏈條,在我們看來(lái)只需要3到5年?!?/span>
從原始創(chuàng)新到技術(shù),再?gòu)漠a(chǎn)品到商業(yè)化,每個(gè)環(huán)節(jié)沒(méi)變,客觀規(guī)律也沒(méi)變,但時(shí)間為什么大大縮短?
“這是因?yàn)檎麄€(gè)轉(zhuǎn)化、流轉(zhuǎn)的效率變高了。在這個(gè)過(guò)程中,我們需要經(jīng)常改變我們的視角,去做一個(gè)更加全局的所謂技術(shù)上的‘診斷’。”張林峰說(shuō),當(dāng)技術(shù)的卡點(diǎn)存在于原始創(chuàng)新這一階段,一旦卡點(diǎn)被突破,下一個(gè)階段可能就直接進(jìn)入商業(yè)化,而不是產(chǎn)品這一環(huán)節(jié)。
一方面重要性提升,另一方面從開(kāi)始到落地的周期變短。在這樣一個(gè)大背景下,基礎(chǔ)研究其實(shí)已經(jīng)迎來(lái)極為重要的發(fā)展節(jié)點(diǎn)。
正因?yàn)檎麄€(gè)科研生態(tài)已經(jīng)變化,張林峰提出,“必須在全新的視角之下,去定義我們最該做的、屬于當(dāng)下的事情”。在他看來(lái),成立深勢(shì)科技,引領(lǐng)“AI for Science”發(fā)展,就是他和團(tuán)隊(duì)當(dāng)下最該做的事。
深勢(shì)科技自成立就致力于運(yùn)用AI和分子模擬算法,結(jié)合先進(jìn)的計(jì)算手段求解重要的科學(xué)問(wèn)題,為人類文明最基礎(chǔ)的生物醫(yī)藥、能源、材料和信息科學(xué)與工程研究打造新一代微尺度工業(yè)設(shè)計(jì)和仿真平臺(tái)。
對(duì)科研人員來(lái)說(shuō),時(shí)間比金錢更寶貴。深勢(shì)科技就像是催化劑,幫助科研人員加速基礎(chǔ)研究進(jìn)程。
“可能我們第一波造福的不是產(chǎn)業(yè)界的人,而是同樣面臨前沿發(fā)展驅(qū)動(dòng)的、一些更加追求創(chuàng)新研究的科學(xué)家、科研人?!?/strong>張林峰說(shuō),過(guò)去這些科研人員在給定的技術(shù)條件之下做實(shí)驗(yàn)、做理論模擬,但他們同樣也需要跟上時(shí)代革新的步伐,站在AI的肩膀上做科研創(chuàng)新。
02/
底層科技突破的重構(gòu)意義
2020年,張林峰的科研事業(yè)迎來(lái)高光時(shí)刻。
由他作為負(fù)責(zé)人帶領(lǐng)的團(tuán)隊(duì),憑借新一代分子模擬方法研究成果獲得當(dāng)年度具有“超算界諾貝爾獎(jiǎng)”之稱的戈登·貝爾獎(jiǎng)。該成果還與量子優(yōu)越性、人造太陽(yáng)等一起入選2020中國(guó)十大科技進(jìn)展。
一直以來(lái),人們都希望從第一性原理、從薛定諤方程這種最基本的規(guī)律出發(fā),求解材料、藥物、化工等普遍關(guān)心的微觀世界的秘密。但由于算法過(guò)于復(fù)雜,哪怕用超級(jí)計(jì)算機(jī),也只能算幾十個(gè)、幾百個(gè)原子規(guī)模的體系,但一個(gè)蛋白,加上周圍的環(huán)境,至少幾萬(wàn)、幾十萬(wàn)個(gè)分子。換句話說(shuō),即便人類熟知微觀世界的基本規(guī)律,但微觀世界的復(fù)雜現(xiàn)象依舊無(wú)法用計(jì)算機(jī)模擬。
如何決定一款藥物或者材料的性能,是一個(gè)原則上可算但實(shí)際上因復(fù)雜度太高做不了的事情。這個(gè)難點(diǎn),正是AI可以發(fā)揮作用的起點(diǎn)。
張林峰表示,微觀世界的數(shù)據(jù)通過(guò)AI學(xué)習(xí),能夠讓AI掌握相應(yīng)應(yīng)用方向的物理規(guī)律。同時(shí),AI也能做更大規(guī)模、更長(zhǎng)時(shí)間尺度的計(jì)算,然后在高性能計(jì)算的優(yōu)化下達(dá)到新的極致。
最終,項(xiàng)目團(tuán)隊(duì)通過(guò)機(jī)器學(xué)習(xí)將分子動(dòng)力學(xué)極限從基線提升到了1億原子的驚人數(shù)量,同時(shí)仍保證了從頭算的高精度,效率是之前人類基線水平的1000倍。這是第一次把AI和物理規(guī)律、物理方程以及高性能計(jì)算緊密結(jié)合。
回溯過(guò)往,戈登·貝爾獎(jiǎng)的評(píng)選一直鼓勵(lì)用最大規(guī)模的高性能算力去做最好的應(yīng)用。張林峰團(tuán)隊(duì)的項(xiàng)目之所以獲獎(jiǎng),其更大的意義就是能解決實(shí)際問(wèn)題,并把相關(guān)行業(yè)的人才聚合到一起。
張林峰用“重構(gòu)”這個(gè)關(guān)鍵詞定位這項(xiàng)獲獎(jiǎng)成果的核心意義?!八鼜V泛的影響在于學(xué)科的重構(gòu)。其實(shí)所有這些行業(yè)已經(jīng)因?yàn)锳I和計(jì)算能力的提升被重構(gòu)了。這樣的重構(gòu),也意味著人們的知識(shí)體系、協(xié)同模式以及復(fù)合學(xué)科的重組。”過(guò)去,數(shù)理化、計(jì)算機(jī)、生物醫(yī)藥和材料都是分散的學(xué)科,這些學(xué)科之下又分了很多類型,這些細(xì)分類型零散分布于這些學(xué)科下設(shè)的三級(jí)目錄中。而基于AI的分子動(dòng)力學(xué)模擬方法,將精確的物理建模帶入到更大尺度的材料模擬中,為打通力學(xué)、化學(xué)、材料、生物乃至工程學(xué)科,解決實(shí)際問(wèn)題發(fā)揮出積極作用。
正如張林峰所言,基礎(chǔ)研究到應(yīng)用落地的周期縮短,這與機(jī)器學(xué)習(xí)模擬上億原子這類重大科學(xué)突破密不可分。底層科技突破的意義,就在于可以催生出一系列新的創(chuàng)新。
比如,藥物研發(fā)難度大、投入高、風(fēng)險(xiǎn)大、周期長(zhǎng)。張林峰以藥物研發(fā)舉例說(shuō),要破解其中的核心瓶頸,就需要進(jìn)一步求解物理方程和分析大量數(shù)據(jù)的能力。受益于技術(shù)紅利,結(jié)合AI、物理模擬、仿真等一系列技術(shù),能夠讓藥物從立項(xiàng)到臨床前的整個(gè)研發(fā)流程大大縮短。
這項(xiàng)能力是AI的這一波進(jìn)展帶來(lái)的。在藥物、材料研發(fā)等更廣泛的領(lǐng)域,印證了張林峰談到的“從基礎(chǔ)研究到落地應(yīng)用只需三五年時(shí)間”。
03/
AI大模型的工業(yè)應(yīng)用前景
近期,火熱的ChatGPT引發(fā)業(yè)內(nèi)人士思考。事實(shí)上,超強(qiáng)算力、大模型技術(shù)并不新鮮,但能將這些技術(shù)發(fā)揮到極致,讓人覺(jué)得產(chǎn)品有用卻并不容易。
在張林峰看來(lái),ChatGPT的產(chǎn)品形式非常巧妙,它在開(kāi)發(fā)之初就在思考這種產(chǎn)品怎么才能被用起來(lái)、以怎樣的技術(shù)形式規(guī)?;涞??!皬脑紕?chuàng)新一直到產(chǎn)品,到大規(guī)模落地,這么大規(guī)模的一個(gè)原始技術(shù)突破的過(guò)程中,能夠做到這么高的效率,其實(shí)非常值得大家思考?!?/span>
預(yù)訓(xùn)練模型是推動(dòng)AI應(yīng)用的重要基礎(chǔ)設(shè)施,也是全球科技巨頭競(jìng)相角逐的焦點(diǎn)。
與ChatGPT專注自然語(yǔ)言處理不同,去年年底,深勢(shì)科技、北京科學(xué)智能研究院(AISI)以及項(xiàng)目合作者,聯(lián)合發(fā)布了首個(gè)覆蓋元素周期表近70種元素的深度勢(shì)能原子間勢(shì)函數(shù)預(yù)訓(xùn)練模型“DPA-1”。這一創(chuàng)新成果在模型覆蓋范圍、通用性、計(jì)算精度以及未來(lái)的AI生成等方面實(shí)現(xiàn)新突破,被視為AI for Science走向大規(guī)模應(yīng)用的重要里程碑。
用過(guò)“DPA-1”的開(kāi)發(fā)者們會(huì)發(fā)現(xiàn),它就像是自然科學(xué)領(lǐng)域的GPT。根據(jù)需求,“DPA-1”像萬(wàn)物之手一樣,能生成需要的物質(zhì)組分和結(jié)構(gòu)。它為什么能夠做到呢?
此前,曾獲戈登·貝爾獎(jiǎng)的創(chuàng)新解決方案,其實(shí)是基于量子力學(xué)生產(chǎn)數(shù)據(jù),AI學(xué)習(xí)這些數(shù)據(jù),學(xué)完后大規(guī)模模擬。如今,這個(gè)范式已經(jīng)普及,量子力學(xué)生產(chǎn)的數(shù)據(jù)越來(lái)越多,多到已經(jīng)幾乎要覆蓋整個(gè)元素周期表。這使得這樣一個(gè)領(lǐng)域也具備了走向預(yù)訓(xùn)練模型的數(shù)據(jù)基礎(chǔ)。
“3年前,我們就想做這件事情,但是時(shí)機(jī)不成熟,原因是數(shù)據(jù)基礎(chǔ)不到位,現(xiàn)在做其實(shí)是最合適的。從社區(qū)生態(tài)上,從模型和數(shù)據(jù)的發(fā)展上,乃至從整個(gè)技術(shù)趨勢(shì)上來(lái)看,這樣的一個(gè)預(yù)訓(xùn)練模型也是呼之欲出的。”張林峰曾說(shuō),“應(yīng)該用全新視角定義當(dāng)下該做的事情”,在他看來(lái),這件事很顯然也屬于當(dāng)下該做的事情。
在其他領(lǐng)域,GPT的迭代周期都比較長(zhǎng),但張林峰認(rèn)為在分子模擬這個(gè)領(lǐng)域也許走得會(huì)更快,應(yīng)用落地的深度也更深,這是他和團(tuán)隊(duì)今年格外要解決的重點(diǎn)問(wèn)題。
目前,科學(xué)計(jì)算的瓶頸在于算法面臨“維度災(zāi)難”的問(wèn)題,即難以表示和難以有效地處理高位復(fù)雜的函數(shù)和大規(guī)模的復(fù)雜數(shù)據(jù)。幸運(yùn)的是,AI有望助力解決科學(xué)計(jì)算中的“維度災(zāi)難”,將不同尺度的物理模型有效連接起來(lái)。
AI向前發(fā)展有其自身規(guī)律。張林峰說(shuō),我們要做的就是借鑒AI的客觀發(fā)展規(guī)律,無(wú)論是技術(shù)側(cè)還是產(chǎn)業(yè)側(cè)的一系列發(fā)展特點(diǎn),去反思我們的技術(shù)體系。
他舉例說(shuō),過(guò)去人們?cè)|(zhì)疑AI落地的效果,其實(shí)把前人在不同應(yīng)用場(chǎng)景的經(jīng)驗(yàn)整合起來(lái),去“翻譯”好我們的場(chǎng)景,比如工業(yè)軟件這樣的場(chǎng)景,需要啟蒙。深勢(shì)科技兼具了翻譯者、啟蒙者以及最后從頂層創(chuàng)新到落地的角色。
04/
生態(tài)協(xié)同打造工業(yè)軟件平臺(tái)
AI給基礎(chǔ)科研帶來(lái)機(jī)遇,除了凸顯基礎(chǔ)研究的重要性,也在改變從創(chuàng)新到落地的整個(gè)生態(tài)。
工業(yè)軟件被譽(yù)為“工業(yè)皇冠上的明珠”,過(guò)去一直是海外廠商占據(jù)的領(lǐng)域。隨著AI時(shí)代的來(lái)臨,中國(guó)在AI領(lǐng)域也具有顯著的人才、數(shù)據(jù)、市場(chǎng)、應(yīng)用等優(yōu)勢(shì)。在AI時(shí)代,工業(yè)軟件也迎來(lái)新的開(kāi)始。
張林峰認(rèn)為,工業(yè)軟件的生態(tài)十分重要。它的背后需要底層算法,規(guī)模化的軟件協(xié)同,以及軟件開(kāi)發(fā)完之后,作為一個(gè)解決方案跟場(chǎng)景的落地迭代,以及反過(guò)來(lái)反哺創(chuàng)新。基于這樣的一個(gè)生態(tài),持續(xù)迭代后,它才會(huì)越來(lái)越穩(wěn)健。同時(shí),工業(yè)軟件是工業(yè)智慧的結(jié)晶,必須要以工匠精神往深做。
對(duì)工業(yè)軟件平臺(tái)的創(chuàng)新,張林峰提示,要告別過(guò)去,用嶄新的思維去做。他說(shuō),單純算法的突破、底層硬件的突破,往往會(huì)沉淀成過(guò)去的慣性,變成一種創(chuàng)新的歷史包袱,反倒難以升級(jí)。他以深勢(shì)科技開(kāi)發(fā)的藥物設(shè)計(jì)軟件平臺(tái)為例,認(rèn)為該平臺(tái)可能比已經(jīng)成長(zhǎng)了20多年的國(guó)外平臺(tái)更輕便,是因?yàn)樯顒?shì)科技要做的不光是一種產(chǎn)品形態(tài)和技術(shù)形態(tài)的革新,而是依靠整個(gè)公司迭代的體系和不同研發(fā)人的角色配合,才能推動(dòng)這種全新的工業(yè)軟件平臺(tái)的誕生。
深勢(shì)科技提出,專注于打造微觀尺度科學(xué)研究和工業(yè)研發(fā)的基礎(chǔ)設(shè)施。張林峰一直向研發(fā)人員強(qiáng)調(diào),“軟件不是開(kāi)發(fā)出來(lái)的,而是被用出來(lái)的,以需求和反饋為導(dǎo)向,持續(xù)優(yōu)化才是工業(yè)軟件的真正壁壘。”
“沒(méi)摸過(guò)的東西,去想象我覺(jué)得不是很好?!睆埩址逭f(shuō),為了發(fā)論文而發(fā)論文不是我們鼓勵(lì)的,基于對(duì)問(wèn)題更好的定義來(lái)發(fā)論文是非常好的。
張林峰鼓勵(lì)公司研發(fā)人員自由探索,認(rèn)為營(yíng)造這種寬松的科研氛圍才能培育創(chuàng)新的土壤。其次,注重從定義問(wèn)題到實(shí)現(xiàn)目標(biāo)過(guò)程中的協(xié)同機(jī)制,要求大家既要自我驅(qū)動(dòng),也要觀點(diǎn)碰撞,然后再建立分工,營(yíng)造一個(gè)共同贏球的團(tuán)隊(duì)文化。同為科學(xué)家,他本人也一直跑在第一線,與做合金、做電池、做藥物研發(fā)的一線企業(yè)面對(duì)面交流,傾聽(tīng)客戶的反饋。
從優(yōu)秀變得卓越,意味著要樹立更長(zhǎng)期、更樸實(shí)的價(jià)值追求?!拔覀儚目茖W(xué)發(fā)展規(guī)律、從方方面面的認(rèn)知,去定義未來(lái)長(zhǎng)久的目標(biāo),然后在這個(gè)目標(biāo)下,去倒推哪些是屬于公司當(dāng)下該做的事情,然后持續(xù)演進(jìn)?!睆埩址逭f(shuō)。
創(chuàng)新既是決定未來(lái)的關(guān)鍵變量所在,又是推動(dòng)人類社會(huì)進(jìn)步的核心動(dòng)力。
深勢(shì)科技成立的初衷就是希望成為一家源自中國(guó)、面向未來(lái)、引領(lǐng)世界的公司?!拔磥?lái)幾年,可能是一個(gè)重構(gòu)的周期,我們希望經(jīng)歷這樣一個(gè)重構(gòu),在最后回頭來(lái)看時(shí),我們是成功的。”張林峰也深信,如果公司能夠推動(dòng)國(guó)內(nèi)形成一個(gè)真正原始創(chuàng)新到落地應(yīng)用的良好生態(tài),能夠成就所有合作伙伴,那公司必然就是成功的。
展望未來(lái),張林峰希望通過(guò)不斷商業(yè)化倒逼公司形成新的技術(shù)體系。他堅(jiān)信,AI的能力還需要進(jìn)一步喚醒,AI的應(yīng)用也要深入到科學(xué)研究的更深處,能夠服務(wù)于能源、原材料等國(guó)家重大戰(zhàn)略需求,這是公司也是整個(gè)生態(tài)未來(lái)努力的方向指引。
來(lái)源 | 新華網(wǎng)
作者 | 凌紀(jì)偉