編者按:在由啟明創(chuàng)投主辦的2023世界人工智能大會“生成式AI與大模型:變革與創(chuàng)新”論壇上,人工智能等技術(shù)前沿領(lǐng)域的著名專家與學(xué)者,頂級投資人和領(lǐng)軍創(chuàng)業(yè)者匯聚一堂,共同探索中國科技創(chuàng)新的驅(qū)動力量。
本次論壇是大會唯一一場由創(chuàng)投機(jī)構(gòu)主辦的相關(guān)論壇,立足創(chuàng)業(yè)與投資視角,分享了最新生成式AI前沿信息和實(shí)踐探索,并發(fā)布了行業(yè)首份基于對海內(nèi)外逾百家企業(yè)深入調(diào)研撰寫的生成式AI洞察報(bào)告,全方位解讀了生成式AI的產(chǎn)業(yè)變革和未來十大展望。
啟明創(chuàng)投投資企業(yè)云知聲董事長兼CTO梁家恩在演講中分享了生成式AI賦能未來的力量。梁家恩指出大模型帶來了AI的新時代,開啟了“數(shù)據(jù)動力學(xué)”新范式:預(yù)訓(xùn)練、指令微調(diào)和反饋強(qiáng)化。大模型整合大數(shù)據(jù),將成為AI 2.0時代的“發(fā)電廠”,并將會驅(qū)動人才、技術(shù)、市場等產(chǎn)業(yè)核心要素的升級。云知聲自研的山海大模型有強(qiáng)大的通用能力,并聚焦于插件擴(kuò)展和領(lǐng)域增強(qiáng)等相關(guān)能力構(gòu)建,圍繞智慧物聯(lián)和智慧醫(yī)療等行業(yè)賦能客戶。未來云知聲將繼續(xù)探索智能極限、引領(lǐng)產(chǎn)業(yè)升級。
以下為精編整理的演講實(shí)錄。
今天非常高興在這個論壇上和大家分享、交流。啟明創(chuàng)投一直支持我們的發(fā)展,至今已有十年的時間了,我們走過了AI 1.0時代,現(xiàn)在我們發(fā)布了大模型,AI 2.0時代已經(jīng)開啟,我們希望圍繞這一話題和大家進(jìn)行分享。
云知聲董事長兼CTO梁家恩
這次的分享分成兩部分:一個是宏觀的部分,從十年的產(chǎn)業(yè)實(shí)踐出發(fā),我們是怎么看待這一次的大機(jī)會;第二是微觀的部分,云知聲在這些年發(fā)展的實(shí)踐路徑以及大模型給我們帶來的機(jī)會。
01/
大模型整合大數(shù)據(jù)
將成為AI 2.0時代的“發(fā)電廠”
人工智能確實(shí)是很多代人的夢想,從1956年開始提出這個概念,一直到今天,已經(jīng)60多年過去了,如果算上圖靈時代,已經(jīng)有80多年了。
這個時代經(jīng)歷了三個階段。最早我們希望機(jī)器能夠像人一樣做事。第二階段是希望機(jī)器像人類的專家一樣分析問題和解決問題。第三個階段是完全從神經(jīng)網(wǎng)絡(luò)的角度出發(fā),我們能不能訓(xùn)練出好的會學(xué)習(xí)的機(jī)器,完全從錯誤當(dāng)中學(xué)習(xí)知識,就像曾子所說的“吾日三省吾身”,這種情況下我們能把模型訓(xùn)練到最大。大模型我們可以歸納為老子在《道德經(jīng)》里所說的“為學(xué)日益,為道日損”。
“為學(xué)日益”使得數(shù)據(jù)的規(guī)模和計(jì)算的尺度比以前大得多,方法上反而比以前看起來要簡潔得多,特別是Transformer模型出來之后,是非常緊湊的學(xué)習(xí)框架,它的威力非常大。
大模型推出之后我們認(rèn)為它已經(jīng)開啟了數(shù)據(jù)動力學(xué)的時代。像人類想飛到天上是空氣動力學(xué)的問題。到今天為止我們認(rèn)為人工智能最重要的是能不能用機(jī)器把數(shù)據(jù)學(xué)好。
這分為三個階段:在無監(jiān)督學(xué)習(xí)階段,因?yàn)閾碛?750億參數(shù),GPT基本實(shí)現(xiàn)了博覽全書;我們會發(fā)現(xiàn)它有很強(qiáng)的語義抽象能力,這時可以通過指令的微調(diào),讓它學(xué)到知識,并真正解決問題;ChatGPT加上人工反饋的機(jī)制,能實(shí)現(xiàn)德才兼?zhèn)洹?/strong>我們認(rèn)為大模型的起點(diǎn)從2018年預(yù)訓(xùn)練大模型開始,后面GPT在規(guī)模上提升起來,到ChatGPT已經(jīng)呈現(xiàn)出非常強(qiáng)大的通用釋放能力,這是圍繞我們的語言展開的,是一種新的范式。
我們認(rèn)為大模型能更好地整合大數(shù)據(jù)。在互聯(lián)網(wǎng)時期,它已經(jīng)開始產(chǎn)生紅利了,我們通過數(shù)據(jù)等傳統(tǒng)的方法分析學(xué)到的知識。我們過去使用煤、石油,有了好的發(fā)電廠、煉油廠之后,才發(fā)現(xiàn)能源可以賦能所有的行業(yè)。大模型建立了非常好的數(shù)據(jù)整合的框架,為AI 2.0時代構(gòu)建了很好的“發(fā)電廠”,智能數(shù)據(jù)成為了生產(chǎn)力要素。以前我們說這個要素是存在的,但是如果沒有好的裝置把它對外智能且有效地輸出,就很難實(shí)現(xiàn)價(jià)值。我們認(rèn)為現(xiàn)在它開啟了一個像MaaS服務(wù)的模式,未來會成為各個行業(yè)里創(chuàng)新的重要機(jī)制。
為什么我們認(rèn)為大模型已經(jīng)到了AI 2.0時代?它會對產(chǎn)業(yè)的核心要素的升級起到關(guān)鍵作用。
由于人才、技術(shù)和市場的共同作用才能形成一個大的產(chǎn)業(yè)。過去我們在AI 1.0的時代也做了這個工作,但是只能解決系統(tǒng)里的一些零部件,由智能功能完成某一些環(huán)節(jié)。現(xiàn)在有了大模型之后,我們發(fā)現(xiàn)不論在人才端、市場端,還是核心技術(shù)和驅(qū)動產(chǎn)品創(chuàng)新端里都有很大的突破。對外來說,未來大家可以看到越來越多的虛擬人的形象出現(xiàn),也會通過分析營銷數(shù)據(jù)更真實(shí)地理解市場的動態(tài)。對內(nèi)來說,對我們的生產(chǎn)效率、生產(chǎn)質(zhì)量的提升,包括組織效率的提升都會有實(shí)質(zhì)性的變革。
02/
未來要務(wù)實(shí)地解決實(shí)際場景中的問題
讓大模型真正產(chǎn)生商業(yè)價(jià)值
新的商業(yè)模式分為兩個方面。在通用平臺方面,過去在互聯(lián)網(wǎng)時代誕生的像BAT這些巨頭,以及移動互聯(lián)網(wǎng)里一些視頻巨頭,其實(shí)都是由這種平臺型公司構(gòu)建的。大模型出現(xiàn)后,這些平臺仍然會有新的模式,這些模式并不是說把里面的部件直接變成大模型的部件,邏輯與今天的商業(yè)邏輯相比沒有什么大的變化,而是通過大模型制造規(guī)模效應(yīng)和邊際成本的降低,形成飛輪效應(yīng),可以帶來新的顛覆和創(chuàng)新。如果應(yīng)用形態(tài)并沒有發(fā)生變化,只是希望改變巨頭業(yè)務(wù)中的內(nèi)核,單純靠這個技術(shù)來推動的機(jī)會并不大。我們借助新的多模態(tài)的交互和行業(yè)多模態(tài)的應(yīng)用,把這個平臺構(gòu)建起來就會有新的機(jī)會。
另外就是在行業(yè)大模型層面,大家看到像AI 2.0時代,很多2B的新興業(yè)務(wù)開始出現(xiàn)。通用大模型像一個完整的“六邊形戰(zhàn)士”,在各個方面都不錯。最重要的是我們能不能在一個行業(yè)里面真正可靠地解決問題。以最先進(jìn)的GPT-4的模型來說,它的可靠性、可控性都存在很大的風(fēng)險(xiǎn),這些問題如果不能得到有效解決的話,作為商業(yè)系統(tǒng)來說,在行業(yè)里面解決一些嚴(yán)肅場景的應(yīng)用問題,就會有比較大的挑戰(zhàn)。我們認(rèn)為整個行業(yè)的大模型生態(tài),應(yīng)該要務(wù)實(shí)解決這方面的問題。另一方面要把成本降到足夠低,對于企業(yè)應(yīng)用而言,成本是很大的負(fù)擔(dān),對于其規(guī)?;瘯砗艽蟮挠绊憽?/strong>
大模型帶來了很多優(yōu)勢,也有很多挑戰(zhàn)。大家比較直觀地感覺到它的認(rèn)知能力有了很大的提升。在AI 1.0的時代,不管誰做的聊天機(jī)器人,聊不到十輪已經(jīng)暴露其智商與人類有顯著的差距,但是ChatGPT推出之后,全球上億用戶和它對話了大半年,感覺聊天可以一直進(jìn)行下去。可以說它的認(rèn)知能力有顯著提升,交互的體驗(yàn)感也有明顯的提升。
另外就是生成式的能力,人與機(jī)器協(xié)同,創(chuàng)造能力也得到了比較大的提高。過去AI 1.0時代是鑒別式人工智能,幫我們實(shí)現(xiàn)一個確定性的目標(biāo)。譬如把聲音轉(zhuǎn)成文字,這是確定性的任務(wù)。人類需要機(jī)器輔助做各種創(chuàng)作。雖然GPT會出現(xiàn)事實(shí)性問題,但如果將其轉(zhuǎn)變成可控的能力,可以為我們打開很好的局面。同時它也顯著地提升了我們的知識和信息的整合能力。當(dāng)然也有負(fù)面的因素,雖然現(xiàn)在的大模型并不具備人類的意識能力,但我們怎么調(diào)校它才能將其變?yōu)榭煽氐南到y(tǒng)?這是我們需要解決的問題。
未來應(yīng)該要務(wù)實(shí)地解決實(shí)際場景中的問題,讓大模型真正產(chǎn)生商業(yè)價(jià)值。另外它的可靠性、可控性和合規(guī)性都要得到有效的控制,才可能達(dá)到好的商業(yè)化。
03/
通過人工智能的手段
創(chuàng)造一個互聯(lián)直覺的世界
在過去十年中,云知聲希望能夠通過人工智能的手段,創(chuàng)造一個互聯(lián)直覺的世界。2012年,剛好趕上深度學(xué)習(xí)在ImageNet刷榜,這是行業(yè)內(nèi)非常有標(biāo)志性的事件。這個團(tuán)隊(duì)當(dāng)時是在卷積網(wǎng)絡(luò)實(shí)現(xiàn)了突破,那一年剛好是云知聲創(chuàng)立的第一年。
2016年,AlphaGo作為人工智能的浪潮席卷行業(yè),今天的大模型代表第三波浪潮。在此期間,我們主要構(gòu)建了底層非常強(qiáng)大的超算平臺,這個超算平臺的構(gòu)建是我們做這個大模型的基礎(chǔ)。當(dāng)時的大模型是在2018年做出來之后,開始通過預(yù)訓(xùn)練的方式和底層調(diào)優(yōu)的方式,解決語義理解的問題。人工智能皇冠上的明珠就是理解能力是否足夠強(qiáng)大。語言不僅是交流的工具,更多是解決認(rèn)知問題的關(guān)鍵部件。
2018年,人工智能行業(yè)已經(jīng)具備強(qiáng)大的通用語言理解能力了。GPT之后通用的能力可以得到更大的釋放。我們認(rèn)為AGI時代由ChatGPT展開了。過去,我們很難設(shè)計(jì)一個系統(tǒng)應(yīng)對這么多的復(fù)雜任務(wù),OpenAI在ChatGPT推出之后已經(jīng)打開了新的局面,但它只是我們的起點(diǎn),并不是我們的終點(diǎn)。
我們的技術(shù)體系覆蓋底層的超算平臺至上層的智能組件和大模型。云知聲在今年上半年5月24日開發(fā)了山海大模型,除了底層的通用能力,我們聚焦構(gòu)建插件能力、領(lǐng)域增強(qiáng)和客戶定制的能力,這是圍繞行業(yè)應(yīng)用展開的。我們過去積累的是智慧物聯(lián)、智慧醫(yī)療方面的應(yīng)用。有應(yīng)用的驅(qū)動才能讓我們的模型變得越來越強(qiáng)大。
通用的基礎(chǔ)上我們構(gòu)建的是插件的擴(kuò)展。大模型最大的問題之一是信息的時效性非常有限,另外它能不能有效地控制、使用工具,這也是一個很大的問題。此外,還需要通過行業(yè)知識提高它的專業(yè)性和可靠性。
在領(lǐng)域增強(qiáng)維度,我們重點(diǎn)強(qiáng)調(diào)的是在醫(yī)療行業(yè)的應(yīng)用。目前我們已經(jīng)有幾百家醫(yī)院在商業(yè)應(yīng)用了。這輪應(yīng)用通過預(yù)訓(xùn)練,包括指令微調(diào)和插件的增量,擴(kuò)展我們在行業(yè)里面的應(yīng)用。通過醫(yī)療行業(yè)的應(yīng)用,我們已經(jīng)在MedQA評測中超越了GPT-4的水平,6月底從81分提高到了87分。山海大模型在滿分為600分的模擬國內(nèi)臨床執(zhí)業(yè)醫(yī)師資格考試中,目前為止已經(jīng)突破500分,360分就可以拿到資格證了。
除此之外,我們還提供了約7個應(yīng)用場景,主要是在醫(yī)院里面展開。醫(yī)院中有很多定制工作,因?yàn)橐粋€通用模型并不能解決它的需求,包括需求定制、數(shù)據(jù)安全、風(fēng)險(xiǎn)控制、服務(wù)支持等。只有把這些問題有效解決之后,行業(yè)應(yīng)用才真正能夠打通。
目前,國內(nèi)我們已在2萬多間酒店房間內(nèi)應(yīng)用了大模型,過去,與人工智能的對話不可能實(shí)現(xiàn)這樣的流暢度,僅僅可以完成功能性的交互,但現(xiàn)在有了山海大模型之后,靈活度高了很多。
04/
AGI將會繼續(xù)探索智能的極限
同時引領(lǐng)產(chǎn)業(yè)的升級
未來,我們認(rèn)為AGI將會繼續(xù)探索智能的極限,同時引領(lǐng)產(chǎn)業(yè)的升級。
首先,探索智能極限其實(shí)是科學(xué)層面的問題,雖然說它開啟了起點(diǎn),但是未來還有很大的挑戰(zhàn),包括更大的模型、數(shù)據(jù)和算法,以及可控性和可靠性方面的研究?,F(xiàn)在我們認(rèn)為這基本上超過了圖靈測試的水平,它會從模仿達(dá)到超越。因?yàn)楫?dāng)系統(tǒng)能達(dá)到這個狀態(tài)以后,在研究可計(jì)算的問題時,很有可能會超越人類的智慧。
對于產(chǎn)業(yè)來說,最核心的還是解決問題,能夠比較可靠、高效地驅(qū)動產(chǎn)業(yè)的發(fā)展。智能探索需要大量資金;從賺錢的角度來說,我們需要把產(chǎn)業(yè)推動起來,形成良性的商業(yè)閉環(huán),將行業(yè)真正構(gòu)建起來。
請關(guān)注啟明創(chuàng)投公眾號
在后臺輸入“生成式AI報(bào)告”
獲取完整報(bào)告下載方式