3月25日,中國發(fā)展高層論壇2023年年會在北京召開。在經(jīng)濟(jì)峰會《人工智能引領(lǐng)新產(chǎn)業(yè)革命》分組會環(huán)節(jié),復(fù)旦大學(xué)泛海國際金融學(xué)院執(zhí)行院長錢軍對話了清華大學(xué)蘇世民書院院長薛瀾、中國科學(xué)院自動化研究所人工智能倫理與治理中心主任曾毅、IBM大中華區(qū)董事長兼總經(jīng)理陳旭東、啟明創(chuàng)投創(chuàng)始主管合伙人鄺子平,共同就包括ChatGPT在內(nèi)的人工智能領(lǐng)域的熱點話題進(jìn)行了討論。
啟明創(chuàng)投創(chuàng)始主管合伙人鄺子平在演講中指出,大模型的規(guī)模有了巨大的飛躍,預(yù)訓(xùn)練提升了創(chuàng)新的效率,通用性極強(qiáng),此外,大模型能夠繼續(xù)學(xué)習(xí)和提高。鄺子平認(rèn)為,新一代人工智能將顛覆搜索、人機(jī)交互、內(nèi)容生成、教育等行業(yè)。
鄺子平稱,“現(xiàn)在大模型的方向已經(jīng)確定,燈塔已經(jīng)很明確,我非常有信心,趕上GPT3、GPT3.5在中國是有極大概率的事情,也就是時間的問題?!?/strong>
但他同時亦指出,國際交流、監(jiān)管、全球共識、人和機(jī)器的可持續(xù)關(guān)系等都是值得深入探討的議題。
以下系經(jīng)精編整理的演講實錄。
大家下午好!最近大家都在講新一代人工智能,講得都比較熱鬧,所以在我闡述新一輪的人工智能對我們整個產(chǎn)業(yè)、對各方面意味著什么、我們需要考慮一些什么問題之前,我可能花2分鐘時間大致說一下我們講的新一輪人工智能到底是什么。最近這個話題很熱,每碰到一位做企業(yè)的人都跟我們說,我們在做人工智能、我們也在做大模型、我們15年前就在做大模型,這個有點太“厲害”了。
現(xiàn)在說的大語言模型,以ChatGPT為代表的新一代的人工智能到底是什么。
第一個,模型的規(guī)模比起過往是巨大的飛躍,是1750億個參數(shù),歷史上沒有過這么大的模型。由于這個模型的巨大,OpenAI又通過用這個大模型把幾十個TB(Terabyte)的數(shù)據(jù)往里面灌去做預(yù)訓(xùn)練,所以在處理和生成自然語言方面它有一個非常巨大的飛躍。幾十個TB是什么意思?就是把美國的國會圖書館所有的文獻(xiàn)都往里面去灌了一遍也就大概這個規(guī)模,這是模型的巨大。
第二個,預(yù)訓(xùn)練。用這么海量的數(shù)據(jù)往這個模型里面進(jìn)行預(yù)訓(xùn)練得出來的結(jié)果,基本上剛剛像我說的,把人類幾千年的文字內(nèi)容都輸入進(jìn)去了,因為是一個自訓(xùn)練,所以也不存在過去說這個訓(xùn)練的數(shù)據(jù)過多了我們需要標(biāo)注,所以是預(yù)訓(xùn)練不需要標(biāo)注的過程。
第三個,因為它是往里面去灌這些通用的人類幾千年積攢下來的巨大的知識、文字?jǐn)?shù)據(jù),所以它的通用性極其強(qiáng)。以前我們也有很多優(yōu)秀的人工智能企業(yè),往往都是在一個垂直領(lǐng)域里面,但這次革命是它的通用性極強(qiáng),因此不需要做什么調(diào)整,ChatGPT很多一般性的對話都已經(jīng)能夠基本解決了,當(dāng)然它還開放一個API,如果企業(yè)有興趣在那上面用更多的跟行業(yè)有關(guān)的數(shù)據(jù)做一個分析的話,它對那個行業(yè)里的任務(wù)會做得更好。
最后,它可以在這個過程中繼續(xù)去學(xué)習(xí)、繼續(xù)去提高。
打造這樣一個大模型需要很多頂尖人才和努力,2015年OpenAI就開始做這個事情,每次的訓(xùn)練需要的價格也很昂貴,所以如果是15人的小團(tuán)隊跟我說也在做大模型做了N年,我們做的模型基本上能夠把OpenAI打掉,這個肯定是不準(zhǔn)確的。這次的人工智能革命為什么會那么根本性地改變整個社會對人工智能的期待,是因為它在這些方面有巨大的變化。
這個基礎(chǔ)上我們說新一代人工智能會顛覆哪些行業(yè)?因為我們做投資見了很多企業(yè),我會簡單提一下中國的現(xiàn)狀,我們現(xiàn)在的初創(chuàng)企業(yè)大致所在的水平。
顛覆哪些行業(yè)?一個是大家可能比較容易理解的搜索行業(yè)。搜索行業(yè)從根本上會被顛覆,過去我們通過一個搜索引擎尋找到一些相關(guān)的網(wǎng)上的資訊、文章等等,但是現(xiàn)在我們是通過這樣一個引擎找出我們需要的答案,這兩者非常不一樣,后臺如果是一個大模型的AI是可以給出答案的。這里面引出一個我們需要思考的問題,過去我去搜索,搜索引擎會告訴我搜到的這些結(jié)果的鏈接,我去點擊查找這個答案,而現(xiàn)在人工智能提供的結(jié)果,我到底信不信這個答案提供方的結(jié)果?這是非常值得我們?nèi)タ紤]的問題。
人機(jī)交互會發(fā)生根本性的改變,中國過去這些年有很多小的聊天機(jī)器人,其實都不太好用,這個我相信在未來會是一個增量,有了這樣一個底座、引擎以后,很多過去用不起來的聊天機(jī)器人就能夠用起來,甚至過去用得很好的聊天機(jī)器人也會在未來被顛覆。最近已經(jīng)有一個新聞?wù)f豐田準(zhǔn)備切換到ChatGPT去,確實這樣的聊天機(jī)器人在車上,你跟它對話會更人性化、更好用。
內(nèi)容生成的行業(yè)會產(chǎn)生根本性的改變。譬如文稿的撰寫,一些并不是準(zhǔn)備去拿大獎的小說、劇本基本上就能夠從這樣的人工智能里面生成了;另外中國是一個游戲制造大國,現(xiàn)在中國在游戲美工方面投入大量人力,而且也都做得很優(yōu)秀,這方面的工作可能在兩個月后的未來就會被人工智能所取代。
教育會發(fā)生翻天覆地的變化,除了學(xué)生會用ChatGPT寫作文以外,其實還有很多事情會改變。從正面來看,更個性化的一對一的輔導(dǎo)具備可能性了,但是老師的作用變成什么樣,我們需要在學(xué)校里面教的是什么,這個我相信馬上就會發(fā)生變化。
更長遠(yuǎn)的,我們現(xiàn)在看云,我們幾個軟件的工程師就能夠去開一家軟件企業(yè),因為不需要買服務(wù)器等等;一個電商的平臺就能夠讓一個小家庭把東西賣到全世界去。如果像OpenAI、ChatGPT這樣的底座、平臺做得越來越成功以后,AI平臺上面能夠造就出來的新藥研發(fā)企業(yè)、新材料企業(yè)等,我相信都會在這個世界發(fā)生,會把這個作為一個投資熱點。
中國的現(xiàn)狀怎么樣?在過去一段時間里面,我們知道百度文心一言已經(jīng)發(fā)布出來,包括阿里巴巴、字節(jié)跳動、騰訊等等這些大廠也都會緊隨其后。另外我們知道的已經(jīng)浮出水面的獨(dú)立的大模型企業(yè)也已經(jīng)有四、五家,所謂浮出水面就是說準(zhǔn)備A輪,第一次找我們來聊融資,要融過億、甚至兩三億美元的企業(yè)。我們見了上百家在OpenAI或者是做圖片的應(yīng)用型企業(yè),所以這塊的投資會很熱鬧、創(chuàng)業(yè)也會很熱鬧。
在這樣的情況下我們需要有些什么思考呢?還是蠻沉重的思考,比如中國希望看到怎樣的AI發(fā)展?最近這些年,中國人工智能的發(fā)展是有一定的優(yōu)勢的,起碼在前一波,因為中國的人才、市場應(yīng)用、大量的投資投入,讓很多類似中國四小龍等的企業(yè)有一定的優(yōu)勢,但在這一波里面沒有在最先進(jìn)的行列里。然而,因為現(xiàn)在大模型的方向已經(jīng)確定,燈塔已經(jīng)很明確,我非常有信心,趕上GPT3、GPT3.5在中國是有極大概率的事情,也就是時間的問題,但是之后怎么辦?在目前已經(jīng)很明確的燈塔技術(shù)之外需要大量的國際交往、國際交流,未來怎么做?還有在這樣的情況下中國這些AI平臺肯定是在互聯(lián)網(wǎng)平臺之后的又一個新的、巨大的平臺現(xiàn)象,中國監(jiān)管機(jī)構(gòu)對這些大平臺的取態(tài)是怎樣的?
最后回到剛剛曾毅教授的觀點,我認(rèn)為人工智能是一個世界性的現(xiàn)象、世界性的技術(shù),我覺得應(yīng)該能有足夠的國際智慧,在這個話題上能夠像氣候議題一樣,我們需要一些國際的共識,這個不是不同政體之間的沖突,而是人類和機(jī)器的一個關(guān)系,如果我們?nèi)澜绮荒苓_(dá)成某種共識的話,這是一個非常值得大家擔(dān)憂的話題,剛剛曾毅教授談到的人和機(jī)器的可持續(xù)的關(guān)系,我覺得那也是一個非常重要的話題。