編者按:在由啟明創(chuàng)投主辦的2023世界人工智能大會(huì)“生成式AI與大模型:變革與創(chuàng)新”論壇上,人工智能等技術(shù)前沿領(lǐng)域的著名專家與學(xué)者,頂級(jí)投資人和領(lǐng)軍創(chuàng)業(yè)者匯聚一堂,共同探索中國(guó)科技創(chuàng)新的驅(qū)動(dòng)力量。
本次論壇是大會(huì)唯一一場(chǎng)由創(chuàng)投機(jī)構(gòu)主辦的相關(guān)論壇,立足創(chuàng)業(yè)與投資視角,分享了最新生成式AI前沿信息和實(shí)踐探索,并發(fā)布了行業(yè)首份基于對(duì)海內(nèi)外逾百家企業(yè)深入調(diào)研撰寫的生成式AI洞察報(bào)告,全方位解讀了生成式AI的產(chǎn)業(yè)變革和未來十大展望。
本次論壇特邀Hugging Face的中國(guó)區(qū)負(fù)責(zé)人王鐵震和未盡研究創(chuàng)始人周健工,就開源力量如何推動(dòng)生成式AI的發(fā)展展開深入探討。
王鐵震認(rèn)為新的一波AI 2.0(生成式AI)模型相比AI 1.0的模型顯示出極強(qiáng)的通用性,讓每個(gè)用戶可以使用,而非僅僅是工程師使用的AI工具。閉源模型如ChatGPT和GPT-4雖然是公認(rèn)效果最好的模型,但存在數(shù)據(jù)安全、部署成本與可控性等問題,Hugging Face的千億參數(shù)開源大模型BLOOM為用戶提供了解決上述問題的機(jī)會(huì),讓大模型和AI普惠化。此外,Hugging Face也受益于為全世界開發(fā)者提供了分享想法、思路和技術(shù)的開源社區(qū)而蓬勃發(fā)展。
作為全球性的模型開源社區(qū),Hugging Face上有25萬個(gè)模型,而平臺(tái)僅有200名員工,周健工表示這令人感到吃驚,并指出業(yè)界需要集思廣益來思考AI如何普惠更多的人與行業(yè),以及如何在發(fā)展過程中確保大模型的可信和安全等問題。
以下為精編整理的對(duì)話實(shí)錄。
01/
通過開源大模型的普惠化
解決數(shù)據(jù)安全、部署成本與可控性等問題
周健工:今天非常榮幸和大家探討這個(gè)非常重要的話題,關(guān)于開源大模型。剛才Alex(啟明創(chuàng)投合伙人周志峰)在演講中提及高科技公司出現(xiàn)了一個(gè)很明顯的特征——越來越少的員工創(chuàng)造出估值越來越大的公司。我就問了Hugging Face的中國(guó)區(qū)負(fù)責(zé)人王鐵震目前公司有多少員工?他說有200人。我也很驚訝,Hugging Face被稱為全球大模型開源社區(qū)的GitHub,在開源社區(qū)里面無人不知無人不曉,但是只有200人。這場(chǎng)對(duì)話一定是有價(jià)值的。
昨天我問王鐵震最近在忙什么?他說我最近半年都在學(xué)習(xí)。第一個(gè)問題,您這半年學(xué)習(xí)了什么?通過學(xué)習(xí),您對(duì)生成式AI的行業(yè)前景有怎樣的新感悟?
王鐵震:過去五六年,我在谷歌都是在進(jìn)行人工智能方面的工作。我們當(dāng)時(shí)做谷歌人工智能訓(xùn)練框架,涉及服務(wù)器、手機(jī)等。我發(fā)現(xiàn)那一波人工智能和現(xiàn)在這一波AI 2.0時(shí)代的生成式AI非常不一樣。以前的模型其實(shí)不那么聰明,通用性不好,所以面對(duì)每一個(gè)場(chǎng)景,都需要重新訓(xùn)練。所以它是一個(gè)2B、面向開發(fā)者的AI工具,并不是普通人也能用起來的AI工具。
去年大概10月、11月,我發(fā)現(xiàn)現(xiàn)在這一波的AI浪潮非常不一樣。使用Stable Diffusion最多的不是AI圈的人,而是學(xué)藝術(shù)、設(shè)計(jì)的人。ChatGPT出現(xiàn)后,我發(fā)現(xiàn)美國(guó)普通的學(xué)生已經(jīng)應(yīng)用ChatGPT寫作業(yè)了。當(dāng)時(shí)我正好有一個(gè)契機(jī)加入Hugging Face,加入進(jìn)來后,我就學(xué)習(xí)了比較新的技術(shù)。除此之外,我還向開發(fā)者學(xué)習(xí)。因?yàn)檫@是一個(gè)2C的產(chǎn)品,每個(gè)人都使用它,將它與自己的需求、領(lǐng)域結(jié)合起來。我也是向大家學(xué)習(xí)怎樣使用該技術(shù)解決問題,當(dāng)看到一些比較創(chuàng)新的想法后,我非常開心。前六個(gè)月我基本都在學(xué)習(xí)中,每天都非常充實(shí),感覺24小時(shí)完全不夠用。
周健工:其實(shí)Hugging Face是受到中國(guó)研究人員和開發(fā)者重視的一個(gè)平臺(tái)。最近的大模型,尤其是ChatGPT和GPT推出之后,很快Meta推出一個(gè)Llama,且越來越多的開源模型被推出。在行業(yè)內(nèi)很自然地產(chǎn)生了一個(gè)爭(zhēng)論,即閉源和開源模型,它們是怎么共同推進(jìn)生成式AI往前發(fā)展的?它們各自有什么特點(diǎn)和不足?
王鐵震:我們以大模型為例。大家最熟悉的大模型ChatGPT是一個(gè)閉源的模型。毋庸置疑,ChatGPT及GPT-4是效果最好的模型。很多企業(yè)在創(chuàng)業(yè)的早期,其實(shí)也都是選擇ChatGPT,直接給出一些Prompt,就可以很快把產(chǎn)品做出來。但是隨著規(guī)模的擴(kuò)大,或者領(lǐng)域要求的變化,就會(huì)發(fā)現(xiàn)數(shù)據(jù)安全、企業(yè)部署的場(chǎng)景及部署的成本等一些功能上的問題,其實(shí)ChatGPT并不能完全滿足需求。因此,企業(yè)就希望擁有一個(gè)可控、可調(diào)節(jié)、可修改的大模型。
Hugging Face贊助的一個(gè)開源組織叫Big Science,做千億級(jí)的模型Bloom。當(dāng)時(shí),我們使用A100訓(xùn)練這個(gè)模型花了100多天,成本非常高,且有50多噸的二氧化碳排放。所以,從頭訓(xùn)練一個(gè)模型是非常不經(jīng)濟(jì)的,尤其對(duì)于中小型的公司。其他很多做開源大模型的公司把這個(gè)模型公布出來,大家可以基于這個(gè)模型做一些場(chǎng)景的調(diào)優(yōu),這對(duì)企業(yè)來說要求更低,不需要那么多卡和時(shí)間,稍微少一點(diǎn)的算力和數(shù)據(jù)都可以完成。這其實(shí)是開源社區(qū)帶來的非常好的機(jī)會(huì)。
往更遠(yuǎn)說,其實(shí)開源社區(qū)所有的東西都是透明的,譬如這個(gè)模型用了什么樣的數(shù)據(jù),包括最近大家都認(rèn)為網(wǎng)絡(luò)有被遺忘的權(quán)利,也就是說被閉源模型數(shù)據(jù)“吃”掉之后,你永遠(yuǎn)不知道自己的事情是否在互聯(lián)網(wǎng)上被公布。開源模型所有的數(shù)據(jù)集都是公開的。我們?cè)谘邪l(fā)大模型的時(shí)候,做了BigCode模型,其特殊的機(jī)制就是可以O(shè)pt out。因?yàn)閿?shù)據(jù)集、模型訓(xùn)練、模型發(fā)布、優(yōu)化都是網(wǎng)上全部公開的內(nèi)容,用戶隨時(shí)可以加入,發(fā)現(xiàn)這個(gè)模型使用的技術(shù)。它提供Opt out的機(jī)制,就是如果數(shù)據(jù)不想被大模型“吃”掉,不想用于大模型的訓(xùn)練,就隨時(shí)可以把它抹掉,這是開源相對(duì)于閉源非常大的優(yōu)勢(shì)——它使得個(gè)人、企業(yè)可以按照自己的需求定制。
另外一個(gè)優(yōu)勢(shì)是開源其實(shí)是非常好的工具,它可以在在線的平臺(tái)團(tuán)結(jié)全世界的所有開發(fā)者。只要有一些想法、思路,開發(fā)者都可以通過開源的方式加入開源社區(qū),或者通過其他方式把所做的事情快速地與全世界分享。
剛才您提到Stable Diffusion在很短的時(shí)間內(nèi)就已經(jīng)凝聚了一個(gè)非常大的社區(qū),這個(gè)技術(shù)的采用速度是非??斓?,我認(rèn)為它之所以能做到這一點(diǎn),其實(shí)與蓬勃發(fā)展的開源社區(qū)是分不開的——每個(gè)人都能參與進(jìn)來,不僅僅是一個(gè)公司幾百人、幾千人才能做這件事。
02/
通過開源方式將大模型普惠化
周健工:世界人工智能大會(huì)開幕當(dāng)天,2018年圖靈獎(jiǎng)得主、Meta AI基礎(chǔ)人工智能研究院團(tuán)隊(duì)首席人工智能科學(xué)家楊立昆(Yann LeCun)在講話中表示,現(xiàn)在解決大模型問題的唯一的出路就是開源。您怎么評(píng)論這句話?
王鐵震:站在Hugging Face的角度,我們其實(shí)非常希望通過開源的方式把大模型普惠化,讓每個(gè)公司、每個(gè)人都能擁有自己的大模型來解決一些問題,包括數(shù)據(jù)隱私、數(shù)據(jù)安全等。現(xiàn)在很多世界500強(qiáng)的企業(yè)都明確規(guī)定員工不許使用ChatGPT這種模型,甚至有一些謠言說谷歌的員工也不允許使用Bard模型,就是擔(dān)心數(shù)據(jù)、隱私的泄露。
另外,為了讓這個(gè)模型在某一個(gè)領(lǐng)域趨同人的行為,ChatGPT其實(shí)做了alignment(對(duì)齊),通過開源,每個(gè)人都可以根據(jù)自己的需求去生成。但是,ChatGPT并不擅長(zhǎng)生成網(wǎng)文,而寫小說非常需要?jiǎng)?chuàng)造力,生成網(wǎng)文的模型所需的對(duì)齊方式和ChatGPT的對(duì)齊方式不一樣,所以如果只用ChatGPT是無法完成的,你需要有一個(gè)自己的模型,根據(jù)自己的訴求做微調(diào)。
周健工:看到Hugging Face上有25萬個(gè)模型,我還是非常吃驚,這都是什么樣的模型?它們?yōu)槭裁炊荚谀銈兊钠脚_(tái)上?
王鐵震:剛才我們聊的其實(shí)都是NLP領(lǐng)域的文本大模型,這個(gè)在開源社區(qū)看來只是萬千模型種類中的一種,包括最近特別熱門的文生圖都是在我們平臺(tái)上。為什么這么受歡迎?因?yàn)槊總€(gè)人可以練自己的LoRA,比如我的形象不在基礎(chǔ)的模型里,需要做一些基礎(chǔ)的訓(xùn)練,把我的模型發(fā)布出去,別人才能使用我的風(fēng)格去生成。除了文生圖之外,最近特別熱門的是文生聲音。今年聲音模型會(huì)是一個(gè)突破的點(diǎn),這一領(lǐng)域也會(huì)有非常多的模型。
回到您剛才的問題,為什么千千萬萬的模型都選擇在Hugging Face平臺(tái)上傳?分別是技術(shù)層面、社區(qū)層面的原因。
技術(shù)層面上,我們是AI界的GitHub,更方便AI界的人使用的原因之一是我們支持大文件的上傳。譬如,一個(gè)Stable Diffusion的文件可能就達(dá)到4-5G,在GitHub上無法保存。
而且大家基于我們的平臺(tái)可以做版本控制、開源的協(xié)作等,每個(gè)人都可以完成,最后會(huì)使得開源模型變得更好。技術(shù)上我們提供一鍵部署,把模型快速地部署到亞馬遜云上,可以很快地把你的模型放到生產(chǎn)環(huán)境中使用。這就是大家為什么會(huì)使用Hugging Face的原因。
社區(qū)文化上來說,我們其實(shí)是一個(gè)非常重視開源社區(qū)的公司。我們特別希望幫助開源開發(fā)者,讓更多開發(fā)者參與到開源的事業(yè)中來。我們特別愿意接受大家的反饋,與大家互動(dòng),對(duì)第一次貢獻(xiàn)代碼的開源模型開發(fā)者,我們都會(huì)提供非常細(xì)致的輔導(dǎo),這很花時(shí)間,投入產(chǎn)出比不高,但是為了把開源社區(qū)慢慢做起來,我們覺得這是非常有價(jià)值的事情。
譬如有人反饋Hugging Face某一個(gè)系統(tǒng)的變量名不是特別好,第二天就發(fā)現(xiàn)Hugging Face的員工專門圍繞這一反饋開始討論。這個(gè)社區(qū)文化實(shí)際上非常好,每個(gè)人到社區(qū)里就有一種家的感覺,大家更愿意使用這個(gè)平臺(tái)。
03/
各行各業(yè)的人引入具體的場(chǎng)景
助力探索AI的未來發(fā)展方向
周健工:談到社區(qū),Hugging Face有三類用戶,第一類是早期的研究者,第二類是開發(fā)者,第三類是Hugging Face想真正找到的技術(shù)使用者。結(jié)合您在中國(guó)的這些工作經(jīng)歷,請(qǐng)講一講未來Hugging Face社區(qū)的發(fā)展方向。
王鐵震:因為我們想要做AI的普惠化,希望每個(gè)國(guó)家及地區(qū)、企業(yè)都有自己的模型,并且我們希望每個(gè)人都能用上生成式AI提高他們的生產(chǎn)力,享受這個(gè)技術(shù)帶來的福祉。
我們?cè)缙诘墓ぷ鞔_實(shí)是像您說的,主要關(guān)注學(xué)術(shù),研究怎么方便開發(fā)者更快地創(chuàng)造模型。之后我們?cè)O(shè)計(jì)了一套API的流程,讓大家可以用同樣的API快速調(diào)用所有的Transformer或者是Diffuser base的模型。
慢慢地我們擴(kuò)展到工業(yè)界,抹平學(xué)術(shù)界和工業(yè)界的差異,比如學(xué)術(shù)界的一個(gè)模型很快就能在工業(yè)界應(yīng)用起來。剛才提到,這一波生成式AI對(duì)每一個(gè)非技術(shù)項(xiàng)用戶都有很大的幫助,我們希望進(jìn)一步降低這個(gè)方面的門檻。比如,要使用GitHub上的一個(gè)repo,對(duì)應(yīng)所需的搭配其實(shí)比較麻煩,特別對(duì)于非技術(shù)項(xiàng)的用戶;但Hugging Face提供了很多工具,其中spaces提供了在線的容器環(huán)境,開發(fā)者可以把模型直接部署在spaces上面,用戶看到的不僅是一堆代碼、二進(jìn)制的文件,還有鮮活的應(yīng)用,直接點(diǎn)擊就可以看到這個(gè)模型所做的事情。
另外,我們?cè)趪?guó)內(nèi)舉辦了很多活動(dòng),希望幫助更多人了解模型。我們最近在小紅書上舉辦了一場(chǎng)基于diffuser的活動(dòng),大家可以生成自己的卡通風(fēng)格的頭像,這與普通產(chǎn)品不一樣的是我們提供了一個(gè)開發(fā)的環(huán)境,大家可以在執(zhí)行程序產(chǎn)生圖像結(jié)果時(shí),調(diào)節(jié)其中很多參數(shù),可以了解這個(gè)模型的內(nèi)核,慢慢對(duì)此產(chǎn)生興趣,進(jìn)一步把AI的能力和實(shí)際需求結(jié)合起來。
我們最近也舉辦了AI for Gaming的活動(dòng),希望研發(fā)游戲的人能了解AI的能力,讓做AI的人了解游戲場(chǎng)景關(guān)注什么,把兩者結(jié)合起來,我們?cè)谶@個(gè)方向上會(huì)做很多特別有意思的探索。
不僅AI的發(fā)展能夠幫助各行各業(yè)的人,其實(shí)各行各業(yè)的人加入進(jìn)來,對(duì)AI的發(fā)展更有幫助,大家可以一起探索前沿未來的方向,因?yàn)檫@不是AI圈內(nèi)部就能解決的問題,我們要引入具體的場(chǎng)景。
周健工:這一點(diǎn)確實(shí)非常重要,AI怎么普惠更多的人和行業(yè)。另一方面,AI怎么在發(fā)展的過程中解決可信、安全等問題。
最近我看到Hugging Face牽頭寫了一篇非常有意思的論文,聯(lián)合行業(yè)中的科技公司和頂級(jí)高校從兩個(gè)層面解決上述幾個(gè)問題。第一個(gè)是系統(tǒng)的層面,第二個(gè)是社會(huì)的層面。我覺得這是平臺(tái)真正應(yīng)該負(fù)責(zé)做的事情。非常感謝您帶來了精彩的科普。我們歡迎Hugging Face來中國(guó)。謝謝大家。
王鐵震:感謝。