編者按:在由啟明創(chuàng)投主辦的2023世界人工智能大會“生成式AI與大模型:變革與創(chuàng)新”論壇上,人工智能等技術(shù)前沿領(lǐng)域的著名專家與學(xué)者,頂級投資人和領(lǐng)軍創(chuàng)業(yè)者匯聚一堂,共同探索中國科技創(chuàng)新的驅(qū)動力量。
本次論壇是大會唯一一場由創(chuàng)投機(jī)構(gòu)主辦的相關(guān)論壇,立足創(chuàng)業(yè)與投資視角,分享了最新生成式AI前沿信息和實踐探索,并發(fā)布了行業(yè)首份基于對海內(nèi)外逾百家企業(yè)深入調(diào)研撰寫的生成式AI洞察報告,全方位解讀了生成式AI的產(chǎn)業(yè)變革和未來十大展望。
啟明創(chuàng)投投資企業(yè)銜遠(yuǎn)科技創(chuàng)始人、清華大學(xué)惠妍講席教授周伯文博士在主題演講中分享了如何用統(tǒng)一大模型底座賦能企業(yè)5D創(chuàng)新能力。周伯文指出,生成式AI是AGI的必由之路,ChatGPT開啟了人工智能的新拐點,AI從“與人競爭”變?yōu)椤皡f(xié)同交互”,幫助人類解決問題。
周伯文表示,大模型應(yīng)用的深化將回歸商業(yè)本質(zhì),AI與消費產(chǎn)業(yè)融合發(fā)展成未來趨勢,統(tǒng)一的大模型將驅(qū)動企業(yè)從數(shù)字化到智能化實現(xiàn)蛻變。銜遠(yuǎn)科技打造的大模型底座ProductGPT將重構(gòu)產(chǎn)品與用戶二元關(guān)系,賦能企業(yè)5D(機(jī)會洞察、爆品定義、方案設(shè)計、驅(qū)動研發(fā)、營銷轉(zhuǎn)化)全生命周期,并為員工提供知識管理、市場洞察、客戶交付等不同環(huán)節(jié)的生產(chǎn)力工具。
以下為精編整理的演講實錄。
01/
從“與人競爭”變?yōu)椤皡f(xié)同交互”
非常感謝啟明創(chuàng)投的邀請,和大家分享一些思考和進(jìn)展。首先,我想回答一下“這次的人工智能有什么不一樣”這一問題。
銜遠(yuǎn)科技創(chuàng)始人、清華大學(xué)惠妍講席教授周伯文博士
第一個不一樣,這一次是生成式AI,為什么生成式AI這么重要?美國著名的物理學(xué)家Richard Feynman有一句名言:凡是我不能創(chuàng)造的,我都沒有理解。2015年,我在美國參加一場學(xué)術(shù)會議時,我是世界上第一個開始用生成式人工智能讓AI進(jìn)行創(chuàng)造性寫作的人。很多人問我為什么要做這個?以前大家是從人撰寫的文章中閱讀、抽取并拼出來。當(dāng)時,我用他的這句話來回答。原因很簡單,只有能夠生成才能真正理解。因為Richard Feynman是人類智能的最高水平之一,我相信人工智能也是一樣。
第二個不一樣在于以前人工智能的高光時刻都是人工智能系統(tǒng)擊敗地表最強(qiáng)人類,并獲得廣泛的傳播效應(yīng)。1962年,IBM第一臺電腦擊敗跳棋的冠軍,到DeepBlue,再到IBM Watson。這三個AI應(yīng)用都與我本人有很深的淵源。第四個是AlphaGo,也是同樣的邏輯。ChatGPT不一樣,通過人和AI的協(xié)同和交互,以及prompt發(fā)掘大模型的潛力,答錯的時候糾正它,大模型能夠理解你的糾正,遵守你的指令進(jìn)行迭代。所以這些都是協(xié)同、交互產(chǎn)生的效果,每次都是人和AI共同創(chuàng)作。
毫無疑問,一個跟人協(xié)同、交互的人工智能比和人競爭的人工智能帶來的社會意義、市場價值要大得多。這是本質(zhì)的不一樣。
剛剛清華大學(xué)教授唐杰講到一些歷史的回顧,我也提一些歷史回顧,到底AI是怎么走向AGI?
首先講一下我的核心觀點。AGI是AI的高階形式,我認(rèn)為生成式AI是AGI的必由之路。我們現(xiàn)在所在的時間節(jié)點,GPT和Transformer是生成式AI的重要里程碑。
2016年,我是IBM全球總部人工智能研究院的院長,在紐約舉辦了一場IBM全球人工智能戰(zhàn)略會。我提出人工智能會有三個節(jié)點,從ANI到ABI到AGI。
ANI是狹義的人工智能,它的特點是高度依賴監(jiān)督學(xué)習(xí)算法,需要大量人工標(biāo)記的數(shù)據(jù),任務(wù)范圍狹窄。但是好處是你能準(zhǔn)確知道這個人工智能系統(tǒng)的功能。這在2016年都已經(jīng)實現(xiàn)了。
當(dāng)時在展望時,我說未來我們會經(jīng)過一個ABI階段,再到AGI。AGI不是一夜之間發(fā)生的。2016年,市場上很多人討論深度學(xué)習(xí)這么厲害,AlphaGo這么厲害,人類會不會就一下進(jìn)入AGI?我認(rèn)為不會,因為還有另外一個階段叫ABI,ABI指的是廣義的人工智能。它的核心之一是必須要依賴自監(jiān)督算法,不需過多依賴人類的標(biāo)注;第二,它完成任務(wù)一定是端到端的模式,換句話說人不需要分解任務(wù),即讓AI學(xué)習(xí)子任務(wù),然后人類再拼起來,這是非常冗余的過程;第三,它要從當(dāng)時的判別式AI轉(zhuǎn)化為更強(qiáng)的生成式AI。
回頭看,我的判斷都是對的。在ABI階段,我們沒有想到大模型的有限能力,認(rèn)為零樣本學(xué)習(xí)是AGI的屬性。零樣本學(xué)習(xí)是什么?指的是沒有教AI做這件事情,它自己就會了。這意味著在ABI階段,你不可能確切知道一個AI系統(tǒng)會完成什么,它會有令你驚訝的產(chǎn)出,很多情況下是正向的產(chǎn)出,但是有時候也會是需要人們警醒的事情。
這就會為AGI奠定基礎(chǔ)。目前,我認(rèn)為我們屬于ABI到AGI的過渡階段。問題是這一過渡會有多長時間?我們能不能做好準(zhǔn)備?我認(rèn)為這是一個開放性問題。不管怎樣,AGI是在多個任務(wù)上逼近和超過人類的智力水平,因為這種智力水平要尋求自主的發(fā)展,會變得越來越聰明。毫無疑問這會需要更強(qiáng)的治理和監(jiān)管。
如果把這三個階段放在一起,我個人認(rèn)為AI發(fā)展最好的階段就是ABI階段。這是一個最佳的時間點,它的能力足夠強(qiáng),人們能用很多應(yīng)用,能更低成本地泛化它,但是同時又不需要有太多關(guān)于AGI的擔(dān)憂。當(dāng)年我們也是希望找到在AGI到來之前的明確方向。
02/
AI新時代的摩爾定律
所以在ABI時代,我覺得整個世界已經(jīng)開始改變了,Sam Altman發(fā)了一條關(guān)于新的摩爾定律的推特,他提到未來每隔18個月宇宙的智慧總量會翻一倍。該如何理解?一種是像GPT-4、GPT-5這種中心化的智慧能力會越來越強(qiáng),如果每18個月翻一倍,我們能不能接受?
第二種是通過這些生成式AI賦能數(shù)字觸點,具備智慧能力的數(shù)字觸點數(shù)目每18個月翻一倍,在量上取勝。這也是我2019年、2020年在烏鎮(zhèn)互聯(lián)網(wǎng)大會上發(fā)布的觀點。
我當(dāng)時舉了一個例子。可以將京東的每個SKU想象成數(shù)字觸點,有商品介紹、賣點,我們用當(dāng)時的大模型Plug完成的對商品詳細(xì)頁面的理解、分析、提煉、歸納,能夠根據(jù)消費者的行為數(shù)據(jù)推斷出哪兩個賣點最能打動消費者;圍繞消費者的畫像逐字生成最能打動消費者的推薦理由;能夠選擇合適的圖片,千人千面推送給消費者。后來我們發(fā)現(xiàn)這種模式與達(dá)人KOL寫的導(dǎo)購文字相比,在京東上的轉(zhuǎn)化率高30%。換句話說,當(dāng)時我們看到的趨勢是每一件商品都會有人工智能助理,每個數(shù)字觸點都會具備智慧能力。
毫無疑問,摩爾定律一定會發(fā)生,可能會以多種路徑同時發(fā)生。比如GPT-4、GPT-5會越來越強(qiáng),具備這種能力的數(shù)字觸點的數(shù)目也會越來越多。
03/
大模型應(yīng)用的深化
回歸商業(yè)的本質(zhì)
回到企業(yè)的角度,我經(jīng)常問企業(yè)家,公司中是否有人在做產(chǎn)業(yè)化、數(shù)字化和智能化?基本上都在舉手。但問及有多少人對產(chǎn)業(yè)數(shù)字化、智能化的結(jié)果滿意?沒人舉手。麥肯錫2022年的調(diào)查報告中的數(shù)據(jù)基本上就對比了中國和美國利用人工智能技術(shù)之后的收入增長的變化。
在中國使用人工智能技術(shù)能帶來10%以上收益增長的非常少,美國更多。中國大部分企業(yè)使用人工智能之后,發(fā)現(xiàn)增長小于5%。這是目前的現(xiàn)實,核心原因是人工智能中不論ANI、ABI到AGI,不能和人工智能結(jié)合。
為了回答這個問題,我們就思考怎么與業(yè)務(wù)結(jié)合?這里引用德魯克的一句名言——企業(yè)只有兩個基本功能:一是創(chuàng)造差異化的產(chǎn)品和服務(wù);二是通過市場營銷,成為顧客心里的首選。除此之外,其他所有的功能都是為這兩個功能服務(wù)的。如果這兩個功能不存在,其他的功能也沒必要存在。
如果這是企業(yè)的使命,其實產(chǎn)生了一個非常強(qiáng)的信號——應(yīng)該回到一個以消費者為中心的商業(yè)模式。我將之稱為新的相對論,E=MC2。E就是企業(yè)的Earnings(收益),這是底線。M是Merchandise(商品),C就是Customer(消費者)。為什么C是平方?傳統(tǒng)的供應(yīng)鏈中,購買側(cè)完成整個交易的閉環(huán);在新的數(shù)字驅(qū)動的邏輯下,購買側(cè)應(yīng)該成為整個企業(yè)運轉(zhuǎn)、決策到產(chǎn)品創(chuàng)意設(shè)計的原始驅(qū)動力。
圍繞剛才德魯克的名言,2020年,我在京東負(fù)責(zé)京東云和AI的業(yè)務(wù),調(diào)研了大概數(shù)十家品牌企業(yè),探索在生產(chǎn)流程環(huán)節(jié)中人工智能起到的作用。這其中有13個大場景,數(shù)百個小場景。我們當(dāng)時搭建了人工智能的平臺叫New Hub。現(xiàn)在,這一人工智能平臺的調(diào)用量每天將近100億次。我們是從零開始建設(shè)的,現(xiàn)在調(diào)用量這么大,確實證明外界有很強(qiáng)的需求。當(dāng)時所有模型都是相互獨立的,換句話說是小模型,我們得用數(shù)百個模型支持這些場景,再乘以客戶的數(shù)目,所以從商業(yè)模式上來看是有挑戰(zhàn)的。
我們看到在大模型的驅(qū)動下,有可能讓統(tǒng)一的模型底座來完成所有的流程數(shù)字化和智能化。換句話說,對企業(yè)來講,如何構(gòu)建大模型完成動態(tài)和場景的匹配,是企業(yè)數(shù)字化發(fā)展中重要的下一階段。我們已經(jīng)度過了數(shù)字化、智能化到場景化的階段。
理論上講,為什么這是可行的?我們來看看為什么ChatGPT能帶來巨大的變化。在OpenAI看來ChatGPT不是一個語言模型,這是一個基于多頭自注意力架構(gòu)來預(yù)測下一個詞而訓(xùn)練出來的大語言模型,本質(zhì)上是世界知識的壓縮器。多頭自注意力是我們團(tuán)隊在2016年的一篇論文中提出來的。這篇論文的核心思想是幫助大模型跳躍式地尋找更重要的部分。這樣訓(xùn)練出來的大模型如果能夠預(yù)測正確下一個詞,意味著它對整個世界的知識有充分的理解。
譬如在我現(xiàn)在的演講中,如果要猜出我下一個詞會講什么,需要對我、我所講的內(nèi)容有了解;同時,還得理解我在什么樣的場合演講,聽眾是誰?如果具備將所有的信息融合起來預(yù)測下一個詞的能力,就具備對世界知識的理解能力。
04/
銜遠(yuǎn)科技大模型重構(gòu)產(chǎn)品與用戶的二元關(guān)系
賦能企業(yè)5D全生命周期
同樣的邏輯,我們放到人跟商品的二元關(guān)系上。如果有一個大模型理解真實世界中各類人和商品的互動,比如人在不同場景的使用,人的購買決策、體驗、反饋,產(chǎn)品的品參、功能、設(shè)計、外觀等,所有的東西通過預(yù)測的方式大量地學(xué)習(xí)和壓縮,能訓(xùn)練出一個理解人的思想和情感、所處的狀態(tài)和包括與產(chǎn)品互動的模型。在這一基礎(chǔ)上,這個模型回到德魯克剛才講的兩個主要任務(wù):幫助企業(yè)在5D的場景下創(chuàng)造出價值。
5D中的Discover指的是幫助企業(yè)洞察和理解消費者;Define指的是定義爆品;Design指的是方案設(shè)計;Develop指的是驅(qū)動研發(fā);Distribute指的是營銷轉(zhuǎn)化。
在此基礎(chǔ)上,模型會同時具備三層能力。第一層,認(rèn)知能力、語言理解能力非常重要,能夠理解人的情感,同時具備跟人對話、指令跟隨等各方面的能力,具備認(rèn)知、推理能力,這部分叫做IQ(智商)。因為核心是要關(guān)注消費者、人的情感體驗、購買的動機(jī),模型需要具備共情能力,能主動與消費者互動、理解消費者,就像前述的導(dǎo)購文字的生成,我們將之理解成EQ(情商)。一個具備IQ和EQ的模型,基本上是通用大模型,能夠完成很多的事情。這個場景下還額外需要涉及品牌相關(guān)的能力,包括機(jī)會洞察力、產(chǎn)品定義力、方案設(shè)計力、研發(fā)驅(qū)動力和營銷轉(zhuǎn)化力等,這一切我們稱為PQ(品商)。品商大模型的底座必須同時具備智商和情商,任何使用得不錯的場景必須具備通用模型的能力。
基于這一系統(tǒng),如何給客戶創(chuàng)造價值?有好幾種方式。底座是銜遠(yuǎn)科技通用大模型,它包括大語言和多模態(tài)模型?;诖耍梢灾С忠粋€類似ChatGPT的圍繞人和商品定制的ProductGPT。ProductGPT能夠幫助B端客戶完成不同的任務(wù),比如用戶研究、市場調(diào)研、銷售計劃、產(chǎn)品研發(fā)、營銷推廣等。從員工、企業(yè)的角度來講,ProductGPT能夠覆蓋知識管理、市場洞察、客戶交付和不同環(huán)節(jié)涉及員工生產(chǎn)力的工具,生成爆品。可以理解為公有云的模式。
很多企業(yè)表示自己具備大量的行業(yè)專業(yè)知識和數(shù)據(jù),在銜遠(yuǎn)科技大模型的基礎(chǔ)上可以很快獲得一個私有化部署的大模型,用戶遵循ProductGPT的架構(gòu),打造相應(yīng)的Copilot。比如,一個企業(yè)表示需要機(jī)會挖掘機(jī)、機(jī)會智造師,都可以在私有云里部署,完成5D的需求。
這里有很多技術(shù)的挑戰(zhàn)。第一,大模型的落地。上半年都在熱烈地討論大模型,下半年在講落地。一個很大的挑戰(zhàn)在于大模型的所有人和私有行業(yè)數(shù)據(jù)的所有人往往不是同一個人。這個情況怎么辦?不能要求把數(shù)據(jù)都交給他人。大模型是需要花很多錢訓(xùn)練出來的。因此,這需要一些機(jī)制。在我們最近的研究中,提及需要一種大模型的模仿技術(shù),這種技術(shù)能實現(xiàn)模仿大模型,并完全交給客戶訓(xùn)練更高效的模型。這一方法的效果遠(yuǎn)遠(yuǎn)好于知識蒸餾,比知識蒸餾高效很多倍;同時我們還發(fā)現(xiàn)了模塊的涌現(xiàn)效應(yīng)。
第二,當(dāng)部署大模型到私有化場景里,怎么融合各種模型的推理能力?很多企業(yè)因為要服務(wù)大量的C端客戶,需要模型推理得足夠快。所以這里的困境就是如何保持大模型的多輪推理和學(xué)習(xí)的能力,同時要有足夠多且快的小推理。這里,我們也有論文提出利用輔助PaD的方法,其核心邏輯是找到一個方法,讓小模型具備和大模型一樣的多輪推理能力,結(jié)果一個60M小模型的多輪推理的效果全面超越13B的大模型。
05/
ProductGPT人機(jī)協(xié)同
更好地轉(zhuǎn)化和匹配消費者
最后講一下我們落地的實際場景和案例。以食品飲料領(lǐng)域為例,ProductGPT可以幫助不同企業(yè)內(nèi)部的員工完成關(guān)于市場洞察、產(chǎn)品創(chuàng)新和包裝、新品設(shè)計等不同的功能。人只善于在一個品類深耕,ProductGPT可以跨品類,通過品類遷移和不同方向的創(chuàng)造性思考更好地提供建議。ProductGPT的能力可以幫助更精準(zhǔn)地洞察消費者的行為模式。
在理解消費者的需求時,有時候消費者、使用者、購買者不是同一人,但是通過大模型形成對人們對話的深刻理解,就能更好地判斷品參、進(jìn)行設(shè)計,從而讓購買者、使用者都滿意。
我們已經(jīng)在一些頭部的3C家電企業(yè)里應(yīng)用了這一技術(shù),幫助他們打造爆品,并獲得非常高的銷售額。比如,電冰箱的品類大概有數(shù)百位參數(shù),所有的參數(shù)都是由生成式人工智能自動推導(dǎo)出來的。
在面向消費者的動態(tài)化的匹配方面,大模型更理解消費者、產(chǎn)品,這種深刻的理解,有助于更好地轉(zhuǎn)化和匹配消費者。如果要幫助我們一位做酸奶制品的客戶更高效地投放,只需在與消費者對話的過程中理解消費者,比如消費者更注重產(chǎn)品質(zhì)量、供應(yīng)鏈,我們會在展示的動態(tài)對話框和廣告中,動態(tài)生成綠色包裝的酸奶背景,讓人聯(lián)想到瑞士的青山綠水。如果是喜歡玩飛盤、露營的年輕消費者,我們展現(xiàn)的產(chǎn)品背景是會動態(tài)變化的綠草、紅花。
此外,我們幫助非常高端的品牌生成在不同模態(tài)、場景下更匹配的圖,都是通過ProductGPT技術(shù)實現(xiàn)的。我們與某一汽水品牌合作,生成動態(tài)的動漫營銷素材。
通過今天的演講,我想讓大家理解銜遠(yuǎn)科技從2021年開始,希望用生成式AI的方式,幫助企業(yè)、消費者,讓每一件商品都應(yīng)需而生,讓每個消費者都得償所愿。謝謝大家。
請關(guān)注啟明創(chuàng)投公眾號
在后臺輸入“生成式AI報告”
獲取完整報告下載方式