7月6日,由啟明創(chuàng)投主辦的2024世界人工智能大會(WAIC)“啟明創(chuàng)投·創(chuàng)業(yè)與投資論壇——超級模型、超級應(yīng)用、超級機(jī)遇”在上海世博中心紅廳成功舉辦。大語言模型、多模態(tài)模型、具身智能和生成式AI應(yīng)用領(lǐng)域的著名專家與學(xué)者,頂尖投資人和領(lǐng)軍創(chuàng)業(yè)者匯聚一堂,圍繞生成式AI基礎(chǔ)技術(shù)進(jìn)展、商業(yè)應(yīng)用前景和創(chuàng)業(yè)投資生態(tài)等主題展開分享與交流。
作為中國在AI領(lǐng)域最早投資且布局最豐富的投資機(jī)構(gòu),這是啟明創(chuàng)投連續(xù)第二年主辦該論壇,也是本屆世界人工智能大會唯一一場由創(chuàng)業(yè)投資機(jī)構(gòu)發(fā)起的、旨在從創(chuàng)新視角展示和探討生成式AI的分論壇。
啟明創(chuàng)投從2013年開始系統(tǒng)性布局人工智能領(lǐng)域,從AI 1.0到AI 2.0,經(jīng)過十余年的深耕與前沿洞察,啟明創(chuàng)投在AI領(lǐng)域投資了眾多項目,多家已上市或成長為獨角獸企業(yè)。
啟明創(chuàng)投主管合伙人周志峰在以“技術(shù)突破到應(yīng)用變革-AI發(fā)展的新篇章”為主題的開幕演講中介紹道,啟明創(chuàng)投在人工智能領(lǐng)域的投資策略已經(jīng)發(fā)生演變,從將人工智能視為一個技術(shù)或一個垂直領(lǐng)域去進(jìn)行投資,轉(zhuǎn)變?yōu)閷⑵湟暈榛A(chǔ)能力、去尋找其在千行百業(yè)落地的巨大潛力。
啟明創(chuàng)投主管合伙人周志峰
相較于互聯(lián)網(wǎng)浪潮中應(yīng)用的落地時間點,周志峰預(yù)測在當(dāng)前的AI浪潮中,應(yīng)用的爆發(fā)將會顯著提前。目前,生成式AI在三個“C領(lǐng)域”——Copilot(生產(chǎn)力工具)、Creativity(創(chuàng)意)、Companionship(陪伴)獲得了大量用戶的青睞,呈現(xiàn)出類似互聯(lián)網(wǎng)應(yīng)用的發(fā)展軌跡,正在經(jīng)歷從用來提高效率(Save Time)的應(yīng)用向旨在獲得愉悅(Kill Time)的應(yīng)用的轉(zhuǎn)變。他指出,互聯(lián)網(wǎng)是把信息分發(fā)的邊際成本幾乎降為零,生成式AI的核心是把數(shù)字化內(nèi)容的創(chuàng)造邊際成本幾乎降為零,由此看來AI技術(shù)一定會釋放巨大的價值。
周志峰指出中國巨大的市場、優(yōu)秀的技術(shù)能力及人才儲備、過去20年培養(yǎng)和積累的卓越的創(chuàng)造應(yīng)用的經(jīng)驗及能力,為中國引領(lǐng)下一代人工智能的原生應(yīng)用奠定了很好的基礎(chǔ)。基于啟明創(chuàng)投投資團(tuán)隊深度交流過的400余家AI創(chuàng)業(yè)企業(yè)的統(tǒng)計,與去年相比,多模態(tài)應(yīng)用的比例呈現(xiàn)上升趨勢,也出現(xiàn)了許多基于AI大模型技術(shù)的新的應(yīng)用類別,同時更多創(chuàng)業(yè)公司深耕某個垂直行業(yè)和場景,而基礎(chǔ)設(shè)施層的技術(shù)創(chuàng)業(yè)方向也更加多元化。此外他還分享了生成式AI創(chuàng)業(yè)企業(yè)的三個典型創(chuàng)始人畫像,包括AI科學(xué)家及科技巨頭AI研究負(fù)責(zé)人、產(chǎn)業(yè)專家及大型企業(yè)資深產(chǎn)品或運(yùn)營高管、以及新銳創(chuàng)業(yè)者及技術(shù)天才三類。
針對生成式AI應(yīng)用落地面臨的問題,周志峰指出:一,降低生成式AI實現(xiàn)普及所需的模型使用成本;二,提升大模型的效果;三,增強(qiáng)生成式AI應(yīng)用的用戶留存率。因為生成式AI應(yīng)用企業(yè)從0到1的成長時間比其他領(lǐng)域更長,需要同時克服TPF(技術(shù)-產(chǎn)品契合度)和 PMF(產(chǎn)品-市場契合度)兩大挑戰(zhàn),所以創(chuàng)始團(tuán)隊需要更大的耐心和決心,理解技術(shù)(技術(shù)的邊際)、理解產(chǎn)品(原生AI產(chǎn)品的新特點和新分發(fā)機(jī)制)、理解世界(全球化發(fā)展的機(jī)會)。
周志峰同時圍繞大語言模型、多模態(tài)模型、商業(yè)機(jī)會等做出2024生成式AI十大展望:
1. 當(dāng)前生成式AI的兩大核心技術(shù)GPT和擴(kuò)散模型將逐步融合,激發(fā)全新模型能力;
2. 高質(zhì)量數(shù)據(jù)的獲取和組織將顯著影響新一代模型,合成數(shù)據(jù)在預(yù)訓(xùn)練中的占比將大幅提升;
3. Multi-Agent技術(shù)將飛躍,通過優(yōu)化協(xié)作和分工顯著提升生成式AI效率和效果;
4. 將出現(xiàn)圖像和文本的統(tǒng)一連續(xù)表示,并且基于此的圖文聯(lián)合擴(kuò)散模型將達(dá)到GPT-4o級別能力;
5. 圖像和視頻隱空間表示的壓縮率提升五倍以上,從而使生成速度提升五倍以上;
6. 3年內(nèi)視頻生成將全面爆發(fā),結(jié)合3D能力,可控的視頻生成將對影視、動畫、短片的生產(chǎn)模式帶來變革;
7. 我們將見證壓縮更多模態(tài)信息的超級多模態(tài)大模型,如文本、圖像、語音、音樂、3D、傳感器數(shù)據(jù)(控制信號、眼動信號、手勢信息、雷達(dá)信號等);
8. 生成式AI打通了人類語言與機(jī)器語言的轉(zhuǎn)換通道,命令機(jī)器完成復(fù)雜任務(wù)的成本將顯著降低,帶來巨大的生產(chǎn)力變革;
9. 端側(cè)推理會有巨大增長,來自三個因素的疊加:推理優(yōu)化算法+端側(cè)推理芯片+端側(cè)大模型;
10. AI將在多個數(shù)字化水平較高的行業(yè)中占據(jù)主導(dǎo)地位,并將重塑絕大部分企業(yè)軟件。
在本次世界人工智能大會期間,階躍星辰首發(fā)了三款Step系列通用大模型新品,全面升級通用大模型底座能力。在此次論壇中,階躍星辰創(chuàng)始人、CEO姜大昕在主題為“攀登AGI的路徑與實踐:萬億參數(shù)+多模融合”的演講中指出,探索AGI路徑,“Scaling Law”和“多模態(tài)”是相輔相成、缺一不可的兩個方向,兩者齊頭并進(jìn),最終到達(dá)AGI。
階躍星辰創(chuàng)始人、CEO姜大昕
在姜大昕看來,Scaling Law目前依然奏效,模型性能仍然在隨著參數(shù)量、數(shù)據(jù)量和計算量的增加呈冪次方增長。階躍星辰在系統(tǒng)和算法上積極探索,最終走通了Step-2萬億參數(shù)MoE大模型訓(xùn)練的道路;同時,多模態(tài)是構(gòu)建世界模型的基礎(chǔ)能力,面對將理解和生成統(tǒng)一在一個模型里的挑戰(zhàn),階躍星辰已經(jīng)取得了一定進(jìn)展,其新升級的Step-1.5V千億參數(shù)多模態(tài)大模型性能大幅提升,具備更出色的視頻理解能力;新發(fā)布的Step-1X圖像生成大模型,則是階躍星辰首次推出多模態(tài)生成大模型。
可信大模型公司無限光年在大會的第一天也發(fā)布了光語大模型,灰盒可信,百億參數(shù)模型優(yōu)于超大規(guī)模模型GPT-4 Turbo。復(fù)旦大學(xué)浩清特聘教授、上海科學(xué)智能研究院院長、無限光年創(chuàng)始人漆遠(yuǎn)在《灰盒可信,釋放大模型生產(chǎn)力》演講中,從技術(shù)視角指出Scaling Law改變了人工智能,但并不會直接引領(lǐng)達(dá)到AGI,AGI的目標(biāo)是發(fā)現(xiàn)復(fù)雜世界的未知規(guī)律;但當(dāng)前大模型都高度依賴數(shù)據(jù),而未知規(guī)律可能缺乏海量數(shù)據(jù)支撐。在此次論壇上,漆遠(yuǎn)介紹了最高級人工智能的標(biāo)準(zhǔn)——結(jié)合了發(fā)現(xiàn)復(fù)雜世界未知規(guī)律和節(jié)省能量的智慧腦:AI愛因斯坦。
復(fù)旦大學(xué)浩清特聘教授、上??茖W(xué)智能研究院院長、無限光年創(chuàng)始人漆遠(yuǎn)
漆遠(yuǎn)分析,目前大模型主要是聯(lián)結(jié)學(xué)派的“黑盒”概率預(yù)測,如果將符號計算與大模型相結(jié)合,就能同時具備慢思考的“白盒”邏輯能力,兩種方法的融合是AGI發(fā)展的重要方向,實現(xiàn)“灰盒”可信;深度學(xué)習(xí)能實現(xiàn)數(shù)據(jù)擬合,且可以延展至數(shù)據(jù)沒有的地方,當(dāng)知識規(guī)則和關(guān)鍵數(shù)據(jù)矛盾時,能夠調(diào)整知識規(guī)則,擺脫數(shù)據(jù)依賴。他進(jìn)一步介紹,“灰盒”可以通過符號計算與神經(jīng)網(wǎng)絡(luò)的結(jié)合,應(yīng)對大模型的幻覺問題及垂直領(lǐng)域的專業(yè)問題。展望未來,他希望公司可以深耕場景,灰盒可信,并釋放大模型生產(chǎn)力,賦能千行百業(yè)。
訓(xùn)練和推理是大模型生命周期中不可或缺的兩個階段,都需要強(qiáng)大的算力資源來支撐。在2024年世界人工智能大會期間,無問芯穹發(fā)布全球首個支持單任務(wù)千卡規(guī)模異構(gòu)芯片混合訓(xùn)練平臺,為大模型行業(yè)提供了有力的算力基礎(chǔ)設(shè)施支撐。無問芯穹聯(lián)合創(chuàng)始人、CEO夏立雪在“構(gòu)建AI Native基礎(chǔ)設(shè)施”主題演講中表示,算力已然成為了AI發(fā)展和繼續(xù)發(fā)展的基石,而AI Native應(yīng)用落地所面臨的四個關(guān)鍵Infra問題包括:激活“沉睡芯片”并促進(jìn)異構(gòu)算力整合、提升多種計算卡大模型計算性能、為大規(guī)模訓(xùn)練集群穩(wěn)定訓(xùn)/推夯實基座以及更為高效地利用有限的端側(cè)計算資源。
無問芯穹聯(lián)合創(chuàng)始人、CEO夏立雪
針對多元芯片,無問芯穹致力于提供高效整合異構(gòu)算力資源的優(yōu)質(zhì)算力平臺、支持軟硬件聯(lián)合優(yōu)化與加速的中間件,以及好用的大模型應(yīng)用開發(fā)與服務(wù)工具,從而實現(xiàn)對異構(gòu)算力的全量利用,由此無問芯穹將異構(gòu)千卡混訓(xùn)能力集成到了無問芯穹Infini-AI云平臺中。夏立雪指出,無問芯穹希望通過算法創(chuàng)新、模型計算、算力平臺及硬件推理的優(yōu)化,持續(xù)降低大模型應(yīng)用的落地成本,讓更多人可以擁抱新技術(shù)。
生數(shù)科技聯(lián)合創(chuàng)始人、CTO鮑凡在“U-ViT:多模態(tài)大模型的變革與未來” 主題演講中,分享了公司在多模態(tài)大模型領(lǐng)域具備全棧自主研發(fā)能力,布局圖像、3D、視頻生成等多模態(tài)能力。此前,生數(shù)科技聯(lián)合清華大學(xué)正式發(fā)布中國首個長時長、高一致性、高動態(tài)性視頻大模型——Vidu,這是自Sora發(fā)布之后全球率先取得重大突破的視頻大模型,性能全面對標(biāo)國際頂尖水平。該模型采用團(tuán)隊原創(chuàng)的Diffusion與Transformer融合的架構(gòu)U-ViT。
生數(shù)科技聯(lián)合創(chuàng)始人、CTO鮑凡
在大會現(xiàn)場,鮑凡也介紹了U-ViT架構(gòu)的原理,并指出該架構(gòu)確保了最優(yōu)生成質(zhì)量、可控的計算開銷、參數(shù)規(guī)模擴(kuò)展性、具備涌現(xiàn)能力。作為首家將ViT架構(gòu)成功應(yīng)用于大模型訓(xùn)練的企業(yè),生數(shù)科技推出的多模態(tài)擴(kuò)散模型UniDiffuser在圖像生成過程中,能夠支持多元化風(fēng)格、具備“藝術(shù)級”美學(xué)水準(zhǔn),語義理解能力突出。公司還在視頻生成式大模型Vidu上取得進(jìn)展,支持音視頻合成和4D動畫生成,實現(xiàn)生成效果的不斷提升。
隨著人工智能和機(jī)器人技術(shù)的快速發(fā)展,傳感器、執(zhí)行器、計算能力和AI算法的持續(xù)進(jìn)步,具身智能成為學(xué)術(shù)界、產(chǎn)業(yè)界共同關(guān)注的熱點。從技術(shù)突破到產(chǎn)業(yè)落地,具身智能目前發(fā)展如何又將走向何方?在“具身智能:從技術(shù)突破到產(chǎn)業(yè)落地”專題環(huán)節(jié),啟明創(chuàng)投科技團(tuán)隊投資人周嘯飛擔(dān)任主持,與清華大學(xué)助理教授、星動紀(jì)元創(chuàng)始人陳建宇,上海交通大學(xué)教授、穹徹智能聯(lián)合創(chuàng)始人盧策吾,北京大學(xué)助理教授、北大-銀河通用聯(lián)合實驗室主任王鶴展開討論。
星動紀(jì)元是國內(nèi)領(lǐng)先的人形機(jī)器人公司,推出的產(chǎn)品星動一號也是世界上第一個登上長城的人形機(jī)器人。陳建宇認(rèn)為人形機(jī)器人會是通用機(jī)器人的終極形態(tài),不僅因為雙足與雙手的純?nèi)诵涡螒B(tài)與現(xiàn)有環(huán)境的兼容性更好,在訓(xùn)練數(shù)據(jù)獲取上也更容易從人類世界中進(jìn)行遷移。在技術(shù)范式上,端到端大腦小腦融合方案會是未來很重要的研究方向,僅僅用人類語言作為大小腦之間的傳輸界面效果有限,可以借鑒目前自動駕駛中的端到端聯(lián)合訓(xùn)練,物理層面數(shù)據(jù)直接反饋給圖文大模型將更好提升整體模型效果。
陳建宇認(rèn)為未來機(jī)器人有望在各類任務(wù)上都做到極致性能。在不久的將來也許可以設(shè)計一種機(jī)器人的圖靈測試,有一個機(jī)器人和人來進(jìn)行交互,背后可能是智能的自主控制也可能是人類遙操作,當(dāng)技術(shù)發(fā)展到很難分辨機(jī)器人的背后是人工智能還是人類遙操作時,可能便是機(jī)器人真正實現(xiàn)智能與通用的那一天。最后陳建宇對國內(nèi)發(fā)展具身智能的前景保持樂觀,認(rèn)為每個創(chuàng)業(yè)公司都應(yīng)該思考如何利用中國市場的優(yōu)勢,最大化撬動國內(nèi)供應(yīng)鏈的優(yōu)勢,打造具有全球化競爭力的硬件產(chǎn)品。
盧策吾是世界范圍內(nèi)第一位由機(jī)器人來給自己刮胡子的人類,展示了穹徹智能背后精密力控機(jī)械臂的先進(jìn)技術(shù)。盧策吾認(rèn)為具身智能的終局需要綜合考慮技術(shù)的迭代和商業(yè)的需求,具身智能作為承載硬件的軟件算法歡迎各種類型的機(jī)器人形態(tài)。對于具體的技術(shù)路徑,具身智能算法需要兩個核心要素,分別是能夠感知和理解世界的世界模型,以及具有強(qiáng)魯棒性的技能操作模型。其中在操作模型中力反饋機(jī)制十分重要,不僅是在圖像維度之外增加了一個交互維度,同時也可以減少對世界模型毫秒級別決策的依賴,穹徹智能在此次展會上展示的削黃瓜、疊衣服等技能都說明了操作模型具有魯棒性后可以大大拓展?jié)撛诘膽?yīng)用空間。
說起具身智能的未來,盧策吾認(rèn)為不久的將來我們可以看到一批又一批的操作技能的ChatGPT時刻,不斷豐富機(jī)器人的操作能力,逐漸讓機(jī)器人的商業(yè)飛輪不停轉(zhuǎn)起來。同時國內(nèi)的年輕學(xué)者也在不斷進(jìn)入具身智能行業(yè),具身智能領(lǐng)域的博士申請近年來非?;鸨?,中國的人才密度和潛力很大,未來國內(nèi)的頂尖高校和公司將會和同行在國際舞臺上同臺競技。
銀河通用前段時間發(fā)布了首代具有泛化性的具身大模型機(jī)器人,展示了通用機(jī)器人未來走進(jìn)千家萬戶的無限可能。王鶴認(rèn)為人形機(jī)器人是未來整個通用機(jī)器人市場的最大公約數(shù),但在邁向這個終極目標(biāo)的過程中需要每一步都有健康的商業(yè)模式讓機(jī)器人真正進(jìn)入場景,上半身擬人下半身底盤會是三年內(nèi)最可能落地的實際方案。在技術(shù)角度銀河通用非常關(guān)注小腦層面的技能控制模型如何實現(xiàn)足夠的泛化和通用,針對小腦技能,銀河通用自研合成了千萬級的場景數(shù)據(jù)及十億級的抓取數(shù)據(jù),在合成數(shù)據(jù)的訓(xùn)練下,銀河通用機(jī)器人目前已實現(xiàn)抓取隨機(jī)放置的透明、高光等物體的成功率在95%以上,并在此次WAIC展臺上展示了能夠抓取觀眾提供的任何物體的強(qiáng)大泛化性。在此基礎(chǔ)上,銀河通用正在逐步探索實現(xiàn)商業(yè)化。
王鶴認(rèn)為能落地的機(jī)器人需要足夠低的成本和足夠高的耐用性,這些都是需要技術(shù)公司不斷打磨硬件和供應(yīng)鏈能力,國內(nèi)的創(chuàng)業(yè)公司具有天然優(yōu)勢。在討論的最后,王鶴呼吁大家對具身智能在中國的發(fā)展抱有信心,一旦中國能夠量產(chǎn)人形機(jī)器人和達(dá)到具身智能的通用性,我們將以最可靠的供應(yīng)鏈和最全面的制造業(yè),大規(guī)模把人形通用機(jī)器人推向市場。整個行業(yè)需要資本的持續(xù)支持和人才的長期投入,具身智能通用機(jī)器人的未來也一定屬于中國。
大模型的突破為超級應(yīng)用的發(fā)展注入了強(qiáng)大的動力。伴隨生成式AI產(chǎn)業(yè)從超級模型轉(zhuǎn)向超級應(yīng)用,未來將會誕生哪些超級應(yīng)用,將會給人類的生活帶來哪些改變?在“超級應(yīng)用的新機(jī)遇:與模型突破互利共贏”AI應(yīng)用專題討論環(huán)節(jié),啟明創(chuàng)投科技團(tuán)隊投資人胡奇擔(dān)任主持,與智譜AI COO張帆,米粿AI創(chuàng)始人、CEO丁黎,無限光年COO朱劍雄,悉之智能創(chuàng)始人、CEO孫一喬,銜遠(yuǎn)科技首席算法科學(xué)家丁寧展開討論。
張帆介紹了智譜AI作為一家大模型公司,擁有自主知識產(chǎn)權(quán)的核心算法和完整的模型矩陣,涵蓋大語言模型、代碼模型和多模態(tài)模型等。張帆認(rèn)為,未來幾年內(nèi)可能出現(xiàn)顛覆性的超級應(yīng)用,但這些應(yīng)用往往難以預(yù)先設(shè)計,而是通過不斷迭代逐步出現(xiàn)。他強(qiáng)調(diào),大模型的核心在于提升人機(jī)交互的帶寬,從早期的鍵盤到如今的自然語言,大幅提升了交互能力,每次交互帶寬的提升都會重構(gòu)用戶需求和應(yīng)用方式。
關(guān)于智譜AI的獨特優(yōu)勢,張帆指出,大模型降低了AI應(yīng)用的成本和門檻,從而使AI從少數(shù)大廠專屬的高級能力,變成人人都可獲取的基礎(chǔ)生產(chǎn)要素。這種能力的普及激發(fā)了更多人的創(chuàng)造力,推動了產(chǎn)業(yè)和行業(yè)的變革。張帆還提到,智譜AI率先提出“Model as a Service”模型即服務(wù)的理念,使企業(yè)和開發(fā)者能夠通過MaaS平臺降低使用和訓(xùn)練模型的成本,更容易地探索和構(gòu)建超級應(yīng)用。智譜AI還通過開源和降價,推動了AI技術(shù)的普及和應(yīng)用深度的發(fā)展。
在談及AI驅(qū)動的超級應(yīng)用的未來時,張帆表達(dá)了樂觀態(tài)度,認(rèn)為盡管打造超級應(yīng)用不易,但AI時代將涌現(xiàn)出許多難以想象的應(yīng)用。這一過程需要算力、網(wǎng)絡(luò)、硬件水平和用戶習(xí)慣的提升,以及遵循從小規(guī)模應(yīng)用開始逐步發(fā)展的原則。張帆強(qiáng)調(diào),通過擁抱和利用現(xiàn)有的AI技術(shù),逐步改變現(xiàn)有的應(yīng)用和產(chǎn)品,未來必將迎來AI時代的超級應(yīng)用。
米粿AI致力于結(jié)合AI技術(shù)與內(nèi)容生產(chǎn),幫助創(chuàng)作者以更少的精力創(chuàng)作更好的作品,目標(biāo)是成為AI漫畫和動漫平臺的領(lǐng)軍者。團(tuán)隊由產(chǎn)學(xué)研結(jié)合的三位創(chuàng)始人組成,丁黎曾任職于網(wǎng)易、虎牙直播、嗶哩嗶哩等公司;技術(shù)合伙人牛力是上海交通大學(xué)的副教授,他在圖像編輯中的image composition領(lǐng)域,是國際上的開拓者和探路者;運(yùn)營合伙人陳達(dá)之有12年的投資經(jīng)驗,擅長動漫和二次元項目的投資。
丁黎認(rèn)為,未來幾年內(nèi),繪圖、漫畫和2D動畫等領(lǐng)域?qū)霈F(xiàn)顛覆性的超級應(yīng)用。他指出,韓國的Webtoon通過工業(yè)化和流程化的方式成功實現(xiàn)高頻更新,提升了用戶體驗。米粿AI通過AI技術(shù)有望實現(xiàn)漫畫的高效生產(chǎn),使得更新頻率大幅提高,改變用戶從付費(fèi)到免費(fèi)的消費(fèi)模式,推動漫畫行業(yè)像短劇一樣高頻更新,提升用戶體驗和行業(yè)效率。
關(guān)于商業(yè)模式,丁黎表示,AI技術(shù)降低了內(nèi)容創(chuàng)作門檻,使創(chuàng)作者集中在劇本、大綱和創(chuàng)意上,由AI完成繁瑣的繪畫過程,提高創(chuàng)作效率,使更多有創(chuàng)意的人加入文創(chuàng)行業(yè)。米粿AI的技術(shù)已將繪畫速度提升至原來的10倍以上,使漫畫創(chuàng)作更加高效和低成本。
在談到挑戰(zhàn)時,丁黎強(qiáng)調(diào),與行業(yè)從業(yè)者形成友好生態(tài)系統(tǒng)非常重要,AI應(yīng)作為提升產(chǎn)能和效率的工具,而非完全替代人類。當(dāng)前AI創(chuàng)業(yè)需要高資本和高技術(shù)門檻,團(tuán)隊需團(tuán)結(jié)合作,共同應(yīng)對挑戰(zhàn),才能在激烈的市場競爭中脫穎而出。
朱劍雄在圓桌對話中分享了他對未來超級應(yīng)用的看法和公司戰(zhàn)略。他認(rèn)為,未來幾年內(nèi),超級應(yīng)用將在多個領(lǐng)域涌現(xiàn)。當(dāng)前,AI大模型技術(shù)的接受度廣泛,且使用成本下降,推動了眾多企業(yè)和創(chuàng)業(yè)公司積極探索這一領(lǐng)域。朱劍雄指出,從PC互聯(lián)網(wǎng)時代到移動互聯(lián)網(wǎng)時代,流量入口的轉(zhuǎn)變提供了參考,大模型時代也會出現(xiàn)類似的趨勢,場景服務(wù)能力深厚的公司可能會成長為超級應(yīng)用。
在談到可信大模型與超級應(yīng)用的關(guān)系時,朱劍雄提到大模型技術(shù)存在“不可能的鐵三角”,即通用性、專業(yè)性和經(jīng)濟(jì)性。他強(qiáng)調(diào),無限光年選擇在專業(yè)性上深耕,構(gòu)建行業(yè)知識內(nèi)容的垂直大模型,通過神經(jīng)符號計算技術(shù),確保模型輸出的可靠性,并已在金融和醫(yī)療領(lǐng)域推出了具體的產(chǎn)品,如投研寫作助手和體檢報告寫作助手。這些產(chǎn)品顯著提升了工作效率,受到了用戶的高度認(rèn)可。
在探討AI驅(qū)動創(chuàng)新應(yīng)用的挑戰(zhàn)時,朱劍雄指出,產(chǎn)品經(jīng)理的角色和要求發(fā)生了變化。現(xiàn)在的產(chǎn)品經(jīng)理不僅要定義場景和需求,還需將這些信息傳遞給大模型,進(jìn)行評測和驗證。他認(rèn)為,既懂模型又懂客戶的產(chǎn)品經(jīng)理目前市場上較為稀缺,但隨著時間推移,這一問題將逐漸得到改善。
悉之智能專注于AI教育,特別是AI教學(xué)解題。孫一喬在清華大學(xué)本科期間創(chuàng)立了這家公司,認(rèn)為純統(tǒng)計模型在邏輯性和魯棒性上存在不足。孫一喬打比方稱,GPT-4駕駛宇宙飛船是不可靠的,但通過構(gòu)建包含人類知識的白盒體系,可以顯著提高大模型的能力。
孫一喬介紹,悉之智能通過構(gòu)建完整的數(shù)學(xué)等學(xué)科知識體系,大幅提升模型推理能力,其數(shù)學(xué)解題能力顯著高于GPT-4o,現(xiàn)有產(chǎn)品在美國有近200萬用戶,年收入接近百萬美元,并與新東方等國內(nèi)巨頭合作開發(fā)大模型。
孫一喬認(rèn)為,未來超級應(yīng)用應(yīng)從需求出發(fā),垂直解決問題,教育是很有潛力的領(lǐng)域。他強(qiáng)調(diào),教育領(lǐng)域頻次高、需求剛性,是容易出現(xiàn)AI超級應(yīng)用的領(lǐng)域,通過提升教學(xué)效率和學(xué)生的學(xué)習(xí)意愿,創(chuàng)造巨大價值。
提升大模型數(shù)學(xué)能力方面,孫一喬提到OpenAI的Qstar項目及其強(qiáng)化學(xué)習(xí)方法,認(rèn)為通過逐步優(yōu)化數(shù)學(xué)解題步驟,可以顯著提升大模型的邏輯推理能力。悉之智能采用類似方法,結(jié)合完整的數(shù)學(xué)知識體系,逐步教大模型解題,以提高其能力。
在AI解題領(lǐng)域,孫一喬指出,專業(yè)AI能力與大模型結(jié)合的關(guān)鍵在于生態(tài)系統(tǒng)的改進(jìn)。悉之智能致力于通過合作共贏的方式改進(jìn)生態(tài)。垂直領(lǐng)域應(yīng)用需要大量微調(diào)和強(qiáng)化學(xué)習(xí),并希望未來生態(tài)系統(tǒng)能更高效合作,共同提升基座模型的能力。
丁寧在圓桌對話中展示了其獨特的理工科視角和深厚的技術(shù)背景。他介紹了銜遠(yuǎn)科技的戰(zhàn)略,即模用一體、通專結(jié)合,強(qiáng)調(diào)了在技術(shù)泛化基礎(chǔ)上提升專業(yè)性的理念。
在討論顛覆性超級應(yīng)用時,丁寧提到大模型在處理各種信息序列(如文字、視頻、DNA等)方面的潛力。他提出了兩個關(guān)鍵維度:成功時的收益和失敗時的損失,指出在一些場景下可以尋找成功收益大而失敗損失小的機(jī)會,例如科學(xué)發(fā)現(xiàn)和廣告營銷。他強(qiáng)調(diào)了通用模型的專業(yè)化,通過最低成本實現(xiàn)目標(biāo)任務(wù)來創(chuàng)造價值。
針對大模型技術(shù)的提升問題,丁寧指出大模型在處理輸入和輸出序列時的挑戰(zhàn),特別是在負(fù)信號比例高的場景下學(xué)習(xí)的難度。他強(qiáng)調(diào)快速高效地將通用模型專業(yè)化的能力,并討論了獎勵模型(Reward Model)在提升模型性能中的應(yīng)用,強(qiáng)調(diào)了低成本、高效率的重要性。
在談及生成式AI驅(qū)動超級應(yīng)用的挑戰(zhàn)時,丁寧分享了兩個慣性陷阱:資源慣性和技術(shù)慣性,并強(qiáng)調(diào)保持開放心態(tài)的重要性。他還提到數(shù)據(jù)缺失問題,特別是負(fù)信號比例高的場景缺乏高質(zhì)量數(shù)據(jù),指出這是未來的一個關(guān)鍵挑戰(zhàn)。