7月6日,由啟明創(chuàng)投主辦的2024世界人工智能大會(huì)(WAIC)“啟明創(chuàng)投·創(chuàng)業(yè)與投資論壇——超級(jí)模型、超級(jí)應(yīng)用、超級(jí)機(jī)遇”在上海世博中心紅廳成功舉辦。大語(yǔ)言模型、多模態(tài)模型、具身智能和生成式AI應(yīng)用領(lǐng)域的著名專(zhuān)家與學(xué)者,頂尖投資人和領(lǐng)軍創(chuàng)業(yè)者匯聚一堂,圍繞生成式AI基礎(chǔ)技術(shù)進(jìn)展、商業(yè)應(yīng)用前景和創(chuàng)業(yè)投資生態(tài)等主題展開(kāi)分享與交流。
作為中國(guó)在AI領(lǐng)域最早投資且布局最豐富的投資機(jī)構(gòu),這是啟明創(chuàng)投連續(xù)第二年主辦該論壇,也是本屆世界人工智能大會(huì)唯一一場(chǎng)由創(chuàng)業(yè)投資機(jī)構(gòu)發(fā)起的、旨在從創(chuàng)新視角展示和探討生成式AI的分論壇。
啟明創(chuàng)投從2013年開(kāi)始系統(tǒng)性布局人工智能領(lǐng)域,從AI 1.0到AI 2.0,經(jīng)過(guò)十余年的深耕與前沿洞察,啟明創(chuàng)投在AI領(lǐng)域投資了眾多項(xiàng)目,多家已上市或成長(zhǎng)為獨(dú)角獸企業(yè)。
啟明創(chuàng)投主管合伙人周志峰在以“技術(shù)突破到應(yīng)用變革-AI發(fā)展的新篇章”為主題的開(kāi)幕演講中介紹道,啟明創(chuàng)投在人工智能領(lǐng)域的投資策略已經(jīng)發(fā)生演變,從將人工智能視為一個(gè)技術(shù)或一個(gè)垂直領(lǐng)域去進(jìn)行投資,轉(zhuǎn)變?yōu)閷⑵湟暈榛A(chǔ)能力、去尋找其在千行百業(yè)落地的巨大潛力。
啟明創(chuàng)投主管合伙人周志峰
相較于互聯(lián)網(wǎng)浪潮中應(yīng)用的落地時(shí)間點(diǎn),周志峰預(yù)測(cè)在當(dāng)前的AI浪潮中,應(yīng)用的爆發(fā)將會(huì)顯著提前。目前,生成式AI在三個(gè)“C領(lǐng)域”——Copilot(生產(chǎn)力工具)、Creativity(創(chuàng)意)、Companionship(陪伴)獲得了大量用戶(hù)的青睞,呈現(xiàn)出類(lèi)似互聯(lián)網(wǎng)應(yīng)用的發(fā)展軌跡,正在經(jīng)歷從用來(lái)提高效率(Save Time)的應(yīng)用向旨在獲得愉悅(Kill Time)的應(yīng)用的轉(zhuǎn)變。他指出,互聯(lián)網(wǎng)是把信息分發(fā)的邊際成本幾乎降為零,生成式AI的核心是把數(shù)字化內(nèi)容的創(chuàng)造邊際成本幾乎降為零,由此看來(lái)AI技術(shù)一定會(huì)釋放巨大的價(jià)值。
周志峰指出中國(guó)巨大的市場(chǎng)、優(yōu)秀的技術(shù)能力及人才儲(chǔ)備、過(guò)去20年培養(yǎng)和積累的卓越的創(chuàng)造應(yīng)用的經(jīng)驗(yàn)及能力,為中國(guó)引領(lǐng)下一代人工智能的原生應(yīng)用奠定了很好的基礎(chǔ)。基于啟明創(chuàng)投投資團(tuán)隊(duì)深度交流過(guò)的400余家AI創(chuàng)業(yè)企業(yè)的統(tǒng)計(jì),與去年相比,多模態(tài)應(yīng)用的比例呈現(xiàn)上升趨勢(shì),也出現(xiàn)了許多基于AI大模型技術(shù)的新的應(yīng)用類(lèi)別,同時(shí)更多創(chuàng)業(yè)公司深耕某個(gè)垂直行業(yè)和場(chǎng)景,而基礎(chǔ)設(shè)施層的技術(shù)創(chuàng)業(yè)方向也更加多元化。此外他還分享了生成式AI創(chuàng)業(yè)企業(yè)的三個(gè)典型創(chuàng)始人畫(huà)像,包括AI科學(xué)家及科技巨頭AI研究負(fù)責(zé)人、產(chǎn)業(yè)專(zhuān)家及大型企業(yè)資深產(chǎn)品或運(yùn)營(yíng)高管、以及新銳創(chuàng)業(yè)者及技術(shù)天才三類(lèi)。
針對(duì)生成式AI應(yīng)用落地面臨的問(wèn)題,周志峰指出:一,降低生成式AI實(shí)現(xiàn)普及所需的模型使用成本;二,提升大模型的效果;三,增強(qiáng)生成式AI應(yīng)用的用戶(hù)留存率。因?yàn)樯墒紸I應(yīng)用企業(yè)從0到1的成長(zhǎng)時(shí)間比其他領(lǐng)域更長(zhǎng),需要同時(shí)克服TPF(技術(shù)-產(chǎn)品契合度)和 PMF(產(chǎn)品-市場(chǎng)契合度)兩大挑戰(zhàn),所以創(chuàng)始團(tuán)隊(duì)需要更大的耐心和決心,理解技術(shù)(技術(shù)的邊際)、理解產(chǎn)品(原生AI產(chǎn)品的新特點(diǎn)和新分發(fā)機(jī)制)、理解世界(全球化發(fā)展的機(jī)會(huì))。
周志峰同時(shí)圍繞大語(yǔ)言模型、多模態(tài)模型、商業(yè)機(jī)會(huì)等做出2024生成式AI十大展望:
1. 當(dāng)前生成式AI的兩大核心技術(shù)GPT和擴(kuò)散模型將逐步融合,激發(fā)全新模型能力;
2. 高質(zhì)量數(shù)據(jù)的獲取和組織將顯著影響新一代模型,合成數(shù)據(jù)在預(yù)訓(xùn)練中的占比將大幅提升;
3. Multi-Agent技術(shù)將飛躍,通過(guò)優(yōu)化協(xié)作和分工顯著提升生成式AI效率和效果;
4. 將出現(xiàn)圖像和文本的統(tǒng)一連續(xù)表示,并且基于此的圖文聯(lián)合擴(kuò)散模型將達(dá)到GPT-4o級(jí)別能力;
5. 圖像和視頻隱空間表示的壓縮率提升五倍以上,從而使生成速度提升五倍以上;
6. 3年內(nèi)視頻生成將全面爆發(fā),結(jié)合3D能力,可控的視頻生成將對(duì)影視、動(dòng)畫(huà)、短片的生產(chǎn)模式帶來(lái)變革;
7. 我們將見(jiàn)證壓縮更多模態(tài)信息的超級(jí)多模態(tài)大模型,如文本、圖像、語(yǔ)音、音樂(lè)、3D、傳感器數(shù)據(jù)(控制信號(hào)、眼動(dòng)信號(hào)、手勢(shì)信息、雷達(dá)信號(hào)等);
8. 生成式AI打通了人類(lèi)語(yǔ)言與機(jī)器語(yǔ)言的轉(zhuǎn)換通道,命令機(jī)器完成復(fù)雜任務(wù)的成本將顯著降低,帶來(lái)巨大的生產(chǎn)力變革;
9. 端側(cè)推理會(huì)有巨大增長(zhǎng),來(lái)自三個(gè)因素的疊加:推理優(yōu)化算法+端側(cè)推理芯片+端側(cè)大模型;
10. AI將在多個(gè)數(shù)字化水平較高的行業(yè)中占據(jù)主導(dǎo)地位,并將重塑絕大部分企業(yè)軟件。
在本次世界人工智能大會(huì)期間,階躍星辰首發(fā)了三款Step系列通用大模型新品,全面升級(jí)通用大模型底座能力。在此次論壇中,階躍星辰創(chuàng)始人、CEO姜大昕在主題為“攀登AGI的路徑與實(shí)踐:萬(wàn)億參數(shù)+多模融合”的演講中指出,探索AGI路徑,“Scaling Law”和“多模態(tài)”是相輔相成、缺一不可的兩個(gè)方向,兩者齊頭并進(jìn),最終到達(dá)AGI。
階躍星辰創(chuàng)始人、CEO姜大昕
在姜大昕看來(lái),Scaling Law目前依然奏效,模型性能仍然在隨著參數(shù)量、數(shù)據(jù)量和計(jì)算量的增加呈冪次方增長(zhǎng)。階躍星辰在系統(tǒng)和算法上積極探索,最終走通了Step-2萬(wàn)億參數(shù)MoE大模型訓(xùn)練的道路;同時(shí),多模態(tài)是構(gòu)建世界模型的基礎(chǔ)能力,面對(duì)將理解和生成統(tǒng)一在一個(gè)模型里的挑戰(zhàn),階躍星辰已經(jīng)取得了一定進(jìn)展,其新升級(jí)的Step-1.5V千億參數(shù)多模態(tài)大模型性能大幅提升,具備更出色的視頻理解能力;新發(fā)布的Step-1X圖像生成大模型,則是階躍星辰首次推出多模態(tài)生成大模型。
可信大模型公司無(wú)限光年在大會(huì)的第一天也發(fā)布了光語(yǔ)大模型,灰盒可信,百億參數(shù)模型優(yōu)于超大規(guī)模模型GPT-4 Turbo。復(fù)旦大學(xué)浩清特聘教授、上海科學(xué)智能研究院院長(zhǎng)、無(wú)限光年創(chuàng)始人漆遠(yuǎn)在《灰盒可信,釋放大模型生產(chǎn)力》演講中,從技術(shù)視角指出Scaling Law改變了人工智能,但并不會(huì)直接引領(lǐng)達(dá)到AGI,AGI的目標(biāo)是發(fā)現(xiàn)復(fù)雜世界的未知規(guī)律;但當(dāng)前大模型都高度依賴(lài)數(shù)據(jù),而未知規(guī)律可能缺乏海量數(shù)據(jù)支撐。在此次論壇上,漆遠(yuǎn)介紹了最高級(jí)人工智能的標(biāo)準(zhǔn)——結(jié)合了發(fā)現(xiàn)復(fù)雜世界未知規(guī)律和節(jié)省能量的智慧腦:AI愛(ài)因斯坦。
復(fù)旦大學(xué)浩清特聘教授、上??茖W(xué)智能研究院院長(zhǎng)、無(wú)限光年創(chuàng)始人漆遠(yuǎn)
漆遠(yuǎn)分析,目前大模型主要是聯(lián)結(jié)學(xué)派的“黑盒”概率預(yù)測(cè),如果將符號(hào)計(jì)算與大模型相結(jié)合,就能同時(shí)具備慢思考的“白盒”邏輯能力,兩種方法的融合是AGI發(fā)展的重要方向,實(shí)現(xiàn)“灰盒”可信;深度學(xué)習(xí)能實(shí)現(xiàn)數(shù)據(jù)擬合,且可以延展至數(shù)據(jù)沒(méi)有的地方,當(dāng)知識(shí)規(guī)則和關(guān)鍵數(shù)據(jù)矛盾時(shí),能夠調(diào)整知識(shí)規(guī)則,擺脫數(shù)據(jù)依賴(lài)。他進(jìn)一步介紹,“灰盒”可以通過(guò)符號(hào)計(jì)算與神經(jīng)網(wǎng)絡(luò)的結(jié)合,應(yīng)對(duì)大模型的幻覺(jué)問(wèn)題及垂直領(lǐng)域的專(zhuān)業(yè)問(wèn)題。展望未來(lái),他希望公司可以深耕場(chǎng)景,灰盒可信,并釋放大模型生產(chǎn)力,賦能千行百業(yè)。
訓(xùn)練和推理是大模型生命周期中不可或缺的兩個(gè)階段,都需要強(qiáng)大的算力資源來(lái)支撐。在2024年世界人工智能大會(huì)期間,無(wú)問(wèn)芯穹發(fā)布全球首個(gè)支持單任務(wù)千卡規(guī)模異構(gòu)芯片混合訓(xùn)練平臺(tái),為大模型行業(yè)提供了有力的算力基礎(chǔ)設(shè)施支撐。無(wú)問(wèn)芯穹聯(lián)合創(chuàng)始人、CEO夏立雪在“構(gòu)建AI Native基礎(chǔ)設(shè)施”主題演講中表示,算力已然成為了AI發(fā)展和繼續(xù)發(fā)展的基石,而AI Native應(yīng)用落地所面臨的四個(gè)關(guān)鍵Infra問(wèn)題包括:激活“沉睡芯片”并促進(jìn)異構(gòu)算力整合、提升多種計(jì)算卡大模型計(jì)算性能、為大規(guī)模訓(xùn)練集群穩(wěn)定訓(xùn)/推夯實(shí)基座以及更為高效地利用有限的端側(cè)計(jì)算資源。
無(wú)問(wèn)芯穹聯(lián)合創(chuàng)始人、CEO夏立雪
針對(duì)多元芯片,無(wú)問(wèn)芯穹致力于提供高效整合異構(gòu)算力資源的優(yōu)質(zhì)算力平臺(tái)、支持軟硬件聯(lián)合優(yōu)化與加速的中間件,以及好用的大模型應(yīng)用開(kāi)發(fā)與服務(wù)工具,從而實(shí)現(xiàn)對(duì)異構(gòu)算力的全量利用,由此無(wú)問(wèn)芯穹將異構(gòu)千卡混訓(xùn)能力集成到了無(wú)問(wèn)芯穹Infini-AI云平臺(tái)中。夏立雪指出,無(wú)問(wèn)芯穹希望通過(guò)算法創(chuàng)新、模型計(jì)算、算力平臺(tái)及硬件推理的優(yōu)化,持續(xù)降低大模型應(yīng)用的落地成本,讓更多人可以擁抱新技術(shù)。
生數(shù)科技聯(lián)合創(chuàng)始人、CTO鮑凡在“U-ViT:多模態(tài)大模型的變革與未來(lái)” 主題演講中,分享了公司在多模態(tài)大模型領(lǐng)域具備全棧自主研發(fā)能力,布局圖像、3D、視頻生成等多模態(tài)能力。此前,生數(shù)科技聯(lián)合清華大學(xué)正式發(fā)布中國(guó)首個(gè)長(zhǎng)時(shí)長(zhǎng)、高一致性、高動(dòng)態(tài)性視頻大模型——Vidu,這是自Sora發(fā)布之后全球率先取得重大突破的視頻大模型,性能全面對(duì)標(biāo)國(guó)際頂尖水平。該模型采用團(tuán)隊(duì)原創(chuàng)的Diffusion與Transformer融合的架構(gòu)U-ViT。
生數(shù)科技聯(lián)合創(chuàng)始人、CTO鮑凡
在大會(huì)現(xiàn)場(chǎng),鮑凡也介紹了U-ViT架構(gòu)的原理,并指出該架構(gòu)確保了最優(yōu)生成質(zhì)量、可控的計(jì)算開(kāi)銷(xiāo)、參數(shù)規(guī)模擴(kuò)展性、具備涌現(xiàn)能力。作為首家將ViT架構(gòu)成功應(yīng)用于大模型訓(xùn)練的企業(yè),生數(shù)科技推出的多模態(tài)擴(kuò)散模型UniDiffuser在圖像生成過(guò)程中,能夠支持多元化風(fēng)格、具備“藝術(shù)級(jí)”美學(xué)水準(zhǔn),語(yǔ)義理解能力突出。公司還在視頻生成式大模型Vidu上取得進(jìn)展,支持音視頻合成和4D動(dòng)畫(huà)生成,實(shí)現(xiàn)生成效果的不斷提升。
隨著人工智能和機(jī)器人技術(shù)的快速發(fā)展,傳感器、執(zhí)行器、計(jì)算能力和AI算法的持續(xù)進(jìn)步,具身智能成為學(xué)術(shù)界、產(chǎn)業(yè)界共同關(guān)注的熱點(diǎn)。從技術(shù)突破到產(chǎn)業(yè)落地,具身智能目前發(fā)展如何又將走向何方?在“具身智能:從技術(shù)突破到產(chǎn)業(yè)落地”專(zhuān)題環(huán)節(jié),啟明創(chuàng)投科技團(tuán)隊(duì)投資人周?chē)[飛擔(dān)任主持,與清華大學(xué)助理教授、星動(dòng)紀(jì)元?jiǎng)?chuàng)始人陳建宇,上海交通大學(xué)教授、穹徹智能聯(lián)合創(chuàng)始人盧策吾,北京大學(xué)助理教授、北大-銀河通用聯(lián)合實(shí)驗(yàn)室主任王鶴展開(kāi)討論。
星動(dòng)紀(jì)元是國(guó)內(nèi)領(lǐng)先的人形機(jī)器人公司,推出的產(chǎn)品星動(dòng)一號(hào)也是世界上第一個(gè)登上長(zhǎng)城的人形機(jī)器人。陳建宇認(rèn)為人形機(jī)器人會(huì)是通用機(jī)器人的終極形態(tài),不僅因?yàn)殡p足與雙手的純?nèi)诵涡螒B(tài)與現(xiàn)有環(huán)境的兼容性更好,在訓(xùn)練數(shù)據(jù)獲取上也更容易從人類(lèi)世界中進(jìn)行遷移。在技術(shù)范式上,端到端大腦小腦融合方案會(huì)是未來(lái)很重要的研究方向,僅僅用人類(lèi)語(yǔ)言作為大小腦之間的傳輸界面效果有限,可以借鑒目前自動(dòng)駕駛中的端到端聯(lián)合訓(xùn)練,物理層面數(shù)據(jù)直接反饋給圖文大模型將更好提升整體模型效果。
陳建宇認(rèn)為未來(lái)機(jī)器人有望在各類(lèi)任務(wù)上都做到極致性能。在不久的將來(lái)也許可以設(shè)計(jì)一種機(jī)器人的圖靈測(cè)試,有一個(gè)機(jī)器人和人來(lái)進(jìn)行交互,背后可能是智能的自主控制也可能是人類(lèi)遙操作,當(dāng)技術(shù)發(fā)展到很難分辨機(jī)器人的背后是人工智能還是人類(lèi)遙操作時(shí),可能便是機(jī)器人真正實(shí)現(xiàn)智能與通用的那一天。最后陳建宇對(duì)國(guó)內(nèi)發(fā)展具身智能的前景保持樂(lè)觀(guān),認(rèn)為每個(gè)創(chuàng)業(yè)公司都應(yīng)該思考如何利用中國(guó)市場(chǎng)的優(yōu)勢(shì),最大化撬動(dòng)國(guó)內(nèi)供應(yīng)鏈的優(yōu)勢(shì),打造具有全球化競(jìng)爭(zhēng)力的硬件產(chǎn)品。
盧策吾是世界范圍內(nèi)第一位由機(jī)器人來(lái)給自己刮胡子的人類(lèi),展示了穹徹智能背后精密力控機(jī)械臂的先進(jìn)技術(shù)。盧策吾認(rèn)為具身智能的終局需要綜合考慮技術(shù)的迭代和商業(yè)的需求,具身智能作為承載硬件的軟件算法歡迎各種類(lèi)型的機(jī)器人形態(tài)。對(duì)于具體的技術(shù)路徑,具身智能算法需要兩個(gè)核心要素,分別是能夠感知和理解世界的世界模型,以及具有強(qiáng)魯棒性的技能操作模型。其中在操作模型中力反饋機(jī)制十分重要,不僅是在圖像維度之外增加了一個(gè)交互維度,同時(shí)也可以減少對(duì)世界模型毫秒級(jí)別決策的依賴(lài),穹徹智能在此次展會(huì)上展示的削黃瓜、疊衣服等技能都說(shuō)明了操作模型具有魯棒性后可以大大拓展?jié)撛诘膽?yīng)用空間。
說(shuō)起具身智能的未來(lái),盧策吾認(rèn)為不久的將來(lái)我們可以看到一批又一批的操作技能的ChatGPT時(shí)刻,不斷豐富機(jī)器人的操作能力,逐漸讓機(jī)器人的商業(yè)飛輪不停轉(zhuǎn)起來(lái)。同時(shí)國(guó)內(nèi)的年輕學(xué)者也在不斷進(jìn)入具身智能行業(yè),具身智能領(lǐng)域的博士申請(qǐng)近年來(lái)非?;鸨袊?guó)的人才密度和潛力很大,未來(lái)國(guó)內(nèi)的頂尖高校和公司將會(huì)和同行在國(guó)際舞臺(tái)上同臺(tái)競(jìng)技。
銀河通用前段時(shí)間發(fā)布了首代具有泛化性的具身大模型機(jī)器人,展示了通用機(jī)器人未來(lái)走進(jìn)千家萬(wàn)戶(hù)的無(wú)限可能。王鶴認(rèn)為人形機(jī)器人是未來(lái)整個(gè)通用機(jī)器人市場(chǎng)的最大公約數(shù),但在邁向這個(gè)終極目標(biāo)的過(guò)程中需要每一步都有健康的商業(yè)模式讓機(jī)器人真正進(jìn)入場(chǎng)景,上半身擬人下半身底盤(pán)會(huì)是三年內(nèi)最可能落地的實(shí)際方案。在技術(shù)角度銀河通用非常關(guān)注小腦層面的技能控制模型如何實(shí)現(xiàn)足夠的泛化和通用,針對(duì)小腦技能,銀河通用自研合成了千萬(wàn)級(jí)的場(chǎng)景數(shù)據(jù)及十億級(jí)的抓取數(shù)據(jù),在合成數(shù)據(jù)的訓(xùn)練下,銀河通用機(jī)器人目前已實(shí)現(xiàn)抓取隨機(jī)放置的透明、高光等物體的成功率在95%以上,并在此次WAIC展臺(tái)上展示了能夠抓取觀(guān)眾提供的任何物體的強(qiáng)大泛化性。在此基礎(chǔ)上,銀河通用正在逐步探索實(shí)現(xiàn)商業(yè)化。
王鶴認(rèn)為能落地的機(jī)器人需要足夠低的成本和足夠高的耐用性,這些都是需要技術(shù)公司不斷打磨硬件和供應(yīng)鏈能力,國(guó)內(nèi)的創(chuàng)業(yè)公司具有天然優(yōu)勢(shì)。在討論的最后,王鶴呼吁大家對(duì)具身智能在中國(guó)的發(fā)展抱有信心,一旦中國(guó)能夠量產(chǎn)人形機(jī)器人和達(dá)到具身智能的通用性,我們將以最可靠的供應(yīng)鏈和最全面的制造業(yè),大規(guī)模把人形通用機(jī)器人推向市場(chǎng)。整個(gè)行業(yè)需要資本的持續(xù)支持和人才的長(zhǎng)期投入,具身智能通用機(jī)器人的未來(lái)也一定屬于中國(guó)。
大模型的突破為超級(jí)應(yīng)用的發(fā)展注入了強(qiáng)大的動(dòng)力。伴隨生成式AI產(chǎn)業(yè)從超級(jí)模型轉(zhuǎn)向超級(jí)應(yīng)用,未來(lái)將會(huì)誕生哪些超級(jí)應(yīng)用,將會(huì)給人類(lèi)的生活帶來(lái)哪些改變?在“超級(jí)應(yīng)用的新機(jī)遇:與模型突破互利共贏”AI應(yīng)用專(zhuān)題討論環(huán)節(jié),啟明創(chuàng)投科技團(tuán)隊(duì)投資人胡奇擔(dān)任主持,與智譜AI COO張帆,米粿AI創(chuàng)始人、CEO丁黎,無(wú)限光年COO朱劍雄,悉之智能創(chuàng)始人、CEO孫一喬,銜遠(yuǎn)科技首席算法科學(xué)家丁寧展開(kāi)討論。
張帆介紹了智譜AI作為一家大模型公司,擁有自主知識(shí)產(chǎn)權(quán)的核心算法和完整的模型矩陣,涵蓋大語(yǔ)言模型、代碼模型和多模態(tài)模型等。張帆認(rèn)為,未來(lái)幾年內(nèi)可能出現(xiàn)顛覆性的超級(jí)應(yīng)用,但這些應(yīng)用往往難以預(yù)先設(shè)計(jì),而是通過(guò)不斷迭代逐步出現(xiàn)。他強(qiáng)調(diào),大模型的核心在于提升人機(jī)交互的帶寬,從早期的鍵盤(pán)到如今的自然語(yǔ)言,大幅提升了交互能力,每次交互帶寬的提升都會(huì)重構(gòu)用戶(hù)需求和應(yīng)用方式。
關(guān)于智譜AI的獨(dú)特優(yōu)勢(shì),張帆指出,大模型降低了AI應(yīng)用的成本和門(mén)檻,從而使AI從少數(shù)大廠(chǎng)專(zhuān)屬的高級(jí)能力,變成人人都可獲取的基礎(chǔ)生產(chǎn)要素。這種能力的普及激發(fā)了更多人的創(chuàng)造力,推動(dòng)了產(chǎn)業(yè)和行業(yè)的變革。張帆還提到,智譜AI率先提出“Model as a Service”模型即服務(wù)的理念,使企業(yè)和開(kāi)發(fā)者能夠通過(guò)MaaS平臺(tái)降低使用和訓(xùn)練模型的成本,更容易地探索和構(gòu)建超級(jí)應(yīng)用。智譜AI還通過(guò)開(kāi)源和降價(jià),推動(dòng)了AI技術(shù)的普及和應(yīng)用深度的發(fā)展。
在談及AI驅(qū)動(dòng)的超級(jí)應(yīng)用的未來(lái)時(shí),張帆表達(dá)了樂(lè)觀(guān)態(tài)度,認(rèn)為盡管打造超級(jí)應(yīng)用不易,但AI時(shí)代將涌現(xiàn)出許多難以想象的應(yīng)用。這一過(guò)程需要算力、網(wǎng)絡(luò)、硬件水平和用戶(hù)習(xí)慣的提升,以及遵循從小規(guī)模應(yīng)用開(kāi)始逐步發(fā)展的原則。張帆強(qiáng)調(diào),通過(guò)擁抱和利用現(xiàn)有的AI技術(shù),逐步改變現(xiàn)有的應(yīng)用和產(chǎn)品,未來(lái)必將迎來(lái)AI時(shí)代的超級(jí)應(yīng)用。
米粿AI致力于結(jié)合AI技術(shù)與內(nèi)容生產(chǎn),幫助創(chuàng)作者以更少的精力創(chuàng)作更好的作品,目標(biāo)是成為AI漫畫(huà)和動(dòng)漫平臺(tái)的領(lǐng)軍者。團(tuán)隊(duì)由產(chǎn)學(xué)研結(jié)合的三位創(chuàng)始人組成,丁黎曾任職于網(wǎng)易、虎牙直播、嗶哩嗶哩等公司;技術(shù)合伙人牛力是上海交通大學(xué)的副教授,他在圖像編輯中的image composition領(lǐng)域,是國(guó)際上的開(kāi)拓者和探路者;運(yùn)營(yíng)合伙人陳達(dá)之有12年的投資經(jīng)驗(yàn),擅長(zhǎng)動(dòng)漫和二次元項(xiàng)目的投資。
丁黎認(rèn)為,未來(lái)幾年內(nèi),繪圖、漫畫(huà)和2D動(dòng)畫(huà)等領(lǐng)域?qū)?huì)出現(xiàn)顛覆性的超級(jí)應(yīng)用。他指出,韓國(guó)的Webtoon通過(guò)工業(yè)化和流程化的方式成功實(shí)現(xiàn)高頻更新,提升了用戶(hù)體驗(yàn)。米粿AI通過(guò)AI技術(shù)有望實(shí)現(xiàn)漫畫(huà)的高效生產(chǎn),使得更新頻率大幅提高,改變用戶(hù)從付費(fèi)到免費(fèi)的消費(fèi)模式,推動(dòng)漫畫(huà)行業(yè)像短劇一樣高頻更新,提升用戶(hù)體驗(yàn)和行業(yè)效率。
關(guān)于商業(yè)模式,丁黎表示,AI技術(shù)降低了內(nèi)容創(chuàng)作門(mén)檻,使創(chuàng)作者集中在劇本、大綱和創(chuàng)意上,由AI完成繁瑣的繪畫(huà)過(guò)程,提高創(chuàng)作效率,使更多有創(chuàng)意的人加入文創(chuàng)行業(yè)。米粿AI的技術(shù)已將繪畫(huà)速度提升至原來(lái)的10倍以上,使漫畫(huà)創(chuàng)作更加高效和低成本。
在談到挑戰(zhàn)時(shí),丁黎強(qiáng)調(diào),與行業(yè)從業(yè)者形成友好生態(tài)系統(tǒng)非常重要,AI應(yīng)作為提升產(chǎn)能和效率的工具,而非完全替代人類(lèi)。當(dāng)前AI創(chuàng)業(yè)需要高資本和高技術(shù)門(mén)檻,團(tuán)隊(duì)需團(tuán)結(jié)合作,共同應(yīng)對(duì)挑戰(zhàn),才能在激烈的市場(chǎng)競(jìng)爭(zhēng)中脫穎而出。
朱劍雄在圓桌對(duì)話(huà)中分享了他對(duì)未來(lái)超級(jí)應(yīng)用的看法和公司戰(zhàn)略。他認(rèn)為,未來(lái)幾年內(nèi),超級(jí)應(yīng)用將在多個(gè)領(lǐng)域涌現(xiàn)。當(dāng)前,AI大模型技術(shù)的接受度廣泛,且使用成本下降,推動(dòng)了眾多企業(yè)和創(chuàng)業(yè)公司積極探索這一領(lǐng)域。朱劍雄指出,從PC互聯(lián)網(wǎng)時(shí)代到移動(dòng)互聯(lián)網(wǎng)時(shí)代,流量入口的轉(zhuǎn)變提供了參考,大模型時(shí)代也會(huì)出現(xiàn)類(lèi)似的趨勢(shì),場(chǎng)景服務(wù)能力深厚的公司可能會(huì)成長(zhǎng)為超級(jí)應(yīng)用。
在談到可信大模型與超級(jí)應(yīng)用的關(guān)系時(shí),朱劍雄提到大模型技術(shù)存在“不可能的鐵三角”,即通用性、專(zhuān)業(yè)性和經(jīng)濟(jì)性。他強(qiáng)調(diào),無(wú)限光年選擇在專(zhuān)業(yè)性上深耕,構(gòu)建行業(yè)知識(shí)內(nèi)容的垂直大模型,通過(guò)神經(jīng)符號(hào)計(jì)算技術(shù),確保模型輸出的可靠性,并已在金融和醫(yī)療領(lǐng)域推出了具體的產(chǎn)品,如投研寫(xiě)作助手和體檢報(bào)告寫(xiě)作助手。這些產(chǎn)品顯著提升了工作效率,受到了用戶(hù)的高度認(rèn)可。
在探討AI驅(qū)動(dòng)創(chuàng)新應(yīng)用的挑戰(zhàn)時(shí),朱劍雄指出,產(chǎn)品經(jīng)理的角色和要求發(fā)生了變化。現(xiàn)在的產(chǎn)品經(jīng)理不僅要定義場(chǎng)景和需求,還需將這些信息傳遞給大模型,進(jìn)行評(píng)測(cè)和驗(yàn)證。他認(rèn)為,既懂模型又懂客戶(hù)的產(chǎn)品經(jīng)理目前市場(chǎng)上較為稀缺,但隨著時(shí)間推移,這一問(wèn)題將逐漸得到改善。
悉之智能專(zhuān)注于AI教育,特別是AI教學(xué)解題。孫一喬在清華大學(xué)本科期間創(chuàng)立了這家公司,認(rèn)為純統(tǒng)計(jì)模型在邏輯性和魯棒性上存在不足。孫一喬打比方稱(chēng),GPT-4駕駛宇宙飛船是不可靠的,但通過(guò)構(gòu)建包含人類(lèi)知識(shí)的白盒體系,可以顯著提高大模型的能力。
孫一喬介紹,悉之智能通過(guò)構(gòu)建完整的數(shù)學(xué)等學(xué)科知識(shí)體系,大幅提升模型推理能力,其數(shù)學(xué)解題能力顯著高于GPT-4o,現(xiàn)有產(chǎn)品在美國(guó)有近200萬(wàn)用戶(hù),年收入接近百萬(wàn)美元,并與新東方等國(guó)內(nèi)巨頭合作開(kāi)發(fā)大模型。
孫一喬認(rèn)為,未來(lái)超級(jí)應(yīng)用應(yīng)從需求出發(fā),垂直解決問(wèn)題,教育是很有潛力的領(lǐng)域。他強(qiáng)調(diào),教育領(lǐng)域頻次高、需求剛性,是容易出現(xiàn)AI超級(jí)應(yīng)用的領(lǐng)域,通過(guò)提升教學(xué)效率和學(xué)生的學(xué)習(xí)意愿,創(chuàng)造巨大價(jià)值。
提升大模型數(shù)學(xué)能力方面,孫一喬提到OpenAI的Qstar項(xiàng)目及其強(qiáng)化學(xué)習(xí)方法,認(rèn)為通過(guò)逐步優(yōu)化數(shù)學(xué)解題步驟,可以顯著提升大模型的邏輯推理能力。悉之智能采用類(lèi)似方法,結(jié)合完整的數(shù)學(xué)知識(shí)體系,逐步教大模型解題,以提高其能力。
在AI解題領(lǐng)域,孫一喬指出,專(zhuān)業(yè)AI能力與大模型結(jié)合的關(guān)鍵在于生態(tài)系統(tǒng)的改進(jìn)。悉之智能致力于通過(guò)合作共贏的方式改進(jìn)生態(tài)。垂直領(lǐng)域應(yīng)用需要大量微調(diào)和強(qiáng)化學(xué)習(xí),并希望未來(lái)生態(tài)系統(tǒng)能更高效合作,共同提升基座模型的能力。
丁寧在圓桌對(duì)話(huà)中展示了其獨(dú)特的理工科視角和深厚的技術(shù)背景。他介紹了銜遠(yuǎn)科技的戰(zhàn)略,即模用一體、通專(zhuān)結(jié)合,強(qiáng)調(diào)了在技術(shù)泛化基礎(chǔ)上提升專(zhuān)業(yè)性的理念。
在討論顛覆性超級(jí)應(yīng)用時(shí),丁寧提到大模型在處理各種信息序列(如文字、視頻、DNA等)方面的潛力。他提出了兩個(gè)關(guān)鍵維度:成功時(shí)的收益和失敗時(shí)的損失,指出在一些場(chǎng)景下可以尋找成功收益大而失敗損失小的機(jī)會(huì),例如科學(xué)發(fā)現(xiàn)和廣告營(yíng)銷(xiāo)。他強(qiáng)調(diào)了通用模型的專(zhuān)業(yè)化,通過(guò)最低成本實(shí)現(xiàn)目標(biāo)任務(wù)來(lái)創(chuàng)造價(jià)值。
針對(duì)大模型技術(shù)的提升問(wèn)題,丁寧指出大模型在處理輸入和輸出序列時(shí)的挑戰(zhàn),特別是在負(fù)信號(hào)比例高的場(chǎng)景下學(xué)習(xí)的難度。他強(qiáng)調(diào)快速高效地將通用模型專(zhuān)業(yè)化的能力,并討論了獎(jiǎng)勵(lì)模型(Reward Model)在提升模型性能中的應(yīng)用,強(qiáng)調(diào)了低成本、高效率的重要性。
在談及生成式AI驅(qū)動(dòng)超級(jí)應(yīng)用的挑戰(zhàn)時(shí),丁寧分享了兩個(gè)慣性陷阱:資源慣性和技術(shù)慣性,并強(qiáng)調(diào)保持開(kāi)放心態(tài)的重要性。他還提到數(shù)據(jù)缺失問(wèn)題,特別是負(fù)信號(hào)比例高的場(chǎng)景缺乏高質(zhì)量數(shù)據(jù),指出這是未來(lái)的一個(gè)關(guān)鍵挑戰(zhàn)。