編者按:今年5月,啟明創(chuàng)投投資企業(yè)云知聲重磅發(fā)布山海大模型,及多款基于該大模型打造的面向不同場景需求的行業(yè)應(yīng)用,從效率、成本、體驗等多角度,為千行百業(yè)的智慧升級按下加速鍵。山海大模型具備語言生成、語言理解、知識問答、邏輯推理、代碼能力、數(shù)學(xué)能力、安全合規(guī)能力七項通用能力及插件擴(kuò)展、領(lǐng)域增強(qiáng)、企業(yè)定制三項行業(yè)落地能力。日前,山海大模型正式開啟公測,云知聲致力于持續(xù)完善其性能和功能,為用戶提供更靈活、更智能的解決方案。
云知聲創(chuàng)始人、董事長兼首席技術(shù)官梁家恩在接受澎湃科技的采訪時,圍繞云知聲下定決心做大模型的關(guān)鍵原因、公司發(fā)展歷程中多個重大戰(zhàn)略抉擇、大模型帶來的巨大的商業(yè)機(jī)會等話題展開分享。他強(qiáng)調(diào)了產(chǎn)品化對于能否實現(xiàn)規(guī)模化的重要性,并指出技術(shù)型創(chuàng)業(yè)者應(yīng)把技術(shù)放到整個商業(yè)閉環(huán)中思考,且由于AI技術(shù)的商業(yè)化閉環(huán)鏈條非常長,需要大家統(tǒng)一目標(biāo),明確職責(zé),實現(xiàn)有效的求同存異和分工協(xié)作。啟明創(chuàng)投微信公眾號經(jīng)授權(quán)轉(zhuǎn)載。
云知聲創(chuàng)始人、董事長兼首席技術(shù)官梁家恩
2022年11月底,ChatGPT的橫空出世震撼世界。雖然一直在關(guān)注GPT的學(xué)術(shù)論文和研發(fā)動態(tài),但真正看到機(jī)器對人類拋出的問題應(yīng)答如流,云知聲創(chuàng)始人、董事長兼首席技術(shù)官梁家恩仍然有刷新認(rèn)知的感覺。他意識到這是自己研究人工智能25年來行業(yè)里最大的技術(shù)突破,重要程度超越了當(dāng)年深度學(xué)習(xí)霸榜ImageNet和AlphaGo打敗李世石。
半年后的2023年5月,云知聲“山海大模型”發(fā)布,并展示出了語言生成、語言理解、知識問答、邏輯推理等通用能力。云知聲表示,未來將以山海大模型為基礎(chǔ),打造MaaS(模型即應(yīng)用)模式的解決方案,增強(qiáng)物聯(lián)、醫(yī)療等行業(yè)能力,目標(biāo)是山海大模型年內(nèi)通用能力比肩ChatGPT,并在醫(yī)療、物聯(lián)、教育等多個垂直領(lǐng)域能力超越GPT-4。
人工智能獨角獸企業(yè)云知聲成立于2012年,以智能語音識別、自然語言理解、知識圖譜等全棧AI技術(shù)為核心,面向智慧物聯(lián)與智慧醫(yī)療兩大領(lǐng)域提供以對話式AI技術(shù)為基礎(chǔ)的產(chǎn)品服務(wù)與綜合解決方案。梁家恩亦擔(dān)任模式識別國家重點實驗室專委會委員。
2019年開始,梁家恩帶領(lǐng)云知聲科研團(tuán)隊多次參與國家重點研發(fā)計劃“科技創(chuàng)新2030”新一代人工智能重大項目,并以全球首款面向物聯(lián)網(wǎng)的人工智能芯片研發(fā)技術(shù)獲得了“吳文俊人工智能科技進(jìn)步獎”,大規(guī)模知識圖譜的醫(yī)療行業(yè)應(yīng)用獲北京市科技進(jìn)步一等獎。近日,上海長三角商業(yè)創(chuàng)新研究院與復(fù)旦大學(xué)管理學(xué)院聯(lián)合主辦的知新工程“三尺講臺計劃”中,以云知聲的企業(yè)發(fā)展作為了實戰(zhàn)案例樣本。梁家恩表示,“我們認(rèn)為通用人工智能的時代已經(jīng)到來了?!?/strong>
01/
大模型打開了10倍以上的商業(yè)天花板
ChatGPT的出現(xiàn),讓梁家恩意識到,“大模型+大數(shù)據(jù)”的威力在過去被低估了。無監(jiān)督預(yù)訓(xùn)練大模型通過指令調(diào)優(yōu)和人工反饋強(qiáng)化之后表現(xiàn)出的通用智能潛力,較之以往出現(xiàn)了重大的范式變化,是云知聲此次下定決心攻克大模型的關(guān)鍵。
“過去10年,所有的智能系統(tǒng)都要先定義一個特定的目標(biāo),再去收集足夠的相應(yīng)數(shù)據(jù)來優(yōu)化模型和解決問題,現(xiàn)在你已經(jīng)無需定義一個特定的目標(biāo)了,機(jī)器可以通過無監(jiān)督預(yù)訓(xùn)練學(xué)習(xí)到足夠強(qiáng)的語言和知識,從而在少量樣例情況下學(xué)會解決各種問題,并與人類規(guī)范對齊?!绷杭叶鞅硎?,“大模型的框架已經(jīng)改變了一種范式,所以我們不能還停留在過去的框架思考問題,技術(shù)框架必須做遷移,這是我們下定決心做大模型的關(guān)鍵點。”
梁家恩介紹,山海大模型希望能先構(gòu)建通用大模型的強(qiáng)大基礎(chǔ)能力,然后將其應(yīng)用在云知聲專長的醫(yī)療、物聯(lián)等特定的行業(yè)場景中,提升大模型的嚴(yán)謹(jǐn)度,讓其能夠有效解決行業(yè)問題。
梁家恩舉例介紹,過去AI用于醫(yī)療場景時,只能等醫(yī)生寫完病歷后審核病歷里面有沒有問題,用于給保險理賠時判斷用藥和操作規(guī)范,審核報銷和保單等,這在計算機(jī)領(lǐng)域?qū)儆谂袥Q式的問題;也有醫(yī)療版語音病歷錄入,但只能醫(yī)生說什么寫什么。有了大模型框架之后,這個領(lǐng)域就能擁有生成式的能力。類似于自動生成會議紀(jì)要,并為紀(jì)要自動做摘要和翻譯的功能一樣,醫(yī)生只需輸入很少的內(nèi)容,比如病人的血壓值,后面的東西AI就可以自動補(bǔ)全。在醫(yī)生和患者對話的過程中,大模型就可以自動提取有效信息,并自動生成病歷。
“大模型應(yīng)用在行業(yè)之后,產(chǎn)品的智商會更高,靈活度更強(qiáng),也能做很多過去做不了的事情,幫我們釋放更多受限于技術(shù)的潛在用戶需求,”梁家恩感慨道,“大模型為我們打開了商業(yè)天花板至少10倍到百倍的空間?!?/span>
02/
從技術(shù)到產(chǎn)品規(guī)?;氖晏剿?/span>
“今天我們有資格說自己能追上大模型的浪潮,也是因為2016年看見AlphaGo的時候,我就覺得大計算一定是未來的趨勢了。”梁家恩向澎湃科技表示,“技術(shù)肯定是我們的根據(jù)地,我們作為技術(shù)公司,技術(shù)必須保持一流水準(zhǔn),對技術(shù)的發(fā)展方向我們不能踩錯點?!?/strong>
云知聲最初是一個算法團(tuán)隊,但為了讓產(chǎn)品能夠規(guī)?;涞兀鸩缴孀阌布托酒?。之后為了解決行業(yè)性問題,把技術(shù)能力拓展到知識圖譜和超算平臺。梁家恩表示,“這些都是超出我們最初的能力范圍的,但我們必須去做,這不是我們主觀給自己增加難度,而是客觀上就需要把鏈條補(bǔ)齊,才能有效解決行業(yè)問題?!?/strong>
入局研發(fā)大模型并不是云知聲第一次做出的重大戰(zhàn)略抉擇。2012年剛創(chuàng)業(yè)時,云知聲便在To B(企業(yè)服務(wù))和To C(消費者服務(wù))的賽道抉擇之間,選擇了To B,從此為行業(yè)伙伴打造智能化產(chǎn)品和解決方案。梁家恩發(fā)現(xiàn),語音交互放在手機(jī)上,不砸錢推廣就沒人會用,活躍度不足2%,但放在智能電視上,不需要推廣活躍度就可以保持在30%-40%。
物聯(lián)網(wǎng)的產(chǎn)品化并不容易,應(yīng)用場景差異很大。梁家恩介紹,云知聲的語音交互在手機(jī)上做得已經(jīng)不錯,所以他一開始覺得用于空調(diào)的語音交互兩個月就能完成。但實際上,把設(shè)備放在三五米之外,噪音和信噪比的差別很大?!拔覀円环矫嬉獢U(kuò)展麥克風(fēng)陣列的能力去降噪,另一方面還需要成本可控,”梁家恩表示,“這里面前后磨了我們一兩年的時間,才達(dá)到可量產(chǎn)的軟硬一體遠(yuǎn)場交互方案。”物聯(lián)時代的到來,意味著聯(lián)網(wǎng)能力提升,交互成本降低,于是云知聲開始布局“云端芯”戰(zhàn)略,希望能夠接入更多的設(shè)備、用戶和場景,也面臨更復(fù)雜的應(yīng)用問題。隨著業(yè)務(wù)的發(fā)展,公司需要構(gòu)建完整的智慧物聯(lián)解決方案,自主研發(fā)智能交互專用芯片,以降低規(guī)模化拓展的成本。
2016年,云知聲團(tuán)隊意識到,光把智能交互問題解決,還不足以構(gòu)建足夠的商業(yè)空間,需要真正解決行業(yè)深層問題,才有更大的商業(yè)價值。于是,云知聲開始構(gòu)建超算平臺和行業(yè)知識圖譜,并在醫(yī)療垂直領(lǐng)域解決業(yè)務(wù)深層問題,“醫(yī)療是我們見過的最嚴(yán)肅的應(yīng)用場景,知識密度非常高,如果能拿下這一領(lǐng)域,對我們的技術(shù)來說也是一個制高點的掌握?!?/span>
項目成功了之后能不能規(guī)模化,同樣也是云知聲面臨的一大問題。梁家恩介紹,“我們在做醫(yī)院的時候,第一、第二家醫(yī)院做得都還可以,但如果遷移到不同的醫(yī)院,就會遇到差異化問題。不同醫(yī)院的底層系統(tǒng)都不一樣,關(guān)注的業(yè)務(wù)重點也不一樣,醫(yī)院水平層次各異,有的是綜合醫(yī)院,有的是??漆t(yī)院,這些都是會影響我們規(guī)?;年P(guān)鍵點?!?/span>
在對技術(shù)推崇之余,梁家恩同時也強(qiáng)調(diào)了產(chǎn)品化的重要性,他表示,“產(chǎn)品化能力才是商業(yè)上能不能規(guī)?;年P(guān)鍵。大家不會為技術(shù)買單的,只會為產(chǎn)品買單,技術(shù)是我們的根基,但我們也會把我們的技術(shù)優(yōu)勢通過工程優(yōu)化和應(yīng)用抽象,轉(zhuǎn)化為產(chǎn)品優(yōu)勢?!?/strong>
03/
創(chuàng)業(yè)不能“成于技術(shù)又?jǐn)∮诩夹g(shù)”
梁家恩本科畢業(yè)于中國科技大學(xué),在中科院自動化所獲得模式識別與智能系統(tǒng)專業(yè)博士學(xué)位后,留所負(fù)責(zé)語音識別核心技術(shù)研發(fā)及其產(chǎn)業(yè)化,在國家863語音識別核心技術(shù)評測中多次獲第一名,并帶領(lǐng)團(tuán)隊在廣電、安全、教育等領(lǐng)域?qū)崿F(xiàn)智能語音技術(shù)的產(chǎn)業(yè)化應(yīng)用。
“我一直希望能夠?qū)W以致用,把學(xué)的知識能在產(chǎn)業(yè)里面應(yīng)用起來,而不只是發(fā)一些論文,做一些評測?!睂@段經(jīng)歷,梁家恩這樣表示。
2008至2010年在中科院工作期間,梁家恩所做的最大的語音識別項目是成功將機(jī)器評分應(yīng)用到了江蘇省全省和浙江省溫州市的中考英語口語考試之中。梁家恩介紹,這是國內(nèi)第一個能大規(guī)模應(yīng)用的AI評分場景,覆蓋了百萬級的考生。項目很有影響力,也貼近民用,適合市場化。但在當(dāng)時的中科院體系中,這個項目很難商業(yè)化,因此2010年梁家恩便從中科院跳槽去了盛大創(chuàng)新院,隨后又離開盛大開始創(chuàng)業(yè)。
雖然已經(jīng)創(chuàng)業(yè)十余年,但梁家恩還是一直以“理工男”和“技術(shù)人”自居,他向澎湃科技表示:“我的興趣愛好還是一直在技術(shù)上面,通過技術(shù)創(chuàng)新解決產(chǎn)業(yè)關(guān)鍵問題是我最大的追求。我們4個創(chuàng)始人都是AI領(lǐng)域博士,現(xiàn)在只有我繼續(xù)堅守AI技術(shù)研發(fā),其他合伙人都已經(jīng)轉(zhuǎn)型,去解決AI技術(shù)產(chǎn)業(yè)化閉環(huán)上的各種業(yè)務(wù)問題,共同打通商業(yè)化閉環(huán)?!?/span>
“對于技術(shù)型的創(chuàng)業(yè)者來說,一定要走出技術(shù)本身?!睂τ趧?chuàng)業(yè)以來的轉(zhuǎn)變,梁家恩表示,“創(chuàng)業(yè)我們不能‘成于技術(shù)又?jǐn)∮诩夹g(shù)’,因為技術(shù)在整個商業(yè)鏈條里只占三分之一。所以,首先要在思維模式上把技術(shù)放到整個商業(yè)閉環(huán)的邏輯里去考慮,從而去布局我們的整個技術(shù)、產(chǎn)品和商業(yè)化體系,不能只考慮技術(shù)環(huán)節(jié)的局部優(yōu)化。第二就是在復(fù)雜的商業(yè)閉環(huán)中,需要考慮更多人的因素,包括內(nèi)部和外部的人,人理順事情才能理順。AI技術(shù)的商業(yè)化閉環(huán)鏈條是特別長的,需要大家統(tǒng)一目標(biāo),明確職責(zé),實現(xiàn)有效的求同存異和分工協(xié)作?!?/strong>
來源 | 澎湃科技
作者 | 承天蒙