以下文章來源于澎湃新聞科技頻道 ,作者張靜
編者按:在2024向星力·未來數(shù)據(jù)技術峰會上,啟明創(chuàng)投投資企業(yè)星環(huán)科技(688031.SH)創(chuàng)始人、首席執(zhí)行官孫元浩宣布,星環(huán)科技的定位從Data Infra進一步延伸到AI Infra,為企業(yè)客戶打造AI基礎設施,建立從語料處理、模型訓練、知識庫建設等一整套工具鏈,幫助企業(yè)快速建立行業(yè)大模型。
峰會期間,孫元浩接受了澎湃科技的采訪。他分析指出,企業(yè)用戶對于模型的需求是高精準度及解決實際問題的能力,因此,大模型的新趨勢是用RAG(檢索增強生成)和Agent(智能體)技術提升模型精準度。針對大模型落地的核心難點,孫元浩表示高質(zhì)量語料是關鍵,他提出了例如構(gòu)建用于推理的知識圖譜的解決方案。
啟明創(chuàng)投微信公眾號經(jīng)授權轉(zhuǎn)載。
星環(huán)科技創(chuàng)始人、首席執(zhí)行官孫元浩
“大模型卷價格對企業(yè)用戶來說幫助并不大,企業(yè)用戶對模型的精準度要求高,通用大模型更應通過提升模型精準度和模型效果,贏得競爭力。”企業(yè)級基礎軟件供應商星環(huán)科技創(chuàng)始人、首席執(zhí)行官孫元浩日前在2024向星力·未來數(shù)據(jù)技術峰會期間接受澎湃科技采訪時作出上述表示。
01/
企業(yè)用戶對于模型的精準度要求很高
希望能夠解決實際問題
近期,中國通用大模型價格戰(zhàn)打得火熱,科技巨頭紛紛參戰(zhàn)。孫元浩表示,這是由中國特殊生態(tài)造成的。在他看來,企業(yè)用戶對于模型的精準度要求很高,希望能夠解決實際問題,當前即使是市場上最大參數(shù)的模型也未必能達到企業(yè)要求,所以降價對企業(yè)用戶而言幫助有限。“企業(yè)的要求遠比現(xiàn)在的模型能力高很多”。
在孫元浩看來,僅依靠低價很難讓用戶形成粘性,“降價是為了給開發(fā)者提供低廉的Token價格,基于通用大模型開發(fā)應用,從而試圖構(gòu)建生態(tài),收集高質(zhì)量數(shù)據(jù)。但事實上,模型是很容易被替代的,用戶想換就換,因為接口全部是自然語言,沒有額度限制。”
去年,孫元浩判斷,要讓大模型變成“理科生”,成為專業(yè)領域的專家模型。今年,他認為大模型的新趨勢是用RAG(檢索增強生成)和Agent(智能體)技術提升模型精準度。“現(xiàn)在大家又開始開發(fā)Agent,可能馬上會出現(xiàn)成千上萬個Agent,這可能是現(xiàn)在大模型能力不夠造成的,模型沒辦法聰明地學習現(xiàn)在該用什么工具、怎么用,構(gòu)建Agent的過程就是教大模型怎么使用內(nèi)部工具?!?/strong>
02/
高質(zhì)量語料是解決行業(yè)大模型幻覺
及可信可控等核心落地難點的重要手段
目前,通用大模型數(shù)量快速增加,并不斷升級迭代,但卻不能完全適應企業(yè)AI應用需求。企業(yè)對行業(yè)大模型需求增加,迫切需要降低使用門檻?!艾F(xiàn)在每個大模型應用開發(fā)都要很久,重復訓練量很大。我們想把整套AI基礎設施建好,用戶再在大模型上開發(fā)應用就快了。”孫元浩表示,過去一年幫助企業(yè)客戶落地大模型時,發(fā)現(xiàn)每個環(huán)節(jié)都遇到了挑戰(zhàn)。為此,星環(huán)科技開發(fā)了語料處理、模型訓練、知識庫建設等工具鏈,就是為了幫助企業(yè)建立行業(yè)大模型,快速使用生成式AI(AIGC)。
在AI基礎設施中,星環(huán)科技無涯大模型Infinity可為各行業(yè)定制自有大模型,提供意圖理解、語義召回、數(shù)據(jù)處理和分析能力。基于無涯大模型,星環(huán)科技推出無涯·問知、無涯·問數(shù)、無涯·金融、無涯·工程等AI原生應用,可應用于金融、能源、制造、工程等領域。
孫元浩表示,大模型擅長生成文本,但回答嚴肅問題不可控,為此團隊經(jīng)過微調(diào)、增加語料,將模型訓練成“理科生”,同時將企業(yè)內(nèi)部數(shù)據(jù)知識化,利用RAG提升模型準確度。
語料質(zhì)量決定了模型質(zhì)量,高質(zhì)量語料也是解決行業(yè)大模型幻覺、可信可控等核心落地難點的重要手段。孫元浩表示,大模型結(jié)構(gòu)已不是秘密,訓練方法也不是秘密,但語料散落在各種地方,導致工作量大,“目前最大的挑戰(zhàn)是把現(xiàn)有資料整理起來訓練或微調(diào)模型,企業(yè)應用要求100%準確,所以用現(xiàn)在的語料還不夠,我們正在構(gòu)建知識圖譜用于推理,再結(jié)合大模型提升準確度?!?/strong>
來源 | 澎湃科技
作者 | 張 靜