日前,啟明創(chuàng)投投資企業(yè)、可信大模型公司無限光年(INF)在2024年世界人工智能大會(WAIC)上發(fā)布可信光語大模型及其技術報告。可信光語大模型結合大語言模型與符號推理,有效解決幻覺問題,大幅增強模型可信度,賦能金融服務、醫(yī)療診斷等垂直領域。在金融和醫(yī)療垂直領域評測中,可信光語大模型超越OpenAI的萬億參數(shù)大模型GPT4-Turbo,同時作為“精?!钡陌賰|規(guī)模大模型,有效提升推理精度,降低服務成本。通過解決模型幻覺問題對企業(yè)級應用的重大挑戰(zhàn),無限光年深入金融、醫(yī)療場景,目前已服務多家頭部公司和機構。
在“人工智能:科研范式變革與產(chǎn)業(yè)發(fā)展”主題論壇上,無限光年聯(lián)合創(chuàng)始人徐盈輝博士表示,幻覺問題是大模型被用作生產(chǎn)力工具的核心挑戰(zhàn)之一:如果大模型生成的內(nèi)容不可控、難以解釋,就很難滿足專業(yè)領域?qū)蚀_性、可靠性、嚴謹性的要求。針對該挑戰(zhàn),無限光年致力于研發(fā)神經(jīng)符號計算等多種創(chuàng)新技術,并在此基礎上打造新一代可信大模型。
徐盈輝博士介紹,人工智能在多年發(fā)展長河中形成了符號學派和聯(lián)結學派兩種不同的路徑和理念。神經(jīng)符號技術將符號學派的推理能力與聯(lián)接學派的學習能力有機結合,大幅提升生成式AI在行業(yè)應用中的可信生成能力,降低錯誤率、提高可靠性。正如諾貝爾經(jīng)濟學獎得主丹尼爾·卡尼曼提出的“人類思維有快與慢兩個系統(tǒng)”的理論,符號計算與大模型的結合不僅能用神經(jīng)網(wǎng)絡實現(xiàn)快速的“黑盒”概率預測,更能進行慢思考的“白盒”邏輯推理。這兩個系統(tǒng)的融合代表著通往未來通用人工智能(AGI)的重要技術方向,也正是無限光年獨特的“灰盒”可信路線。
無限光年聯(lián)合創(chuàng)始人徐盈輝博士在2024年WAIC上發(fā)布光語垂直領域大模型
無限光年積極發(fā)展“灰盒”大模型,解決垂直領域的專業(yè)問題。在金融領域,特許金融分析師(Chartered Financial Analyst,CFA)考試是全球投資業(yè)最嚴格、含金量最高的資格認證,分為三級考試,包含豐富的金融類知識問題和計算推理問題。基于CFA數(shù)據(jù)集,無限光年金融大模型在一級和二級考試中準確率均超過GPT4-Turbo和Llama3。在一級和二級考試準確率的表現(xiàn)上,無限光年金融大模型得分分別為0.7772和0.5518,GPT4-Turbo分別為0.7177和0.5259,Llama3分別為0.6723和0.4812。同時,在公開數(shù)據(jù)集FinanceIQ和Fin-Eval上,無限光年金融大模型的表現(xiàn)也均超過GPT4-Turbo和Llama3。徐盈輝博士同時宣布,無限光年將光語金融大模型API試用,助力大模型在金融行業(yè)的發(fā)展和應用。
無限光年光語大模型在垂直領域測試超越OpenAI的萬億參數(shù)大模型
此外,光語大模型在4個公開的權威邏輯推理數(shù)據(jù)集上準確率都超過GPT-4 Turbo,在ProofWriter、FOLIO、ProntoQA和MedExam Grading中的得分分別為0.99、0.58、0.99和0.80,而GPT-4分別為0.91、0.56、0.94和0.64。在醫(yī)療領域,無限光年醫(yī)療大模型在權威醫(yī)療數(shù)據(jù)集MedBench上,API和自測榜雙榜第一,是首家雙榜超過90分的醫(yī)療大模型。API榜綜合得分90.4。
自成立以來,基于可信大模型技術,無限光年已在大模型產(chǎn)業(yè)應用中取得多方面成果。在金融領域,無限光年與頭部證券公司合作推出AI投研助手。借助新一代可信技術,這一投研助手在國內(nèi)率先實現(xiàn)了用大模型精準、高效、深度解讀企業(yè)財報,為分析師等專業(yè)人士提供包括信息總結分析、范式寫作和精準搜索在內(nèi)的一站式功能。到目前為止,該產(chǎn)品已被多家證券公司和資管機構使用。
在醫(yī)療領域,無限光年與國內(nèi)頭部三甲醫(yī)院合作,共同基于可信技術創(chuàng)新打造醫(yī)療行業(yè)大模型,在體檢報告解讀方面有效協(xié)助醫(yī)生提升報告效率和準確度。
徐盈輝博士認為,在經(jīng)歷“百模大戰(zhàn)”后,模型的行業(yè)應用已成為大模型的發(fā)展重心。但在深入專業(yè)化場景時,當前通用大模型的表現(xiàn)并不理想。無限光年團隊將持續(xù)探索新一代可信的灰盒大模型技術,讓垂直領域大模型更精準、更可信,成為“金融顧問”、“專業(yè)醫(yī)生”和更多領域的專家,讓AI技術人人可用、行行受益。
據(jù)了解,無限光年團隊既有來自阿里巴巴、螞蟻集團、字節(jié)跳動、微軟的國際頂尖AI人才,也有來自摩根大通等金融機構、協(xié)和醫(yī)院等醫(yī)療機構的資深行業(yè)專家。基于對行業(yè)需求的深入了解,無限光年開發(fā)AI原生產(chǎn)品與解決方案,為行業(yè)提供多元化的專業(yè)服務,推動“灰盒大模型”和生成式AI技術在行業(yè)場景的持續(xù)落地。此前,無限光年已完成多輪融資,投資人包括阿里云、啟明創(chuàng)投等頭部投資機構。