2025年開年，DeepSeek在國內(nèi)外大模型行業(yè)掀起了地震。除了深度推理模型DeepSeek-R1在回答問題上的表現(xiàn)優(yōu)異之外，DeepSeek的存在，給國內(nèi)大模型圈注入了緊張又鮮活的空氣。

其一，憑借技術(shù)優(yōu)勢，DeepSeek一舉進(jìn)入國際大模型頭部梯隊，這給國內(nèi)大模型公司看到了彎道超車的可能性。

其二，DeepSeek的訓(xùn)練成果，打破了算力受限的問題，證明通過算法優(yōu)化，同樣可以以低算力訓(xùn)練出高質(zhì)量的模型。

當(dāng)算力“卡脖子”的隱憂被放下，兼顧能耗和精度的大模型應(yīng)該解決哪些問題？在這個層面上，國內(nèi)大模型公司紛紛交出了各自的答卷。

最近，由中國科學(xué)院自動化所孵化的AI企業(yè)中科聞歌發(fā)布的雅意大模型旗艦版——YAYI-Ultra在破解大模型落地”精度-能耗”困局前給出了自己的答案。

作為覆蓋全球100+模型的權(quán)威評測體系，OpenCompass榜單歷來是觀察大模型技術(shù)路線的”晴雨表”，在其近日發(fā)布的OpenCompass大模型公開學(xué)術(shù)榜單中，中科聞歌YAYI-Ultra，以64.5分首次闖入前十，成為TOP10中五個中國大模型之一。

DeepSeek掀起低成本革命，這個國產(chǎn)大模型怎么兼顧高精度、低能耗

在OpenCompass最新大語言模型公開學(xué)術(shù)實(shí)時榜單中，YAYI-Ultra排名綜合得分64.5，排名第十，其中：

代碼生成：LiveCodeBench排名第五，表現(xiàn)優(yōu)于GPT-4o-20241120版本

復(fù)雜指令理解：IFEval排名第九

知識推理能力：MMLU-Pro排名第九

在側(cè)重中文理解的C-Eval評測中，YAYI-Ultra在允許自主驗(yàn)證的公開訪問榜單位列第二，展現(xiàn)了在中文場景下的技術(shù)優(yōu)勢。

一手實(shí)測：超長文輸出復(fù)雜任務(wù)規(guī)劃精準(zhǔn)拿捏

根據(jù)官方信息，YAYI-Ultra在圖表理解、復(fù)雜任務(wù)、長文理解與生成方面表現(xiàn)突出，我們立馬上手從六個維度（多模態(tài)圖表深度理解、復(fù)雜圖像理解、復(fù)雜任務(wù)智能規(guī)劃（Function Call）、數(shù)據(jù)統(tǒng)計分析及超長文本理解與生成）實(shí)測下YAYI-Ultra表現(xiàn)到底如何。

01 視覺理解再升級：懂語言，更懂圖表

上來我們先來讀個圖表試試。

prompt：2000年前后，哪個價格區(qū)間的物業(yè)費(fèi)占比變化最多？

YAYI-Ultra可以準(zhǔn)確識別柱狀圖中的不同顏色和數(shù)字，充分理解圖表并給出回答。

除了中文場景外，在多語言場景中，YAYI-Ultra也能夠準(zhǔn)確理解并遵循用戶指令，提供跨語言的精準(zhǔn)回復(fù)。

prompt：How did the distribution of agriculture-related employment change between 2012 and 2022? Did it increase or decrease, and by what percentage or amount? Answer in Chinese。

可以看到，在視覺理解方面，針對跨語言多模態(tài)對齊、多圖推理、可變分辨率等技術(shù)難點(diǎn)，YAYI-Ultra全面升級，增強(qiáng)了模型在跨語言圖表理解、多圖表問答、多模態(tài)指令遵循等方面的能力，不僅能輕松應(yīng)對堆積條形圖、散點(diǎn)圖、混合圖表等復(fù)雜圖表場景，在圖表重繪、圖表轉(zhuǎn)換等任務(wù)上也表現(xiàn)突出。

02 表格智解：萬千表格不在話下

在工作中，復(fù)雜報告統(tǒng)計費(fèi)時又費(fèi)力，我們“喂”給YAYI-Ultra一張包含行業(yè)普通報告、行業(yè)深度報告、公司普通報告三種類型交替出現(xiàn)的表格，YAYI-Ultra準(zhǔn)確統(tǒng)計出不同類型報告的數(shù)量。

prompt：每種報告類型的數(shù)量是多少？

當(dāng)涉及不規(guī)則表格時，YAYI-Ultra依然能夠精準(zhǔn)解析并提取關(guān)鍵數(shù)據(jù)。以下表格包含總分結(jié)構(gòu)及復(fù)雜數(shù)據(jù)表述，YAYI-Ultra能夠準(zhǔn)確理解表格中的模型類型、方法及局部性指標(biāo)變化數(shù)值，并完成對比分析。

prompt：哪個基座模型使用IKE方法后局部性下降最多？

在統(tǒng)計數(shù)據(jù)理解方面，可以看出YAYI-Ultra重點(diǎn)增強(qiáng)了表格問答中復(fù)雜排版理解、跨語言問答等能力。

從金融報告、學(xué)術(shù)論文，到包含嵌套結(jié)構(gòu)的復(fù)雜表格，YAYI-Ultra都能精準(zhǔn)定位信息、理解用戶意圖；同時，模型也能夠在跨語言表格問答場景中，提供高效、清晰的解答。

03 Function Call：復(fù)雜任務(wù)智能規(guī)劃

繼續(xù)上難度，我們讓YAYI-Ultra繪制一下去年奧運(yùn)會中國隊金、銀、銅獎牌數(shù)量折線圖（隨時間變化）。

首先可以看到，YAYI-Ultra準(zhǔn)確理解了用戶意圖，確定“去年奧運(yùn)會”指的是巴黎奧運(yùn)會，并制定出詳細(xì)的任務(wù)規(guī)劃；接下來，模型通過搜索引擎獲取巴黎奧運(yùn)會中國隊金、銀、銅牌相關(guān)數(shù)據(jù)（包括91枚獎牌的類型及獲得時間）；再將這些獎牌數(shù)據(jù)進(jìn)行梳理，歸類分組、按時排序，并生成代碼，通過調(diào)用代碼解釋器，完成折線圖繪制。

YAYI-Ultra之所以能夠完成這一系列的復(fù)雜任務(wù)拆解與規(guī)劃，離不開其增加的工具調(diào)用能力，主要包含搜索引擎、代碼解釋器、圖像解析、天氣等基礎(chǔ)工具；新聞熱榜追蹤、傳播影響力分析等特色垂直領(lǐng)域工具。

模型顯著增強(qiáng)了在多工具串行調(diào)用場景下的規(guī)劃合理性，同時提升了復(fù)雜搜索場景下的信息收集能力。

04 多模態(tài)輸出：圖文并茂，直觀簡潔

在文獻(xiàn)閱讀或者信息收集過程中，我們通常需要從多篇文檔中查找、分析特定信息（如數(shù)值變化、實(shí)驗(yàn)結(jié)果等），現(xiàn)在一句話就能找到想要的內(nèi)容，并且YAYI-Ultra在文字分析描述的基礎(chǔ)上，可同步給出對應(yīng)的圖片內(nèi)容。

比如，提問：The percentage of different behaviors under different collaborative strategies

YAYI-Ultra根據(jù)問題，從用戶構(gòu)建的“人工智能論文知識庫”中識別相關(guān)的多篇人工智能論文，并據(jù)此進(jìn)行回答。答案中不僅有文字，還在對應(yīng)的引用位置給出了原始圖片，大大提升了閱讀體驗(yàn)及答案可靠性。

05 全棧長文：吞吐萬言，下筆如神

最讓人眼前一亮的要屬超長文輸出，YAYI-Ultra支持最長20萬字輸入和10萬字超長輸出，形成從“輸入理解”到“內(nèi)容創(chuàng)作”的全鏈路長文本能力閉環(huán)。

YAYI-Ultra支持聯(lián)網(wǎng)智能創(chuàng)作與文獻(xiàn)錨定創(chuàng)作雙模式，并將長文寫作任務(wù)拆解為更小、更可控的子任務(wù)（先生成大綱，再根據(jù)大綱生成全文），這樣有效保證了文本結(jié)構(gòu)，提升長文生成質(zhì)量。

●?聯(lián)網(wǎng)智能創(chuàng)作：聯(lián)網(wǎng)收集信息完成創(chuàng)作

prompt：寫一篇30000字的中國儒家文化發(fā)展歷史分析報告

●?文獻(xiàn)錨定創(chuàng)作：劃定知識邊界精準(zhǔn)寫作

prompt：請根據(jù)參考資料寫一篇長文，寫作的主題是“通用人工智能解決方案：創(chuàng)新與效率的完美結(jié)合”

06 數(shù)據(jù)分析：精準(zhǔn)求解，可視交互

最后，我們也針對基礎(chǔ)的數(shù)據(jù)分析和可視化圖表繪制進(jìn)行了實(shí)測，YAYI-Ultra準(zhǔn)確完成分析、計算和圖表繪制任務(wù)。

prompt：根據(jù)表格，計算人均月收入，然后計算月收入與人均月收入的差值，繪制一個柱形圖，橫軸是名字，縱軸是差值，標(biāo)題是“每人收入與平均值差距”。

YAYI-Ultra根據(jù)用戶要求，通過Python of Thought（POT）能力，生成Python代碼并執(zhí)行，精準(zhǔn)完成了統(tǒng)計推斷、矩陣運(yùn)算、數(shù)值優(yōu)化等數(shù)值密集型任務(wù)。

從“大水漫灌”到“精準(zhǔn)匹配”，YAYI-Ultra用靈活專家配置突破大模型落地瓶頸

當(dāng)前，AI大模型落地正面臨“能力-成本”剪刀差擴(kuò)大的關(guān)鍵節(jié)點(diǎn)。

據(jù)IDC最新報告顯示，企業(yè)在AI大模型落地過程中，面臨模型精度不能完全滿足業(yè)務(wù)需求的問題；同時，92%的企業(yè)認(rèn)為在大模型工程化落地階段，缺少算力資源是最大的挑戰(zhàn)。

中科聞歌雅意技術(shù)團(tuán)隊透露，YAYI-Ultra是以多領(lǐng)域能力為特色的混合專家模型，為了提升在不同領(lǐng)域?qū)I(yè)任務(wù)上的表現(xiàn)，采用靈活的專家配置模式，支持?jǐn)?shù)學(xué)、代碼、金融、輿情、中醫(yī)、安全等多種領(lǐng)域?qū)＜医M合，能顯著緩解稠密模型在垂直領(lǐng)域遷移過程中普遍存在的“蹺蹺板”現(xiàn)象，可針對不同領(lǐng)域需求，為行業(yè)提供”高精度、低能耗”的智能化解決方案。

譬如，在媒體領(lǐng)域，中科聞歌推出紅旗3.0融媒體智能平臺，基于YAYI能力，幫助客戶將內(nèi)容創(chuàng)作時間縮短30%-50%，內(nèi)容發(fā)布頻率提升了20%-40%，某客戶在引入自動化審核能力后，內(nèi)容差錯率從5%降至0.5%左右，目前已廣泛應(yīng)用于新華社、央視、中國日報等頭部媒體。

中科聞歌紅旗3.0融媒體智能平臺

在醫(yī)療領(lǐng)域，基于YAYI的大醫(yī)金匱中醫(yī)大模型，可精準(zhǔn)診斷500余種常見病癥，為患者提供個性化的治療方案，經(jīng)臨床專家測評辨證推理準(zhǔn)確率高達(dá)90％，在中醫(yī)師資格考試模擬測試中表現(xiàn)優(yōu)異，準(zhǔn)確率超過94％，并面向C端用戶推出了“大醫(yī)金匱”中醫(yī)健康管理APP。