科大訊飛：星火大模型快進(jìn)入Next-level了

2024-07-03 13:55 來(lái)源：A5專(zhuān)欄我來(lái)投稿撤稿糾錯(cuò)

OpenAI一紙禁令，挑動(dòng)了大模型行業(yè)的神經(jīng)。但沒(méi)有什么阻礙，可以抵擋技術(shù)向上的決心。在不少大模型廠(chǎng)商開(kāi)出優(yōu)惠價(jià)格，試圖從OpenAI禁令中截流用戶(hù)的同時(shí)，國(guó)產(chǎn)大模型的代表企業(yè)科大訊飛，拿出了直面技術(shù)挑戰(zhàn)的勇氣。

6月27日，科大訊飛在北京國(guó)家會(huì)議中心舉行訊飛星火4.0發(fā)布會(huì)。在“懂你的AI助手”這個(gè)主題下，訊飛星火大模型不但在8個(gè)國(guó)際主流測(cè)試集中排名第一，實(shí)現(xiàn)了對(duì)GPT-4 Turbo的全面對(duì)標(biāo)，還對(duì)商業(yè)化落地、生產(chǎn)力探索做出了更全面的闡釋?zhuān)罢傲诵袠I(yè)的“Next-level”。

這一次，星火大模型掀起了新的巨浪。

自力更生，星火大模型成國(guó)產(chǎn)力量代言人

在國(guó)內(nèi)外總共覆蓋中英文的12項(xiàng)主流測(cè)試集，訊飛星火大模型V4.0在其中8項(xiàng)全面超越了GPT-4 Turbo、Claude 3 Opus、Gemini 1.5 Pro。后面這三位，正是目前英文世界大模型的戰(zhàn)力天花板選手。

換一個(gè)指標(biāo)，去年，科大訊飛參與設(shè)計(jì)了國(guó)產(chǎn)通用認(rèn)知智能大模型測(cè)評(píng)體系，包含由481個(gè)測(cè)試項(xiàng)組成的7個(gè)方面。而如今，星火大模型V4.0在其中的文本生成、語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理、數(shù)學(xué)能力五個(gè)方面超越了GPT-4 Turbo，僅在代碼能力和多模態(tài)能力上仍有一定差距。

不過(guò)從數(shù)據(jù)來(lái)看，文本生成（80.2%）、語(yǔ)言理解（82.3%）、知識(shí)問(wèn)答（85.7%）、邏輯推理（82.2%）、數(shù)學(xué)能力（86.5%）、代碼能力（81.2%）、多模態(tài)能力（78.4%）這組數(shù)據(jù)放在一起，星火大模型V4.0總體已然算是國(guó)產(chǎn)大模型的能力代表。

具體來(lái)看，GPT-4 Turbo、Claude 3 Opus和星火大模型V4.0，重點(diǎn)都放在多維度信息組成的復(fù)雜指令、更考驗(yàn)邏輯任務(wù)能力的空間推理等高階能力上。根據(jù)科大訊飛發(fā)布會(huì)現(xiàn)場(chǎng)的介紹，星火大模型V4.0不僅在長(zhǎng)文本等通用能力上整體打平GPT-4 Turbo，而且更加擅長(zhǎng)利用已有資料進(jìn)行聯(lián)系推理——比如解讀幾張有聯(lián)系的圖片的關(guān)系，為其補(bǔ)全內(nèi)容情節(jié)，并減少“幻覺(jué)”的出現(xiàn)。

有趣的地方在于，星火大模型V4.0其實(shí)在多模態(tài)能力方面，實(shí)現(xiàn)了對(duì)GPT4-Turbo的部分超越，比如科研、金融、醫(yī)療、司法和辦公等專(zhuān)業(yè)領(lǐng)域的圖文識(shí)別能力。這代表星火大模型V4.0的側(cè)重點(diǎn)明顯不同于普通的通用大模型。它更側(cè)重于某些垂直領(lǐng)域的應(yīng)用潛力。

對(duì)此，科大訊飛董事長(zhǎng)劉慶峰在演講中做了一些闡述：“大模型不僅可以寫(xiě)詩(shī)、作畫(huà)，在改變工業(yè)、改變科研范式等方面已經(jīng)實(shí)實(shí)在在發(fā)揮作用，包括我們和中國(guó)科學(xué)技術(shù)大學(xué)做的合成類(lèi)的科學(xué)創(chuàng)新，比如說(shuō)化學(xué)；還有與合肥綜合性國(guó)家科學(xué)中心能源研究院合作，在推進(jìn)大模型賦能核聚變整個(gè)過(guò)程中更快地預(yù)測(cè)、更好地應(yīng)對(duì)各種各樣的異常情況。”

應(yīng)用，已經(jīng)成為星火大模型V4.0的重頭戲。只有真正用起來(lái)，能力才會(huì)有價(jià)值。

以訊飛星火APP為例，自2023年9月全面開(kāi)放以來(lái)，訊飛星火APP在安卓公開(kāi)市場(chǎng)累計(jì)下載量達(dá)1.31億次?，F(xiàn)在，全新升級(jí)的訊飛星火APP，允許消費(fèi)者用自己的知識(shí)庫(kù)打造“更懂你的AI助手”。換句話(huà)說(shuō)，專(zhuān)屬于個(gè)體的智能體。

按照劉慶峰在演講中透露的信息，訊飛星火APP使用的高峰期是工作日的工作時(shí)間段，意味著它真的變成了不少用戶(hù)的剛需。這是對(duì)“AI只能用來(lái)玩玩”的刻板印象的有力回?fù)?，也是星火大模型價(jià)值的體現(xiàn)。

但更讓人激動(dòng)的應(yīng)用，其實(shí)還在蓄力。個(gè)人能從星火大模型中找到助手，企業(yè)乃至社會(huì)，將從中汲取更大的力量。這就是整個(gè)大模型產(chǎn)業(yè)的“Next-level”，它的亮點(diǎn)就在落地的最后一公里，以及那些暫時(shí)還是暢想的形式。

真正的Next-level，藏在最后一公里

幾個(gè)簡(jiǎn)單的問(wèn)題，可以讓我們對(duì)星火大模型V4.0的未來(lái)進(jìn)化更有數(shù)。

首先，智能體為什么值得期待？九合創(chuàng)投在近日召開(kāi)的年會(huì)上發(fā)布了《不朽的計(jì)算：比特連接世界，詞元生成未來(lái)》報(bào)告。其中提到，“模型是能夠沉淀智慧的計(jì)算形態(tài)”。傳統(tǒng)算法是數(shù)學(xué)結(jié)果，一次使用不具備普及性。但模型可以持續(xù)進(jìn)化，適應(yīng)多維度的使用需求。而封裝為智能體之后的超級(jí)模型，已經(jīng)是特定領(lǐng)域的智慧結(jié)晶。它具有不可估量的復(fù)用價(jià)值。

以星火企業(yè)智能體平臺(tái)為例，科大訊飛已經(jīng)首批創(chuàng)建了32個(gè)企業(yè)智能體，可以深入業(yè)務(wù)流程，滿(mǎn)足企業(yè)的需求。而這個(gè)過(guò)程其實(shí)非常輕松，企業(yè)只需要提出需求就可以開(kāi)始創(chuàng)建智能體，經(jīng)過(guò)功能驗(yàn)證后，就可以真實(shí)上馬，并可以和企業(yè)內(nèi)部辦公平臺(tái)打通。

從市場(chǎng)價(jià)值來(lái)看，訊飛星火大模型從去年發(fā)布到現(xiàn)在，已經(jīng)和國(guó)家能源集團(tuán)、中國(guó)石油、中國(guó)移動(dòng)、交通銀行、大眾汽車(chē)、海爾集團(tuán)、美的集團(tuán)等行業(yè)領(lǐng)軍企業(yè)建立合作，證明其使用價(jià)值得到一線(xiàn)認(rèn)可。

其次，為什么是訊飛？因?yàn)槠髽I(yè)智能的底層除了大模型技術(shù)，還有對(duì)企業(yè)業(yè)務(wù)的理解，對(duì)分門(mén)別類(lèi)的場(chǎng)景的認(rèn)知，這不是坐在辦公室里就能拍腦袋想出來(lái)的。訊飛建立這些認(rèn)知，花費(fèi)了數(shù)十年的時(shí)間和遍布各行各業(yè)的具體嘗試。所以，智能體是新物種，但在訊飛和星火大模型的共同支持下，它會(huì)很快和現(xiàn)有生態(tài)相融。

換句話(huà)說(shuō)，訊飛的領(lǐng)先，是星火大模型的技術(shù)領(lǐng)先和自身To B和To G業(yè)務(wù)領(lǐng)先的復(fù)合結(jié)果。2024年6月，訊飛剛剛榮獲國(guó)家科學(xué)技術(shù)進(jìn)步獎(jiǎng)一等獎(jiǎng)，獲獎(jiǎng)項(xiàng)目名為“多語(yǔ)種智能語(yǔ)音關(guān)鍵技術(shù)及產(chǎn)業(yè)化”，技術(shù)和產(chǎn)業(yè)化的雙劍合璧，成為一塊勛章。上半場(chǎng)的技術(shù)較量，訊飛能和OpenAI掰手腕。下半場(chǎng)的應(yīng)用較量，訊飛更懂中國(guó)市場(chǎng)。

最后，星火大模型V4.0背后的進(jìn)化，對(duì)智能體概念的探索，遠(yuǎn)期價(jià)值恐怕會(huì)遠(yuǎn)超普通人的想象。目前，還只是這個(gè)概念的蓄力階段。

一個(gè)很關(guān)鍵的問(wèn)題是，從GPT-4 Turbo到星火大模型V4.0，我們?cè)絹?lái)越關(guān)注大模型的多模態(tài)能力、空間和邏輯推理能力、對(duì)復(fù)雜指令的理解和執(zhí)行能力等等。這種需求引導(dǎo)下發(fā)展的大模型和智能體，注定用于和現(xiàn)實(shí)世界融合交互。

現(xiàn)代機(jī)器人之父羅德尼·布魯克斯（Rodney Brooks）在1991年發(fā)表的《沒(méi)有表征的智能》論文中提出，傳統(tǒng)智能基于復(fù)雜算法和內(nèi)部數(shù)據(jù)模型是錯(cuò)誤和片面的，真正的智能行為要從自主機(jī)器與環(huán)境的物理交互中產(chǎn)生。這個(gè)想法更加適合今天大模型和智能體的發(fā)展，或者說(shuō)“具身智能”的概念——能理解和推理物理世界，并且產(chǎn)生互動(dòng)。

“AI教母”李飛飛選擇的創(chuàng)業(yè)方向就是與之類(lèi)似的“空間智能”。她曾在TED的演講上舉過(guò)一個(gè)例子——一張貓伸出爪子將玻璃杯推向桌子邊緣的圖片。她說(shuō)，人類(lèi)大腦可以評(píng)估“這個(gè)玻璃杯的幾何形狀，它在三維空間中的位置，它與桌子、貓和所有其他東西的關(guān)系”，所有推理都基于這些認(rèn)知。

無(wú)疑，星火大模型V4.0也好，GPT-4 Turbo也罷，都是在朝著這種意義上的智能發(fā)展。

劉慶峰曾提出星火大模型的四條商業(yè)化路徑，其中一條就是基于“超腦2030計(jì)劃”推動(dòng)機(jī)器人走進(jìn)千家萬(wàn)戶(hù)，重頭戲在于全棧機(jī)器人能力，而這又源于大模型的多模感知和多維表達(dá)。

對(duì)科大訊飛來(lái)說(shuō)，好消息是它所掌握的應(yīng)用經(jīng)驗(yàn)，很有可能讓星火大模型在向空間智能、具身智能的發(fā)展過(guò)程中步步領(lǐng)先。比如現(xiàn)在，星火個(gè)人智能體和企業(yè)智能體的落地，其實(shí)已經(jīng)在調(diào)動(dòng)現(xiàn)實(shí)要素對(duì)大模型和智能體進(jìn)行完善。只不過(guò)，目前的應(yīng)用停留在數(shù)字空間，還沒(méi)有深入現(xiàn)實(shí)進(jìn)行交互。

但我們相信，這一天會(huì)比想象的更早到來(lái)。畢竟，從去年的星火大模型1.0版本到如今的4.0版本，科大訊飛從無(wú)到有，創(chuàng)造出世界一流的大模型能力和應(yīng)用，已然是一個(gè)奇跡。

而在當(dāng)下這個(gè)世界中，地緣層面的割裂已經(jīng)影響到大模型世界的完整性。當(dāng)OpenAI發(fā)出斷供宣言，有星火大模型這樣的一線(xiàn)玩家能夠頂上，不得不說(shuō)是中國(guó)大模型產(chǎn)業(yè)的幸運(yùn)。在這一年，中國(guó)人工智能領(lǐng)域的實(shí)力，正在這些領(lǐng)先者身上，閃耀著新的光芒。

來(lái)源：松果財(cái)經(jīng)

申請(qǐng)創(chuàng)業(yè)報(bào)道，分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處，共同探討創(chuàng)業(yè)新機(jī)遇！

相關(guān)標(biāo)簽: 大模型

科大訊飛：星火大模型快進(jìn)入Next-level了

相關(guān)文章

大模型是下一代操作系統(tǒng)的未來(lái)，在這屆云棲大會(huì)上已經(jīng)到來(lái)

大模型搶灘高考志愿填報(bào)，能否頂替「張雪峰」們？

崔大寶：大模型降溫背后的難點(diǎn)、卡點(diǎn)、節(jié)點(diǎn)

兩分鐘“熟讀”《國(guó)史大綱》，大模型的下一個(gè)爆點(diǎn)是“書(shū)童”？

除了燒錢(qián)，互聯(lián)網(wǎng)留給大模型揮霍的“家底”不多了

90%的AI中間商會(huì)消失：Google封號(hào)只是第一槍

DeepSeek V4意外泄露，原生多模態(tài)

中國(guó)開(kāi)啟AI全民化元年，BAT同入“億級(jí)俱樂(lè)部”

開(kāi)源模型再突破，全球AI行業(yè)的拐點(diǎn)要來(lái)了？

看懂黃仁勛CES演講，就看懂 AI 接下來(lái)十年的走向

GDPS2025賽場(chǎng)直擊！開(kāi)普勒大黃蜂助力華理斬獲搬運(yùn)賽項(xiàng)桂冠

弈動(dòng) Dynamic·數(shù)智躍遷博弈無(wú)界｜2025TechWorld智慧安全大會(huì)在京召開(kāi)

甌江論道：AI賦能綠色發(fā)展

AI云“分野”：阿里云們“賣(mài)鏟”，火山引擎奇襲“MaaS”

未來(lái)5年，中國(guó)AI的“大洗牌”和“內(nèi)循環(huán)”

熱門(mén)排行

編輯推薦