1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

科大訊飛:星火大模型快進(jìn)入Next-level了

 2024-07-03 13:55  來源:A5專欄  我來投稿 撤稿糾錯

  阿里云優(yōu)惠券 先領(lǐng)券再下單

OpenAI一紙禁令,挑動了大模型行業(yè)的神經(jīng)。但沒有什么阻礙,可以抵擋技術(shù)向上的決心。在不少大模型廠商開出優(yōu)惠價格,試圖從OpenAI禁令中截流用戶的同時,國產(chǎn)大模型的代表企業(yè)科大訊飛,拿出了直面技術(shù)挑戰(zhàn)的勇氣。

6月27日,科大訊飛在北京國家會議中心舉行訊飛星火4.0發(fā)布會。在“懂你的AI助手”這個主題下,訊飛星火大模型不但在8個國際主流測試集中排名第一,實現(xiàn)了對GPT-4 Turbo的全面對標(biāo),還對商業(yè)化落地、生產(chǎn)力探索做出了更全面的闡釋,前瞻了行業(yè)的“Next-level”。

這一次,星火大模型掀起了新的巨浪。

自力更生,星火大模型成國產(chǎn)力量代言人

在國內(nèi)外總共覆蓋中英文的12項主流測試集,訊飛星火大模型V4.0在其中8項全面超越了GPT-4 Turbo、Claude 3 Opus、Gemini 1.5 Pro。后面這三位,正是目前英文世界大模型的戰(zhàn)力天花板選手。

換一個指標(biāo),去年,科大訊飛參與設(shè)計了國產(chǎn)通用認(rèn)知智能大模型測評體系,包含由481個測試項組成的7個方面。而如今,星火大模型V4.0在其中的文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力五個方面超越了GPT-4 Turbo,僅在代碼能力和多模態(tài)能力上仍有一定差距。

不過從數(shù)據(jù)來看,文本生成(80.2%)、語言理解(82.3%)、知識問答(85.7%)、邏輯推理(82.2%)、數(shù)學(xué)能力(86.5%)、代碼能力(81.2%)、多模態(tài)能力(78.4%)這組數(shù)據(jù)放在一起,星火大模型V4.0總體已然算是國產(chǎn)大模型的能力代表。

具體來看,GPT-4 Turbo、Claude 3 Opus和星火大模型V4.0,重點都放在多維度信息組成的復(fù)雜指令、更考驗邏輯任務(wù)能力的空間推理等高階能力上。根據(jù)科大訊飛發(fā)布會現(xiàn)場的介紹,星火大模型V4.0不僅在長文本等通用能力上整體打平GPT-4 Turbo,而且更加擅長利用已有資料進(jìn)行聯(lián)系推理——比如解讀幾張有聯(lián)系的圖片的關(guān)系,為其補全內(nèi)容情節(jié),并減少“幻覺”的出現(xiàn)。

有趣的地方在于,星火大模型V4.0其實在多模態(tài)能力方面,實現(xiàn)了對GPT4-Turbo的部分超越,比如科研、金融、醫(yī)療、司法和辦公等專業(yè)領(lǐng)域的圖文識別能力。這代表星火大模型V4.0的側(cè)重點明顯不同于普通的通用大模型。它更側(cè)重于某些垂直領(lǐng)域的應(yīng)用潛力。

對此,科大訊飛董事長劉慶峰在演講中做了一些闡述:“大模型不僅可以寫詩、作畫,在改變工業(yè)、改變科研范式等方面已經(jīng)實實在在發(fā)揮作用,包括我們和中國科學(xué)技術(shù)大學(xué)做的合成類的科學(xué)創(chuàng)新,比如說化學(xué);還有與合肥綜合性國家科學(xué)中心能源研究院合作,在推進(jìn)大模型賦能核聚變整個過程中更快地預(yù)測、更好地應(yīng)對各種各樣的異常情況。”

應(yīng)用,已經(jīng)成為星火大模型V4.0的重頭戲。只有真正用起來,能力才會有價值。

以訊飛星火APP為例,自2023年9月全面開放以來,訊飛星火APP在安卓公開市場累計下載量達(dá)1.31億次?,F(xiàn)在,全新升級的訊飛星火APP,允許消費者用自己的知識庫打造“更懂你的AI助手”。換句話說,專屬于個體的智能體。

按照劉慶峰在演講中透露的信息,訊飛星火APP使用的高峰期是工作日的工作時間段,意味著它真的變成了不少用戶的剛需。這是對“AI只能用來玩玩”的刻板印象的有力回?fù)?,也是星火大模型價值的體現(xiàn)。

但更讓人激動的應(yīng)用,其實還在蓄力。個人能從星火大模型中找到助手,企業(yè)乃至社會,將從中汲取更大的力量。這就是整個大模型產(chǎn)業(yè)的“Next-level”,它的亮點就在落地的最后一公里,以及那些暫時還是暢想的形式。

真正的Next-level,藏在最后一公里

幾個簡單的問題,可以讓我們對星火大模型V4.0的未來進(jìn)化更有數(shù)。

首先,智能體為什么值得期待?九合創(chuàng)投在近日召開的年會上發(fā)布了《不朽的計算:比特連接世界,詞元生成未來》報告。其中提到,“模型是能夠沉淀智慧的計算形態(tài)”。傳統(tǒng)算法是數(shù)學(xué)結(jié)果,一次使用不具備普及性。但模型可以持續(xù)進(jìn)化,適應(yīng)多維度的使用需求。而封裝為智能體之后的超級模型,已經(jīng)是特定領(lǐng)域的智慧結(jié)晶。它具有不可估量的復(fù)用價值。

以星火企業(yè)智能體平臺為例,科大訊飛已經(jīng)首批創(chuàng)建了32個企業(yè)智能體,可以深入業(yè)務(wù)流程,滿足企業(yè)的需求。而這個過程其實非常輕松,企業(yè)只需要提出需求就可以開始創(chuàng)建智能體,經(jīng)過功能驗證后,就可以真實上馬,并可以和企業(yè)內(nèi)部辦公平臺打通。

從市場價值來看,訊飛星火大模型從去年發(fā)布到現(xiàn)在,已經(jīng)和國家能源集團、中國石油、中國移動、交通銀行、大眾汽車、海爾集團、美的集團等行業(yè)領(lǐng)軍企業(yè)建立合作,證明其使用價值得到一線認(rèn)可。

其次,為什么是訊飛?因為企業(yè)智能的底層除了大模型技術(shù),還有對企業(yè)業(yè)務(wù)的理解,對分門別類的場景的認(rèn)知,這不是坐在辦公室里就能拍腦袋想出來的。訊飛建立這些認(rèn)知,花費了數(shù)十年的時間和遍布各行各業(yè)的具體嘗試。所以,智能體是新物種,但在訊飛和星火大模型的共同支持下,它會很快和現(xiàn)有生態(tài)相融。

換句話說,訊飛的領(lǐng)先,是星火大模型的技術(shù)領(lǐng)先和自身To B和To G業(yè)務(wù)領(lǐng)先的復(fù)合結(jié)果。2024年6月,訊飛剛剛榮獲國家科學(xué)技術(shù)進(jìn)步獎一等獎,獲獎項目名為“多語種智能語音關(guān)鍵技術(shù)及產(chǎn)業(yè)化”,技術(shù)和產(chǎn)業(yè)化的雙劍合璧,成為一塊勛章。上半場的技術(shù)較量,訊飛能和OpenAI掰手腕。下半場的應(yīng)用較量,訊飛更懂中國市場。

最后,星火大模型V4.0背后的進(jìn)化,對智能體概念的探索,遠(yuǎn)期價值恐怕會遠(yuǎn)超普通人的想象。目前,還只是這個概念的蓄力階段。

一個很關(guān)鍵的問題是,從GPT-4 Turbo到星火大模型V4.0,我們越來越關(guān)注大模型的多模態(tài)能力、空間和邏輯推理能力、對復(fù)雜指令的理解和執(zhí)行能力等等。這種需求引導(dǎo)下發(fā)展的大模型和智能體,注定用于和現(xiàn)實世界融合交互。

現(xiàn)代機器人之父羅德尼·布魯克斯(Rodney Brooks)在1991年發(fā)表的《沒有表征的智能》論文中提出,傳統(tǒng)智能基于復(fù)雜算法和內(nèi)部數(shù)據(jù)模型是錯誤和片面的,真正的智能行為要從自主機器與環(huán)境的物理交互中產(chǎn)生。這個想法更加適合今天大模型和智能體的發(fā)展,或者說“具身智能”的概念——能理解和推理物理世界,并且產(chǎn)生互動。

“AI教母”李飛飛選擇的創(chuàng)業(yè)方向就是與之類似的“空間智能”。她曾在TED的演講上舉過一個例子——一張貓伸出爪子將玻璃杯推向桌子邊緣的圖片。她說,人類大腦可以評估“這個玻璃杯的幾何形狀,它在三維空間中的位置,它與桌子、貓和所有其他東西的關(guān)系”,所有推理都基于這些認(rèn)知。

無疑,星火大模型V4.0也好,GPT-4 Turbo也罷,都是在朝著這種意義上的智能發(fā)展。

劉慶峰曾提出星火大模型的四條商業(yè)化路徑,其中一條就是基于“超腦2030計劃”推動機器人走進(jìn)千家萬戶,重頭戲在于全棧機器人能力,而這又源于大模型的多模感知和多維表達(dá)。

對科大訊飛來說,好消息是它所掌握的應(yīng)用經(jīng)驗,很有可能讓星火大模型在向空間智能、具身智能的發(fā)展過程中步步領(lǐng)先。比如現(xiàn)在,星火個人智能體和企業(yè)智能體的落地,其實已經(jīng)在調(diào)動現(xiàn)實要素對大模型和智能體進(jìn)行完善。只不過,目前的應(yīng)用停留在數(shù)字空間,還沒有深入現(xiàn)實進(jìn)行交互。

但我們相信,這一天會比想象的更早到來。畢竟,從去年的星火大模型1.0版本到如今的4.0版本,科大訊飛從無到有,創(chuàng)造出世界一流的大模型能力和應(yīng)用,已然是一個奇跡。

而在當(dāng)下這個世界中,地緣層面的割裂已經(jīng)影響到大模型世界的完整性。當(dāng)OpenAI發(fā)出斷供宣言,有星火大模型這樣的一線玩家能夠頂上,不得不說是中國大模型產(chǎn)業(yè)的幸運。在這一年,中國人工智能領(lǐng)域的實力,正在這些領(lǐng)先者身上,閃耀著新的光芒。

來源:松果財經(jīng)

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)標(biāo)簽
大模型

相關(guān)文章

  • 大模型是下一代操作系統(tǒng)的未來,在這屆云棲大會上已經(jīng)到來

    9月24日,2025云棲大會在杭州開幕,阿里巴巴集團CEO、阿里云智能集團董事長兼CEO吳泳銘發(fā)表主旨演講,首次系統(tǒng)性地闡述通往ASI的三階段演進(jìn)路線,包括智能涌現(xiàn)、自主行動以及自我迭代等,實現(xiàn)從學(xué)習(xí)人、輔助人到超越人的發(fā)展脈絡(luò)?;谏鲜龅陌l(fā)展路線,吳泳銘對外做出判斷,大模型是下一代的操作系統(tǒng)?!拔?/p>

    標(biāo)簽:
    大模型
  • 大模型搶灘高考志愿填報,能否頂替「張雪峰」們?

    文/二風(fēng)來源/節(jié)點財經(jīng)每年高考成績放榜后,數(shù)千萬考生和家長將迎來另一場硬仗——填報志愿。今年,這一領(lǐng)域迎來了AI的全面介入,多家互聯(lián)網(wǎng)大廠和教育公司紛紛推出智能志愿填報產(chǎn)品,為考生提供院校和專業(yè)選擇建議。據(jù)艾媒咨詢數(shù)據(jù),2023年中國高考志愿填報市場付費規(guī)模約9.5億元,近九成考生愿意借助志愿填報服

    標(biāo)簽:
    大模型
  • 崔大寶:大模型降溫背后的難點、卡點、節(jié)點

    崔大寶|節(jié)點財經(jīng)創(chuàng)始人進(jìn)入2024年,大模型似乎有熄火之勢:資本市場,與之關(guān)聯(lián)的概念炒不動了,英偉達(dá)股價動輒暴跌重挫,引發(fā)“泡沫戳破”的擔(dān)憂;消費市場,BATH們的推新活動少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節(jié)跳動宣布“以厘計費”,打響國內(nèi)大模型

    標(biāo)簽:
    大模型
  • 兩分鐘“熟讀”《國史大綱》,大模型的下一個爆點是“書童”?

    年初大模型行業(yè)上演“長文本”大戰(zhàn)時,我們就萌生過做一個“讀書助理”的想法。測試了市面上主流的大模型后,發(fā)現(xiàn)普遍存在兩個不足:一種是可以處理的文本長度不夠,即使有些大模型將文本長度提升到了20萬字,像《紅樓夢》這樣近百萬字的名著,還是需要多次才能“讀”完。另一種是語言理解和生成能力不足,經(jīng)常出現(xiàn)“幻覺

    標(biāo)簽:
    大模型
  • 除了燒錢,互聯(lián)網(wǎng)留給大模型揮霍的“家底”不多了

    互聯(lián)網(wǎng)或許從未停止創(chuàng)新,只是對于創(chuàng)新的認(rèn)知下降了。

    標(biāo)簽:
    大模型
  • GDPS2025賽場直擊!開普勒大黃蜂助力華理斬獲搬運賽項桂冠

    12月12日-14日,2025全球開發(fā)者先鋒大會暨國際具身智能技能大賽(GDPS2025)于上海張江科學(xué)會堂舉行,大會以具身智能競技為核心,融合了技術(shù)比拼、產(chǎn)業(yè)展示與科普體驗,為全球觀眾呈現(xiàn)出具身智能的現(xiàn)在與未來。上海開普勒機器人有限公司(以下簡稱"開普勒機器人")攜明星產(chǎn)品K2"大黃蜂"亮相,并參

    標(biāo)簽:
    GDPS
    2025
  • 弈動 Dynamic·數(shù)智躍遷 博弈無界|2025TechWorld智慧安全大會在京召開

    在數(shù)字化與智能化深度交織的時代浪潮中,安全的邊界不斷延展,技術(shù)的演進(jìn)正引領(lǐng)產(chǎn)業(yè)邁向新一輪變革。10月24日,以“弈動Dynamic·數(shù)智躍遷博弈無界”為主題的2025TechWorld智慧安全大會在北京盛大召開。來自國家部委、院士學(xué)者、高校科研機構(gòu)和企業(yè)的權(quán)威專家與業(yè)界精英齊聚北京,共議AI安全、數(shù)

    標(biāo)簽:
    弈動
  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學(xué)家峰會之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會能源投資專業(yè)委員會、溫港院士科創(chuàng)中心承辦,中國電工技術(shù)學(xué)會、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標(biāo)簽:
    ai技術(shù)
  • AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

    AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

    標(biāo)簽:
    阿里巴巴
  • 未來5年,中國AI的“大洗牌”和“內(nèi)循環(huán)”

    我覺得我們AI的目標(biāo)是:從芯片設(shè)計到軟件生態(tài),全鏈路自主開發(fā),建立可控的世界級AI體系。所以這是俺對未來5年中國AI圈的展望和判斷。(1)2026年,英偉達(dá)造車、國產(chǎn)開車26年國產(chǎn)芯片會在推理和垂直場景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會以軟件彌補硬件不足,所以訓(xùn)練和推理分開,訓(xùn)練就

  • H20芯片開賣即叫停,英偉達(dá)如何解圍?

    文/道哥在深陷“后門”風(fēng)波、接受網(wǎng)信辦問詢之后,英偉達(dá)的“特供版”H20芯片,又有了新消息。近日,美國科技媒體《TheInformation》援引知情人士消息稱,英偉達(dá)已悄然向其關(guān)鍵供應(yīng)商——包括負(fù)責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI

    標(biāo)簽:
    英偉達(dá)