1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

技術(shù)揭秘視頻行業(yè)降本提效之道:智能視頻云3.0全景圖

 2021-05-24 15:19  來(lái)源:互聯(lián)網(wǎng)  我來(lái)投稿 撤稿糾錯(cuò)

  阿里云優(yōu)惠券 先領(lǐng)券再下單

人工智能與5G的飛速發(fā)展,讓各行各業(yè)對(duì)視頻的應(yīng)用、體驗(yàn)提出了更高的要求。5月13日,百度智能云“2021云智技術(shù)論壇-智能視頻專(zhuān)場(chǎng)”活動(dòng)在京舉辦,百度智能云重磅發(fā)布了智能視頻云3.0全景圖,融合百度前沿的視頻云和AI技術(shù)能力矩陣,從云智技術(shù)一體化、產(chǎn)品平臺(tái)化、應(yīng)用場(chǎng)景化三個(gè)層面全面賦能多場(chǎng)景的視頻應(yīng)用。作為國(guó)內(nèi)AI公有云服務(wù)市場(chǎng)第一的百度智能云,正以“云智一體”獨(dú)家優(yōu)勢(shì)持續(xù)滲透市場(chǎng)中。

視頻具有“重”數(shù)據(jù)的特點(diǎn),在海量數(shù)據(jù)的情況下,一方面對(duì)采集、存儲(chǔ)、傳輸和分發(fā)提出了極高的訴求,另一方面需要強(qiáng)大的智能化分析與處理能力?;诖?,百度智能云“云智一體”的全場(chǎng)景視頻技術(shù)中,“云”的部分以云邊端一體、異構(gòu)融合的基礎(chǔ)架構(gòu)提供先進(jìn)的云計(jì)算能力,“智”則以業(yè)界領(lǐng)先且全面的AI能力實(shí)現(xiàn)了對(duì)視頻語(yǔ)音、圖像、文字等多種信息的多模態(tài)智能分析、理解、生成等處理。

依托“云智一體”推出了視頻創(chuàng)作分發(fā)平臺(tái)和視聯(lián)網(wǎng)感知平臺(tái)。在消費(fèi)類(lèi)視頻方面,將采集到的各種結(jié)構(gòu)化信息、知識(shí)信息通過(guò)智能視頻云的手段,轉(zhuǎn)化成多媒體的信息進(jìn)行高效分發(fā)和傳播;而在產(chǎn)業(yè)類(lèi)視頻方面,將采集到的視頻轉(zhuǎn)變?yōu)榻Y(jié)構(gòu)化信息,通過(guò)提取獲得的信息,來(lái)幫助業(yè)務(wù)進(jìn)行高效的感知和決策。

“云智一體”的百度智能視頻云3.0究竟在技術(shù)上有什么獨(dú)到之處?

(智能視頻云3.0全景圖)

云:高效穩(wěn)定的基礎(chǔ)技術(shù)架構(gòu),打造強(qiáng)有力的輸出載體

為了更好地應(yīng)對(duì)已經(jīng)來(lái)到的海量視頻業(yè)務(wù)需求,智能視頻云3.0以云邊端一體的基礎(chǔ)技術(shù)架構(gòu)作為核心依托,進(jìn)一步拓展算力邊界,端到端、強(qiáng)穩(wěn)定、高性能的視頻云能力,幫助客戶(hù)快速實(shí)現(xiàn)應(yīng)用的落地與交付。

百度智能視頻云3.0的云能力主要表現(xiàn)在智能編碼、智感超清、實(shí)時(shí)音視頻通訊、低延時(shí)直播、視頻分發(fā)加速CDN等五大方面:

智能編碼: 基于百度AI深度學(xué)習(xí)技術(shù),通過(guò)深度學(xué)習(xí)網(wǎng)絡(luò)來(lái)提取視頻的特征,結(jié)合BD265生成智能編碼技術(shù)。

算法方面,依靠百度多年積累的技術(shù)優(yōu)勢(shì),通過(guò)60+算法的優(yōu)化,在質(zhì)量和效率、速度上取得最優(yōu)解。

效率方面,相比業(yè)界開(kāi)源的X265編碼器,在編碼速度有2-4倍的提升,同時(shí)節(jié)省30%的編碼碼率。

(智能編碼)

智感超清: 視頻體驗(yàn)的優(yōu)化是一項(xiàng)精細(xì)求精、永無(wú)止境的工作。百度智能視頻云3.0通過(guò)智能超分、智能畫(huà)質(zhì)增強(qiáng)、智能插幀、智能修復(fù)、智能HDR生成等技術(shù),在老片修復(fù)、真4K生成等典型應(yīng)用場(chǎng)景上大幅提升畫(huà)質(zhì)體驗(yàn)、彌補(bǔ)超高清內(nèi)容缺失,加速了超高清產(chǎn)業(yè)發(fā)展,相關(guān)技術(shù)在國(guó)際權(quán)威比賽中屢次奪冠,具體優(yōu)勢(shì)體現(xiàn)在:

超分辨率:通過(guò)多層級(jí)聯(lián)的U型神經(jīng)網(wǎng)絡(luò)架構(gòu),對(duì)視頻空間的分辨率進(jìn)行從粗到細(xì)的提升。

畫(huà)面去噪:基于無(wú)監(jiān)督去噪聲算法,擺脫了有監(jiān)督神經(jīng)網(wǎng)絡(luò)訓(xùn)練對(duì)于成對(duì)的噪聲與干凈圖像的依賴(lài);設(shè)計(jì)了可交互控制參數(shù),支持用戶(hù)調(diào)節(jié),增加了系統(tǒng)靈活性。

畫(huà)質(zhì)增強(qiáng):通過(guò)深度殘差神經(jīng)網(wǎng)絡(luò),將內(nèi)容特征提取與重建,不僅可以?xún)?yōu)化畫(huà)質(zhì)飽和度、還原壓縮視頻導(dǎo)致的失真,還能對(duì)ROI區(qū)域進(jìn)行區(qū)域增強(qiáng)和碼率分配優(yōu)化。

高幀率重制:依靠MEMC高幀率提升技術(shù)能力,通過(guò)對(duì)運(yùn)動(dòng)方向預(yù)判,據(jù)此進(jìn)行插幀,提升畫(huà)面流暢度與觀屏舒適度。

超高清編碼:采用CPU+GPU+ASIC的異構(gòu)加速計(jì)算框架,支持國(guó)產(chǎn)昆侖K200芯片,提升AI推理效率和超高清編碼效率,降低用戶(hù)成本,提升總體的生成效率。

(智感超清)

實(shí)時(shí)音視頻通訊: 依靠核心自研的多個(gè)算法,實(shí)現(xiàn)通訊順暢的超低延時(shí)互動(dòng)體驗(yàn),并分為如下幾個(gè)方面:

抗弱網(wǎng)支持方面:基于上/下行鏈路智能探測(cè)器,根據(jù)上下行網(wǎng)絡(luò)鏈路惡化程度因子,調(diào)整FEC、NACK、碼控、超清權(quán)重,選擇因子進(jìn)行抗弱網(wǎng)抖動(dòng)算法,使視頻抗弱網(wǎng)可達(dá)到60%,音頻80%。

AI能力方面:通過(guò)百度多年的AI技術(shù)積累,支持實(shí)時(shí)美顏、濾鏡、貼紙、AR特效,更多娛樂(lè)場(chǎng)景玩法,并提供人臉識(shí)別、語(yǔ)音識(shí)別等能力,適用于用于身份核驗(yàn)、學(xué)生狀態(tài)監(jiān)測(cè)等更多場(chǎng)景。

高質(zhì)量音視頻通話(huà)方面:通過(guò)大量音視頻場(chǎng)景數(shù)據(jù)AI模型訓(xùn)練,對(duì)音頻進(jìn)行3A優(yōu)化的同時(shí),并能通過(guò)智感超清支撐超高清畫(huà)質(zhì),自動(dòng)適配多分辨率,實(shí)現(xiàn)高質(zhì)量音視頻消息聊天。

性能指標(biāo)方面:為針對(duì)通信節(jié)點(diǎn)路由的選擇,優(yōu)化混沌神經(jīng)網(wǎng)絡(luò)算法規(guī)劃最短路徑、實(shí)現(xiàn)動(dòng)態(tài)平衡路由選擇,可使端到端延時(shí)穩(wěn)定收斂到200ms左右,并在單個(gè)節(jié)點(diǎn)故障時(shí),能自動(dòng)重建路由,保障server的可用性。依靠WHIP協(xié)議轉(zhuǎn)換裝置解決了傳統(tǒng)RTC通信server由于信令交互復(fù)雜、房間管理業(yè)務(wù)量大、數(shù)據(jù)庫(kù)操作頻繁等影響性能及大規(guī)模搞并發(fā)問(wèn)題,可支撐每個(gè)房間在線(xiàn)人數(shù)達(dá)百萬(wàn)級(jí)別。

端到端性能監(jiān)控方面:通過(guò)各端大量數(shù)據(jù)收集,依托百度智能云大數(shù)據(jù)分析,能精準(zhǔn)的定位問(wèn)題,對(duì)潛在的不可靠服務(wù)提前預(yù)警,讓潛在風(fēng)險(xiǎn)在萌芽狀態(tài)被解決,保障音視頻實(shí)時(shí)通信服務(wù)的高可用。

(實(shí)時(shí)音視頻通訊)

低延時(shí)直播: 采用了全鏈路SRT協(xié)議,可穩(wěn)定支撐千萬(wàn)級(jí)直播并發(fā)。關(guān)鍵特性包括:

卓越抗弱網(wǎng):自研mpegts數(shù)據(jù)格式封裝、支持SRT協(xié)議推拉流,將網(wǎng)絡(luò)丟包的可能性降到最低,有效改善弱網(wǎng)環(huán)境下的推流及觀看體驗(yàn)。

首屏秒開(kāi):CDN邊緣先將編碼參數(shù)信息發(fā)給播放器,播放器解析到編碼信息,待下個(gè)關(guān)鍵幀到達(dá)后即可快速播放。

協(xié)議兼容:實(shí)現(xiàn)多種視頻流協(xié)議的輸入與輸出, 基于SRT低延遲直播協(xié)議的上下行,能無(wú)縫接入LSS低延遲直播系統(tǒng),與主流直播分發(fā)協(xié)議HTTP-FLV/RTMP/HLS結(jié)合,視頻轉(zhuǎn)發(fā)場(chǎng)景更加靈活。

規(guī)模并發(fā):與HTTP-FLV支持的并發(fā)規(guī)模一致,支持千萬(wàn)級(jí)規(guī)模并發(fā)。

(低延時(shí)直播)

視頻分發(fā)基礎(chǔ)設(shè)施CDN: 擁有遍布全球1000+節(jié)點(diǎn)、100T帶寬儲(chǔ)備,以強(qiáng)大網(wǎng)絡(luò)基礎(chǔ)設(shè)施帶來(lái)極致視頻分發(fā)體驗(yàn)和效率。其中具有這幾大能力:

資源儲(chǔ)備的擴(kuò)展能力:通過(guò)云邊端一體,將資源的使用能力持續(xù)下沉,與邊緣計(jì)算的資源深度結(jié)合,做到流量加速的同時(shí),也能做到算力的加速。

近似實(shí)時(shí)的智能調(diào)度能力:具備全網(wǎng)流量與質(zhì)量的感知系統(tǒng),能實(shí)現(xiàn)近似實(shí)時(shí)的智能調(diào)度。

分場(chǎng)景的協(xié)議調(diào)優(yōu)能力:通過(guò)質(zhì)量感知系統(tǒng)Bcats、節(jié)點(diǎn)多級(jí)緩存優(yōu)化、分場(chǎng)景協(xié)議棧優(yōu)化滿(mǎn)足客戶(hù)多場(chǎng)景的質(zhì)量要求,節(jié)點(diǎn)間使用私有協(xié)議加速,提升加速體驗(yàn)并保證數(shù)據(jù)安全。

快速便捷的可編程能力:通過(guò)易用的可編程邊緣運(yùn)行環(huán)境EJS,用戶(hù)可自主實(shí)現(xiàn)個(gè)性化業(yè)務(wù)控制邏輯,應(yīng)對(duì)業(yè)務(wù)變化的敏捷效率挑戰(zhàn)。

(視頻分發(fā)基礎(chǔ)設(shè)施CDN)

此外在全民拍攝、泛直播時(shí)代背景下,針對(duì)輕量化美顏、智能剪輯、低碼率高品質(zhì)推流、沉浸式播放體驗(yàn)等音視頻終端業(yè)務(wù)的基礎(chǔ)需求。百度智能云的視頻云終端能力矩陣,面向不同業(yè)務(wù),提供豐富的SDK解決方案。

受益于終端工程化技術(shù)演進(jìn),視頻云終端框架正在經(jīng)歷從模塊化向智能化演進(jìn),平臺(tái)接入層重點(diǎn)解決多SDK的復(fù)用和數(shù)據(jù)管線(xiàn)組合,提高內(nèi)部協(xié)同效率同時(shí),提升產(chǎn)品按需交付的靈活度。輔以橫貫?zāi)K間的數(shù)據(jù)監(jiān)控,運(yùn)行質(zhì)量一目了然??缙脚_(tái)層重點(diǎn)解決多終端數(shù)據(jù)處理一致性體驗(yàn),基于生產(chǎn)消費(fèi)模型,在終端算力的不斷釋放的情況下,將自研算法抽象成獨(dú)立算子(例如PaddleLite的人臉?biāo)惴?,經(jīng)過(guò)管線(xiàn)中不同處理節(jié)點(diǎn),最終將數(shù)據(jù)消費(fèi)成業(yè)務(wù)效果(如美顏等)。終端數(shù)據(jù)高效率的處理,離不開(kāi)平臺(tái)引擎層提供的持續(xù)動(dòng)力。終端并行計(jì)算技術(shù)讓CPU與GPU在時(shí)間和空間上得到更好的協(xié)同。

(All In One能力矩陣)

智:AI能力讓視頻變得更加“聰明”

伴隨著視頻智能化的大潮,AI技術(shù)在視頻行業(yè)轉(zhuǎn)型升級(jí)中作用日益凸顯。依托百度云智一體的獨(dú)特優(yōu)勢(shì),為滿(mǎn)足產(chǎn)業(yè)對(duì)場(chǎng)景的定制化應(yīng)用需求,百度智能視頻云3.0全景圖的AI技術(shù)能力,基于百度自研業(yè)界最大包含了5500億海量知識(shí)的多元異構(gòu)知識(shí)圖譜,在視頻的智能理解分析、視頻智能生產(chǎn)與智能交互生成等方面充當(dāng)了平臺(tái)化與場(chǎng)景化的創(chuàng)新應(yīng)用的技術(shù)基石,助力智能視頻從“刀耕火種”走向“精耕細(xì)作”。

(智能視頻云3.0全景圖的AI技術(shù)能力)

智能理解分析

通過(guò)圖像、聲音、場(chǎng)景、人物、文本描述等信息,進(jìn)行視頻智能分析、內(nèi)容智能審核、智能檢索。

視覺(jué)模態(tài)理解框架的升級(jí): 提出了一個(gè)“預(yù)訓(xùn)練+小型化+定制化”新的框架。該框架基于飛槳提供的大規(guī)模分類(lèi)框架、PaddleSlim等組件,有效應(yīng)對(duì)理解任務(wù)的復(fù)雜性,解決場(chǎng)景數(shù)據(jù)的稀缺性。在人臉任務(wù)上,全場(chǎng)景下識(shí)別相對(duì)錯(cuò)誤率下降40%。在其他一些垂類(lèi)任務(wù)上,訓(xùn)練的標(biāo)注量可以減少40%以上。

知識(shí)增強(qiáng)的視頻理解: 基于知識(shí)的視頻語(yǔ)義理解技術(shù),充分利用豐富而全面的知識(shí)圖譜提升視頻理解效果。該技術(shù)通過(guò)對(duì)視覺(jué)、語(yǔ)音、文本的多模態(tài)內(nèi)容進(jìn)行解析與融合,再利用知識(shí)關(guān)聯(lián)技術(shù)建立與視頻理解知識(shí)圖譜的連接,并根據(jù)背景知識(shí)以及知識(shí)計(jì)算與推理技術(shù),實(shí)現(xiàn)對(duì)視頻的深度語(yǔ)義理解。這項(xiàng)技術(shù)打破了在傳統(tǒng)技術(shù)中,視頻內(nèi)容分析基于感知的局限性,實(shí)現(xiàn)對(duì)視頻的深度結(jié)構(gòu)化語(yǔ)義理解,大幅提升視頻理解的效果。

(智能理解分析)

視頻智能生產(chǎn)

通過(guò)圖文資訊、數(shù)據(jù)、圖集等多種內(nèi)容載體,進(jìn)行智能編輯與智能創(chuàng)作。

視覺(jué)模態(tài)創(chuàng)新豐富的能力: 可將多種內(nèi)容載體向視頻形式進(jìn)行自動(dòng)轉(zhuǎn)換,提升傳播效率。目前百度智能云支持多種視頻生產(chǎn)方式,包括圖文,數(shù)據(jù),圖集等轉(zhuǎn)視頻,長(zhǎng)視頻拆短視頻及Video-in等生產(chǎn)形式。

知識(shí)增強(qiáng)的視頻生產(chǎn): 基于知識(shí)圖譜的視頻生產(chǎn)技術(shù)是百度智能云視頻生產(chǎn)的亮點(diǎn)技術(shù)。

其中,借助知識(shí)圖譜的海量事實(shí),可生產(chǎn)關(guān)于實(shí)體屬性、關(guān)系的各種知識(shí)類(lèi)、趣味性的盤(pán)點(diǎn)視頻;通過(guò)對(duì)影視劇的多模語(yǔ)義理解,可將某一類(lèi)場(chǎng)景鏡頭進(jìn)行聚合,呈現(xiàn)作品的精彩片段。

(脈絡(luò)視頻生產(chǎn))

事件脈絡(luò)生成則是基于知識(shí)圖譜中一項(xiàng)核心技術(shù)能力?;诙噍唵?wèn)答技術(shù),可達(dá)到事件監(jiān)測(cè)和事件論元抽取的能力;再通過(guò)事件識(shí)別、聚類(lèi)、歸一等技術(shù)總體構(gòu)建事件脈絡(luò)生成技術(shù),可以實(shí)現(xiàn)對(duì)客觀事件的動(dòng)態(tài)理解。基于事件脈絡(luò)能力,可生成關(guān)于熱點(diǎn)事件來(lái)龍去脈的報(bào)道視頻。

視頻交互與生成

智能視頻云擁有豐富的技術(shù)能力,全新構(gòu)建了交互與生成AI能力矩陣,從AR特效等技術(shù)到新型的驅(qū)動(dòng)特效,風(fēng)格特效等,再到多模態(tài)生成,支持各種各樣的泛娛樂(lè)場(chǎng)景的視頻交互與生成需求。

(視頻交互與生成)

視覺(jué)模態(tài)的任意風(fēng)格化: 基于元學(xué)習(xí)、多風(fēng)格Adaptation技術(shù)、Few-shot Learning等技術(shù),可根據(jù)需求快速定制不同風(fēng)格的高質(zhì)量視頻。

多模態(tài)生成的數(shù)字人: 通過(guò)多模態(tài)技術(shù),結(jié)合虛擬數(shù)字人形象與語(yǔ)音合成、唇動(dòng)等生成技術(shù),可低成本制作形象豐富靈動(dòng)、線(xiàn)上線(xiàn)下多端覆蓋的的數(shù)字人,不僅交互自然、聲音動(dòng)聽(tīng),還能夠適配多種業(yè)務(wù)場(chǎng)景需求。

目前數(shù)字人的應(yīng)用載體較為廣泛,除了PC端以及手持移動(dòng)設(shè)備以外,百度智能云自研了智能云屏、智能云席等數(shù)字人的新載體。為了更好的模擬真人交互,在云屏、云席等數(shù)字人載體上集成定制攝像頭以檢測(cè)面部動(dòng)態(tài),設(shè)置了的扇形拾音區(qū)域采集實(shí)音,這樣可以更好的識(shí)別主說(shuō)話(huà)人,從而解決“雞尾酒會(huì)問(wèn)題”。

今年兩會(huì)期間百度智能云與央視網(wǎng)合作推出虛擬數(shù)字人小C,進(jìn)行“兩會(huì)C+真探”的虛擬記者采訪(fǎng)項(xiàng)目,一時(shí)收到市場(chǎng)廣泛關(guān)注。

(虛擬數(shù)字人小C)

雙平臺(tái):便捷、高效、面向全場(chǎng)景的應(yīng)用平臺(tái)

基于云智一體,百度智能視頻云3.0的視頻創(chuàng)作分發(fā)平臺(tái)和視聯(lián)網(wǎng)感知平臺(tái)面向不同場(chǎng)景應(yīng)用提供一站式服務(wù)和平臺(tái)化支撐。

視頻創(chuàng)作分發(fā)平臺(tái)面向泛互聯(lián)網(wǎng)、泛媒體行業(yè),聚焦工作流和媒介資源管理,覆蓋視頻接入、生產(chǎn)、處理、審核分析和個(gè)性化推薦分發(fā)全流程。核心是媒資管理和工作流,通過(guò)媒資結(jié)構(gòu)化處理和多摸精準(zhǔn)搜索,媒資利用率可提升40%,盤(pán)活媒資,最大發(fā)揮內(nèi)容價(jià)值。與傳統(tǒng)采編發(fā)管理軟件的區(qū)別在于,利用AI能力對(duì)數(shù)據(jù)進(jìn)行分析和理解,實(shí)現(xiàn)盤(pán)活數(shù)據(jù),加快數(shù)據(jù)流動(dòng),提高媒資數(shù)據(jù)的利用率;工作流則提供了可視化控制臺(tái),用戶(hù)可以通過(guò)簡(jiǎn)單靈活的配置編排視頻的處理流程,更靈活的應(yīng)對(duì)個(gè)性化業(yè)務(wù)需求,并適配移動(dòng)化、多終端、多形態(tài)業(yè)務(wù)場(chǎng)景。

(視頻創(chuàng)作分發(fā)平臺(tái))

視聯(lián)網(wǎng)感知平臺(tái)面向傳統(tǒng)產(chǎn)業(yè),對(duì)視頻端設(shè)備和泛視頻數(shù)據(jù)流進(jìn)行統(tǒng)一連接、分析和管理,實(shí)現(xiàn)通用的面向生產(chǎn)、控制和治理等場(chǎng)景的鏈接、鏈感、鏈管的基礎(chǔ)平臺(tái)。核心是對(duì)泛視頻設(shè)備和泛視頻數(shù)據(jù)流的統(tǒng)一連接、分析和管理,在企業(yè)生產(chǎn)、園區(qū)管理、城市和社會(huì)治理方面能發(fā)揮重要價(jià)值。

(視聯(lián)網(wǎng)感知平臺(tái))

三大場(chǎng)景 :云智一體智能視頻云的訴求

為了更好聚焦產(chǎn)業(yè)應(yīng)用中的痛點(diǎn)與難點(diǎn),為技術(shù)深入產(chǎn)業(yè)智能化轉(zhuǎn)型升級(jí)發(fā)揮更大價(jià)值。在百度智能視頻云的這張全景圖3.0,通過(guò)基于云智一體的兩大平臺(tái),打造泛互聯(lián)網(wǎng)、泛媒體和泛產(chǎn)業(yè)方向的智能視頻方案與應(yīng)用案例,覆蓋互動(dòng)娛樂(lè)、內(nèi)容生產(chǎn)、智能分析、遠(yuǎn)程實(shí)時(shí)通訊、生產(chǎn)管理、安全管理等場(chǎng)景。

泛媒體場(chǎng)景 :百度智能視頻技術(shù)通過(guò)媒體大腦平臺(tái),賦能產(chǎn)業(yè)三大升級(jí),打造智媒產(chǎn)業(yè)互聯(lián)網(wǎng)生態(tài)圈。智能視頻云將云智一體的視頻技術(shù)和媒介中臺(tái)里的媒體AI中臺(tái)、媒體知識(shí)中臺(tái)、媒體經(jīng)營(yíng)中臺(tái)相結(jié)合,從智能媒資管理、智能內(nèi)容生產(chǎn)、智慧媒體經(jīng)營(yíng)三個(gè)層面解決智能視頻云技術(shù)在多種場(chǎng)景下的需求。

媒體AI中臺(tái):通過(guò)智能內(nèi)容匯聚、智能內(nèi)容生產(chǎn)、智能媒資一體,全面覆蓋媒體內(nèi)容產(chǎn)出的測(cè)、采、編、審、發(fā)全流程。

媒體知識(shí)中臺(tái):通過(guò)多元知識(shí)圖譜,把內(nèi)容資產(chǎn)知識(shí)化、資產(chǎn)化。將媒體自研和采購(gòu)產(chǎn)生大量媒體資源,做標(biāo)簽索引,形成一種資源。

媒體經(jīng)營(yíng)中臺(tái):所有內(nèi)容生產(chǎn)都是為了消費(fèi),都是為了觸達(dá)用戶(hù),實(shí)現(xiàn)傳播的效果,或者商業(yè)的變現(xiàn),百度有多元的媒體內(nèi)容經(jīng)營(yíng)分發(fā)這樣的經(jīng)驗(yàn),我們也形成媒體的智能經(jīng)營(yíng)的一套中臺(tái)體系。

(百度智能云泛媒體產(chǎn)品和解決方案全景圖)

泛互聯(lián)網(wǎng)場(chǎng)景 :內(nèi)容和用戶(hù)是互聯(lián)網(wǎng)企業(yè)增長(zhǎng)核心要素,百度智能視頻技術(shù)助力優(yōu)秀內(nèi)容創(chuàng)作者,深入垂類(lèi)賽道,用AI技術(shù)幫助客戶(hù)降低碼率提升畫(huà)質(zhì),以低成本分發(fā)的方式,精準(zhǔn)觸達(dá)到目標(biāo)受眾群,形成裂變?cè)鲩L(zhǎng)。

智能小視頻一站式解決方案:提供全套智能視頻拍攝工具,在拍攝器上提供100+的AR技術(shù)拍攝編輯玩法;通過(guò)一站式工作流,直接將拍攝到的視頻傳輸至存儲(chǔ)系統(tǒng),后臺(tái)流式處理視頻、審核發(fā)布并做分發(fā)加速;開(kāi)放APP樣本及服務(wù)端部分代碼給客戶(hù),用戶(hù)可通過(guò)自身需求定制開(kāi)發(fā),實(shí)現(xiàn)快速打造視頻應(yīng)用。

全鏈路編解碼優(yōu)化解決方案:基于采集端的BD265方案,支持兼容軟硬編碼的能力,相比硬編265,節(jié)省了50%碼率。在服務(wù)端,結(jié)合BD265以及智感超清AI能力,提升畫(huà)質(zhì)降低碼率,節(jié)省用戶(hù)的傳輸?shù)膸捄痛鎯?chǔ)的成本。在分發(fā)端,提供實(shí)時(shí)視頻增強(qiáng)的SDK技術(shù),只需下發(fā)低碼率視頻,就可以將整個(gè)視頻的畫(huà)質(zhì)優(yōu)化提升。

新零售的直播SaaS解決方案:通過(guò)一鍵式的導(dǎo)購(gòu)直播能力,提升客戶(hù)的觸達(dá)率,實(shí)現(xiàn)線(xiàn)上的營(yíng)銷(xiāo)變現(xiàn),裂變引流,得到更多的轉(zhuǎn)化;并提供了分銷(xiāo)系統(tǒng),實(shí)現(xiàn)訂單的追蹤,保證用戶(hù)的歸屬和轉(zhuǎn)化;同時(shí)具有數(shù)據(jù)分析能力,幫助客戶(hù)做出直播決策。

在線(xiàn)社交解決方案:支持IM聊天,實(shí)時(shí)音視頻通話(huà),以及虛擬AI技術(shù),通過(guò)三位一體的技術(shù)支撐,幫助用戶(hù)打造文字、語(yǔ)音、視頻內(nèi)容等社交的屬性。并且可以使用動(dòng)畫(huà)制作功能,讓用戶(hù)去打造獨(dú)一無(wú)二的虛擬形象,通過(guò)真人實(shí)時(shí)驅(qū)動(dòng),構(gòu)造定制化IP。

(百度智能云泛互聯(lián)網(wǎng)產(chǎn)品和解決方案全景圖)

泛產(chǎn)業(yè)場(chǎng)景 :百度智能視頻云以云邊端一體為基礎(chǔ)架構(gòu),平臺(tái)+數(shù)據(jù)主導(dǎo),解決業(yè)務(wù)對(duì)接系統(tǒng)和數(shù)據(jù)平臺(tái)化的需求。

智能技術(shù):通過(guò)百度全棧式自主人工智能平臺(tái),提供多場(chǎng)景的智能視覺(jué)應(yīng)用,核心為識(shí)別常見(jiàn)的人臉、人體、車(chē)輛等具有豐富的特征值信息,同時(shí)提供豐富的庫(kù)內(nèi)的查詢(xún)能力。在各類(lèi)業(yè)務(wù)場(chǎng)景中,覆蓋比如交通、政府、能源、城市治理和農(nóng)林等場(chǎng)景,此外還具有視頻修復(fù)能力,對(duì)提升整個(gè)視頻的理解能力有著極大的幫助。

云邊端架構(gòu):在端側(cè),為快捷獲取數(shù)據(jù),部署了主要的算力和算子。邊側(cè),通過(guò)閉環(huán)的能力,可以實(shí)現(xiàn)快速的邊緣的業(yè)務(wù)場(chǎng)景的整個(gè)閉環(huán)。云側(cè),通過(guò)關(guān)鍵信息、關(guān)鍵數(shù)據(jù)傳送到云端,通過(guò)數(shù)據(jù)匯集,加強(qiáng)云計(jì)算和平臺(tái)的能力,為業(yè)務(wù)提供服務(wù),實(shí)現(xiàn)更多的業(yè)務(wù)場(chǎng)景的應(yīng)用。

開(kāi)放能力:在端側(cè),開(kāi)放端云協(xié)同的SDK和AI的SDK,實(shí)現(xiàn)統(tǒng)一管理,同時(shí)在公網(wǎng)環(huán)境下,實(shí)現(xiàn)低延時(shí)效果;平臺(tái)側(cè),開(kāi)放所有模塊,實(shí)現(xiàn)SaaS和PaaS的結(jié)構(gòu),用戶(hù)可以更快捷的利用業(yè)務(wù)需求,利用PaaS能力快速迭代,提升整個(gè)SaaS的開(kāi)發(fā)效率。應(yīng)用方面,推出智能全感知系統(tǒng),利用云邊端一體的技術(shù)架構(gòu),可以快速實(shí)現(xiàn)業(yè)務(wù)層的開(kāi)發(fā)。

憑借“云智一體”的獨(dú)特優(yōu)勢(shì),除智能視頻方向以外,百度智能云已在智能制造、智慧金融、智慧城市、智慧能源、智慧醫(yī)療等領(lǐng)域擁有領(lǐng)先產(chǎn)品、技術(shù)和解決方案,與多家行業(yè)翹楚合作推進(jìn)企業(yè)數(shù)字化、智能化升級(jí)。百度將持續(xù)以深耕多年的AI技術(shù)能力深入各行各業(yè),夯實(shí)智能化基礎(chǔ),助力產(chǎn)業(yè)智能化升級(jí)實(shí)現(xiàn)新突破。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
ai技術(shù)
百度智能云

相關(guān)文章

  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學(xué)家峰會(huì)之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國(guó)際院士科創(chuàng)中心主辦,中國(guó)投資協(xié)會(huì)能源投資專(zhuān)業(yè)委員會(huì)、溫港院士科創(chuàng)中心承辦,中國(guó)電工技術(shù)學(xué)會(huì)、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會(huì)提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標(biāo)簽:
    ai技術(shù)
  • 王通:未來(lái)個(gè)人創(chuàng)業(yè)的十個(gè)機(jī)會(huì)

    個(gè)人創(chuàng)業(yè)需要啟動(dòng)成本低、無(wú)需龐大團(tuán)隊(duì)、可快速驗(yàn)證、能利用個(gè)人技能或資源。這里分享適合個(gè)人創(chuàng)業(yè)的十個(gè)機(jī)會(huì)一.AI內(nèi)容優(yōu)化與本地化服務(wù)·做什么:幫助企業(yè)或個(gè)人利用AI工具(如GPT-4,Midjourney)優(yōu)化內(nèi)容生產(chǎn)流程。例如,為跨境電商撰寫(xiě)多語(yǔ)言產(chǎn)品描述,為小紅書(shū)博主生成爆款文案,為小公司制作營(yíng)銷(xiāo)

  • 百度智能云PaddleOCR 3.1正式發(fā)布:關(guān)鍵能力支持MCP

    百度AI團(tuán)隊(duì)今日正式推出PaddleOCR3.1版本,以突破性的多語(yǔ)言組合識(shí)別(MultilingualCompositionPerception,MCP)技術(shù)為核心,徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級(jí)標(biāo)志著OCR領(lǐng)域首次實(shí)現(xiàn)對(duì)同一文檔內(nèi)任意混合語(yǔ)言文本的精準(zhǔn)識(shí)別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場(chǎng)

    標(biāo)簽:
    ai智能
    ai技術(shù)
  • AI工具導(dǎo)航網(wǎng)站,未來(lái)的發(fā)展前景怎么樣?

    導(dǎo)航網(wǎng)站的崛起:從信息過(guò)載到精準(zhǔn)觸達(dá)隨著全球AI工具數(shù)量爆發(fā)式增長(zhǎng)(2025年已超數(shù)萬(wàn)款),用戶(hù)面臨前所未有的選擇困境。傳統(tǒng)搜索引擎的“關(guān)鍵詞-鏈接”模式難以應(yīng)對(duì)工具篩選的場(chǎng)景需求,垂直化、場(chǎng)景化的AI導(dǎo)航網(wǎng)站應(yīng)運(yùn)而生。這類(lèi)平臺(tái)通過(guò)聚合、評(píng)測(cè)、分類(lèi)與推薦四重機(jī)制,將分散的工具資源整合為結(jié)構(gòu)化入口。例

  • 微信AI搜索被指“強(qiáng)行開(kāi)盒”:名字成了數(shù)據(jù)入口,騰訊回應(yīng)“僅用公開(kāi)信息”

    當(dāng)微信公眾號(hào)文章中出現(xiàn)一個(gè)人的名字,它會(huì)自動(dòng)變成藍(lán)色鏈接,點(diǎn)擊即可查看AI生成的“個(gè)人簡(jiǎn)歷”——這一微信新功能讓不少用戶(hù)感到被“扒光”在互聯(lián)網(wǎng)上。近日,微信新上線(xiàn)的“AI搜索”功能陷入隱私泄露爭(zhēng)議漩渦。多位網(wǎng)友在社交平臺(tái)反映,當(dāng)微信公眾號(hào)推文中出現(xiàn)本人姓名時(shí),名字會(huì)自動(dòng)變?yōu)樗{(lán)色超鏈接,點(diǎn)擊即可瀏覽由

    標(biāo)簽:
    ai技術(shù)
    ai搜索
  • GDPS2025賽場(chǎng)直擊!開(kāi)普勒大黃蜂助力華理斬獲搬運(yùn)賽項(xiàng)桂冠

    12月12日-14日,2025全球開(kāi)發(fā)者先鋒大會(huì)暨國(guó)際具身智能技能大賽(GDPS2025)于上海張江科學(xué)會(huì)堂舉行,大會(huì)以具身智能競(jìng)技為核心,融合了技術(shù)比拼、產(chǎn)業(yè)展示與科普體驗(yàn),為全球觀眾呈現(xiàn)出具身智能的現(xiàn)在與未來(lái)。上海開(kāi)普勒機(jī)器人有限公司(以下簡(jiǎn)稱(chēng)"開(kāi)普勒機(jī)器人")攜明星產(chǎn)品K2"大黃蜂"亮相,并參

    標(biāo)簽:
    GDPS
    2025
  • 弈動(dòng) Dynamic·數(shù)智躍遷 博弈無(wú)界|2025TechWorld智慧安全大會(huì)在京召開(kāi)

    在數(shù)字化與智能化深度交織的時(shí)代浪潮中,安全的邊界不斷延展,技術(shù)的演進(jìn)正引領(lǐng)產(chǎn)業(yè)邁向新一輪變革。10月24日,以“弈動(dòng)Dynamic·數(shù)智躍遷博弈無(wú)界”為主題的2025TechWorld智慧安全大會(huì)在北京盛大召開(kāi)。來(lái)自國(guó)家部委、院士學(xué)者、高??蒲袡C(jī)構(gòu)和企業(yè)的權(quán)威專(zhuān)家與業(yè)界精英齊聚北京,共議AI安全、數(shù)

    標(biāo)簽:
    弈動(dòng)
  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學(xué)家峰會(huì)之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國(guó)際院士科創(chuàng)中心主辦,中國(guó)投資協(xié)會(huì)能源投資專(zhuān)業(yè)委員會(huì)、溫港院士科創(chuàng)中心承辦,中國(guó)電工技術(shù)學(xué)會(huì)、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會(huì)提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標(biāo)簽:
    ai技術(shù)
  • AI云“分野”:阿里云們“賣(mài)鏟”,火山引擎奇襲“MaaS”

    AI云“分野”:阿里云們“賣(mài)鏟”,火山引擎奇襲“MaaS”

    標(biāo)簽:
    阿里巴巴
  • 未來(lái)5年,中國(guó)AI的“大洗牌”和“內(nèi)循環(huán)”

    我覺(jué)得我們AI的目標(biāo)是:從芯片設(shè)計(jì)到軟件生態(tài),全鏈路自主開(kāi)發(fā),建立可控的世界級(jí)AI體系。所以這是俺對(duì)未來(lái)5年中國(guó)AI圈的展望和判斷。(1)2026年,英偉達(dá)造車(chē)、國(guó)產(chǎn)開(kāi)車(chē)26年國(guó)產(chǎn)芯片會(huì)在推理和垂直場(chǎng)景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會(huì)以軟件彌補(bǔ)硬件不足,所以訓(xùn)練和推理分開(kāi),訓(xùn)練就

  • H20芯片開(kāi)賣(mài)即叫停,英偉達(dá)如何解圍?

    文/道哥在深陷“后門(mén)”風(fēng)波、接受網(wǎng)信辦問(wèn)詢(xún)之后,英偉達(dá)的“特供版”H20芯片,又有了新消息。近日,美國(guó)科技媒體《TheInformation》援引知情人士消息稱(chēng),英偉達(dá)已悄然向其關(guān)鍵供應(yīng)商——包括負(fù)責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI

    標(biāo)簽:
    英偉達(dá)

編輯推薦