1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

容聯(lián)“擴容”,走出AI視覺場景落地之路

 2020-12-10 18:11  來源:互聯(lián)網(wǎng)  我來投稿 撤稿糾錯

  阿里云優(yōu)惠券 先領(lǐng)券再下單

AI席卷百業(yè),作為AI時代的兩個主要入口,智能語音產(chǎn)業(yè)已經(jīng)進(jìn)入爆發(fā)期,計算機視覺在新基建的推動下正在成為AI落地規(guī)模最大、應(yīng)用最廣的領(lǐng)域。

在語音和文本智能領(lǐng)域,無論是面向公有云市場的七陌云客服,還是面向大中型機構(gòu)的容CC,容聯(lián)一直在引領(lǐng)行業(yè)創(chuàng)新,構(gòu)建了基于智能客服、智能聯(lián)絡(luò)中心的商業(yè)閉環(huán)。

在視覺領(lǐng)域,容聯(lián)又是如何在原有能力上做延伸和商業(yè)化落地的? 近日,CPS中安網(wǎng)對容聯(lián)云通訊AI視覺解決方案總監(jiān)陳開仡進(jìn)行了采訪,并關(guān)于通訊服務(wù)、AI技術(shù)、智能化視頻監(jiān)控等話題進(jìn)行了交流與探討。以下為訪談內(nèi)容:

Q:容聯(lián)云通訊的核心技術(shù)和產(chǎn)品優(yōu)勢主要集中在哪些方面?容聯(lián)提出的視覺智能服務(wù)與傳統(tǒng)視頻監(jiān)控的區(qū)別是哪些?

陳開仡: 當(dāng)語音和文本、視頻智能化在通訊業(yè)務(wù)中的應(yīng)用已經(jīng)大量普及的時候,容聯(lián)意識到當(dāng)下市場對于圖像識別具有大量的需求,因此容聯(lián)開始了計算機視覺(CV)的調(diào)研和研發(fā)。

由于CV與NLP深度學(xué)習(xí)技術(shù)上具有相通性,并且容聯(lián)擁有NLP引擎相關(guān)技術(shù)的積累,因此迅速掌握了CV場景的相關(guān)技術(shù)。

容聯(lián)的優(yōu)勢在于針對特定場景的數(shù)據(jù)進(jìn)行增強處理,將AI和傳統(tǒng)技術(shù)結(jié)合,以及前沿技術(shù)工程化的能力。

比如說準(zhǔn)確率,以智慧工地為例,容聯(lián)的“慧眼”視覺分析平臺可結(jié)合工地復(fù)雜現(xiàn)場做全方面檢測,做安全帽佩戴檢測時容聯(lián)產(chǎn)品準(zhǔn)確率可以超過90%。

AI算法極度依賴數(shù)據(jù),但是很多情況下有效的數(shù)據(jù)采集又比較難,容聯(lián)自有的數(shù)據(jù)增強處理技術(shù)可以在素材比較少的情況下獲得比較好的效果。

深度學(xué)習(xí)技術(shù)十分依賴訓(xùn)練數(shù)據(jù),且深度學(xué)習(xí)輸出結(jié)果中一般都有“閾值”限制,實際應(yīng)用中,很難設(shè)定適用于所有場景的統(tǒng)一閾值。

目前AI技術(shù)在落地過程中仍然受到數(shù)據(jù)量、數(shù)據(jù)質(zhì)量、標(biāo)注成本、數(shù)據(jù)域變化等問題的制約,單純依靠深度學(xué)習(xí)模型難以解決復(fù)雜場景下的實際CV問題。

容聯(lián)具備一系列針對實際應(yīng)用場景的工程化優(yōu)化手段,包括圖像的時序分析機制、檢測目標(biāo)屬性過濾機制、目標(biāo)跟蹤及ReID機制等,提高算法在落地應(yīng)用時的精度。

除了技術(shù)上的壁壘,容聯(lián)產(chǎn)品一個重要的壁壘還是其在行業(yè)中的積累,因為做某個行業(yè)的視頻識別本質(zhì)上就是還是拼行業(yè)數(shù)據(jù)的積累、以及對行業(yè)的理解力。實際操作中,準(zhǔn)確洞悉行業(yè)痛點是一個周期很長且很重的事情。

另外關(guān)于視覺智能服務(wù)與傳統(tǒng)視頻監(jiān)控的區(qū)別,傳統(tǒng)技術(shù)的一般特點是通用性較強,容聯(lián)提出的視覺智能服務(wù)結(jié)合深度學(xué)習(xí)后,可在傳統(tǒng)視頻監(jiān)控的基礎(chǔ)上,得到神經(jīng)網(wǎng)絡(luò)模型輸出的具有語義信息的結(jié)果,在保持通用性的同時提升精度。

例如,目標(biāo)跟蹤場景,利用深度學(xué)習(xí)檢測圖像中特定種類物體位置,結(jié)合傳統(tǒng)背景建模、幀差法、光流法等,達(dá)到通用性與專用性的平衡協(xié)調(diào)。

Q:容聯(lián) CV 的商業(yè)化落地聚焦在哪些行業(yè)?這些行業(yè)關(guān)注的重點是什么,解決了什么問題, 提升了什么價值?

陳開仡 :目前容聯(lián)聚焦的行業(yè)有智慧社區(qū)、加油站、化工、城管、衛(wèi)監(jiān)、明廚亮灶等行業(yè),這些行業(yè)的重點各有不同。

以監(jiān)控場景為例,50個攝像頭,每天24小時,產(chǎn)生的視頻量1200小時,一個月就是36000小時。即使監(jiān)控崗位人員三班倒也無法做到100%覆蓋,期間很容易漏過一些突發(fā)事件,事發(fā)后再去追溯會很困難。

再比如制造業(yè)工業(yè)產(chǎn)線場景,工人有規(guī)定的操作規(guī)范,規(guī)定的位置,通常會有監(jiān)管人員進(jìn)行監(jiān)督。但是產(chǎn)線很長,又在不停運動,監(jiān)管人員很難覆蓋全部工位進(jìn)行督導(dǎo)。產(chǎn)品因操作不當(dāng)產(chǎn)生的瑕疵會直接影響用戶評價,對企業(yè)造成不良的影響。

我們通過智慧視覺算法,對以上行業(yè)的關(guān)鍵場景進(jìn)行智能的監(jiān)管,提升了管理的效率、覆蓋率,也提高了安全管控水平,同時降低了風(fēng)險并且降低了監(jiān)管成本。

Q:在這個市場上有做硬件的廠商,有做整體解決方案,有圍繞最終用戶的系統(tǒng)集成商,容聯(lián)跟產(chǎn)業(yè)上下游的廠商的區(qū)別在哪里?有哪些合作?

陳開仡 :容聯(lián)采用的是AI能力+垂直行業(yè)+服務(wù)的模式,并且在多個領(lǐng)域都有大客戶積累,善于深挖用戶場景,發(fā)現(xiàn)痛點;單個用戶的痛點可能是行業(yè)痛點,針對痛點進(jìn)行定制化方案,將方案沉淀為行業(yè)方案,提升整體行業(yè)智能化水平是容聯(lián)的目標(biāo)。

另外容聯(lián)的產(chǎn)品設(shè)計秉承松耦合原則,模塊之間支持靈活的拆分重組,可以單獨提供,或跟上下游廠商產(chǎn)品進(jìn)行靈活融合,根據(jù)客戶的需求進(jìn)行方案的定制。

Q:了解到容聯(lián)的視覺算法商城很豐富,現(xiàn)在還有正在挖掘的場景和算法,容聯(lián)未來還關(guān)注到哪些是沒有被開發(fā)的行業(yè)需求?是否可以簡單談一下未來趨勢。

陳開仡 :目前還有一些行業(yè)的需求還未被開發(fā),例如衛(wèi)監(jiān)、教育、國土資源、軍工、港務(wù)、物流等等。

關(guān)于未來趨勢的預(yù)測從技術(shù)角度來講:一個值得關(guān)注的未來趨勢是從識別到理解,套用古人的說法就是從知其然到知其所以然。

過去十多年,計算機視覺在識別方面取得了顯著的進(jìn)展,但是現(xiàn)在僅僅進(jìn)行識別遠(yuǎn)遠(yuǎn)不是我們所期望的,或者說只是邁出了智能化的第一步。

僅僅有結(jié)果對企業(yè)對行業(yè)的價值仍舊有限,可以對結(jié)果進(jìn)行解釋,價值會更大。把物體和物體,物體和環(huán)境的聯(lián)系建立起來,有了這樣的從基本屬性到對象直至環(huán)境的關(guān)系,就有可能實現(xiàn)從知其然到知其所以然。

未來最重要的趨勢就是從無需知識支撐的識別到需要知識支撐的理解,做到知識圖譜的效果,或者可以稱之為“計算機視覺圖譜”。

從市場規(guī)模角度而言:目前計算機視覺行業(yè)增速持續(xù)保持較高的增長趨勢,深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)技術(shù)的推動著計算機視覺技術(shù),同時也驅(qū)動著整個人工智能行業(yè)的迅速發(fā)展,計算機視覺技術(shù)已在各行各業(yè)有著舉足輕重的作用。

伴隨著技術(shù)成熟度提高,硬件性能的飛速提升,人臉識別、物體識別、工序識別、復(fù)雜場景識別等分類、分割算法不算提升精度,未來將有更多的場景能夠應(yīng)用計算機視覺技術(shù),計算機視覺企業(yè)應(yīng)在強化技術(shù)打造的前提下,發(fā)掘更多垂直領(lǐng)域需求,解決企業(yè)痛點。

Q:安防行業(yè)受智能化、信息化技術(shù)影響,邊界逐漸模糊,泛安防成為行業(yè)未來趨勢,眾多巨頭跨界入局,行業(yè)競爭加劇,容聯(lián)面對如此激烈的市場格局,會如何應(yīng)對?未來的戰(zhàn)略和規(guī)劃會做哪些調(diào)整?

陳開仡 :泛安防時代,無論是技術(shù)還是市場,安防行業(yè)不再是一個封閉的行業(yè)。

首先是關(guān)于產(chǎn)品升級,容聯(lián)將側(cè)重于三個方面去創(chuàng)新:

第一,讓安防從被動防范到主動預(yù)警,從“看”變?yōu)?ldquo;做” ;利用視覺智能把安防體系從被動的記錄、檢查,逐漸轉(zhuǎn)變?yōu)樽詣悠饰觥⒅鲃宇A(yù)警或即時處置。

第二,讓智能安防云端化。 安防行業(yè)面對的一大問題就是場景“碎片化”,這是一個不可忽視問題,大量的碎片場景帶來大量的數(shù)據(jù)積累,安防體系中存儲的數(shù)據(jù)量級成指數(shù)增長,這時候應(yīng)用會逐漸轉(zhuǎn)向云端進(jìn)行處理,將復(fù)雜任務(wù)云化,既可以增加處理效率,也可以合理的進(jìn)行資源的分配,容聯(lián)也會針對云端領(lǐng)域的應(yīng)用場景做深入的研究。

第三,應(yīng)用場景落地。 安防行業(yè)已從前兩年關(guān)注各類AI算法的功能和性能,轉(zhuǎn)向重視算法與具體業(yè)務(wù)的匹配銜接,追求將AI性能落實到具體業(yè)務(wù)應(yīng)用上,形成具體的解決方案。容聯(lián)將致力于解決各種垂直應(yīng)用場景。

同時隨著5G、AI的興起,外加政策的扶持,我們認(rèn)為邊緣場景將會為安防行業(yè)帶來新鮮活力,所以云、邊、端一體化也是我們一個重要的產(chǎn)品規(guī)劃。

據(jù)悉,11月5日,「容聯(lián)云通訊」宣布完成 1.25億美元 F輪融資,由中國國有資本風(fēng)險投資基金領(lǐng)投,新東方產(chǎn)業(yè)基金、Mirae Asset(未來資產(chǎn))、藍(lán)藤資本和CloudAlpha等戰(zhàn)略及財務(wù)投資方共同參與。騰達(dá)資本、花旗環(huán)球金融亞洲有限公司和招商證券(香港)擔(dān)任財務(wù)顧問。

這是國內(nèi)云通訊領(lǐng)域迄今為止規(guī)模最大的一筆私募股權(quán)融資。

容聯(lián)表示,本輪融資完成后,容聯(lián)將進(jìn)一步加大在智能通訊云服務(wù)方向的技術(shù)研發(fā)投入,提升產(chǎn)品厚度及競爭壁壘;同時持續(xù)創(chuàng)新,擴容邊界,在5G、新基建的浪潮中,更好地助力企業(yè)和政府組織實現(xiàn)數(shù)字化改造與智能化升級,推動中國企業(yè)通訊市場變革。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)標(biāo)簽
ai技術(shù)
智能語音

相關(guān)文章

  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學(xué)家峰會之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會能源投資專業(yè)委員會、溫港院士科創(chuàng)中心承辦,中國電工技術(shù)學(xué)會、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標(biāo)簽:
    ai技術(shù)
  • 王通:未來個人創(chuàng)業(yè)的十個機會

    個人創(chuàng)業(yè)需要啟動成本低、無需龐大團隊、可快速驗證、能利用個人技能或資源。這里分享適合個人創(chuàng)業(yè)的十個機會一.AI內(nèi)容優(yōu)化與本地化服務(wù)·做什么:幫助企業(yè)或個人利用AI工具(如GPT-4,Midjourney)優(yōu)化內(nèi)容生產(chǎn)流程。例如,為跨境電商撰寫多語言產(chǎn)品描述,為小紅書博主生成爆款文案,為小公司制作營銷

  • 百度智能云PaddleOCR 3.1正式發(fā)布:關(guān)鍵能力支持MCP

    百度AI團隊今日正式推出PaddleOCR3.1版本,以突破性的多語言組合識別(MultilingualCompositionPerception,MCP)技術(shù)為核心,徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級標(biāo)志著OCR領(lǐng)域首次實現(xiàn)對同一文檔內(nèi)任意混合語言文本的精準(zhǔn)識別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場

    標(biāo)簽:
    ai智能
    ai技術(shù)
  • AI工具導(dǎo)航網(wǎng)站,未來的發(fā)展前景怎么樣?

    導(dǎo)航網(wǎng)站的崛起:從信息過載到精準(zhǔn)觸達(dá)隨著全球AI工具數(shù)量爆發(fā)式增長(2025年已超數(shù)萬款),用戶面臨前所未有的選擇困境。傳統(tǒng)搜索引擎的“關(guān)鍵詞-鏈接”模式難以應(yīng)對工具篩選的場景需求,垂直化、場景化的AI導(dǎo)航網(wǎng)站應(yīng)運而生。這類平臺通過聚合、評測、分類與推薦四重機制,將分散的工具資源整合為結(jié)構(gòu)化入口。例

  • 微信AI搜索被指“強行開盒”:名字成了數(shù)據(jù)入口,騰訊回應(yīng)“僅用公開信息”

    當(dāng)微信公眾號文章中出現(xiàn)一個人的名字,它會自動變成藍(lán)色鏈接,點擊即可查看AI生成的“個人簡歷”——這一微信新功能讓不少用戶感到被“扒光”在互聯(lián)網(wǎng)上。近日,微信新上線的“AI搜索”功能陷入隱私泄露爭議漩渦。多位網(wǎng)友在社交平臺反映,當(dāng)微信公眾號推文中出現(xiàn)本人姓名時,名字會自動變?yōu)樗{(lán)色超鏈接,點擊即可瀏覽由

    標(biāo)簽:
    ai技術(shù)
    ai搜索
  • GDPS2025賽場直擊!開普勒大黃蜂助力華理斬獲搬運賽項桂冠

    12月12日-14日,2025全球開發(fā)者先鋒大會暨國際具身智能技能大賽(GDPS2025)于上海張江科學(xué)會堂舉行,大會以具身智能競技為核心,融合了技術(shù)比拼、產(chǎn)業(yè)展示與科普體驗,為全球觀眾呈現(xiàn)出具身智能的現(xiàn)在與未來。上海開普勒機器人有限公司(以下簡稱"開普勒機器人")攜明星產(chǎn)品K2"大黃蜂"亮相,并參

    標(biāo)簽:
    GDPS
    2025
  • 弈動 Dynamic·數(shù)智躍遷 博弈無界|2025TechWorld智慧安全大會在京召開

    在數(shù)字化與智能化深度交織的時代浪潮中,安全的邊界不斷延展,技術(shù)的演進(jìn)正引領(lǐng)產(chǎn)業(yè)邁向新一輪變革。10月24日,以“弈動Dynamic·數(shù)智躍遷博弈無界”為主題的2025TechWorld智慧安全大會在北京盛大召開。來自國家部委、院士學(xué)者、高??蒲袡C構(gòu)和企業(yè)的權(quán)威專家與業(yè)界精英齊聚北京,共議AI安全、數(shù)

    標(biāo)簽:
    弈動
  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學(xué)家峰會之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會能源投資專業(yè)委員會、溫港院士科創(chuàng)中心承辦,中國電工技術(shù)學(xué)會、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標(biāo)簽:
    ai技術(shù)
  • AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

    AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

    標(biāo)簽:
    阿里巴巴
  • 未來5年,中國AI的“大洗牌”和“內(nèi)循環(huán)”

    我覺得我們AI的目標(biāo)是:從芯片設(shè)計到軟件生態(tài),全鏈路自主開發(fā),建立可控的世界級AI體系。所以這是俺對未來5年中國AI圈的展望和判斷。(1)2026年,英偉達(dá)造車、國產(chǎn)開車26年國產(chǎn)芯片會在推理和垂直場景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會以軟件彌補硬件不足,所以訓(xùn)練和推理分開,訓(xùn)練就

  • H20芯片開賣即叫停,英偉達(dá)如何解圍?

    文/道哥在深陷“后門”風(fēng)波、接受網(wǎng)信辦問詢之后,英偉達(dá)的“特供版”H20芯片,又有了新消息。近日,美國科技媒體《TheInformation》援引知情人士消息稱,英偉達(dá)已悄然向其關(guān)鍵供應(yīng)商——包括負(fù)責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI

    標(biāo)簽:
    英偉達(dá)