近日,中國乃至全球的第一份《數(shù)據(jù)競賽白皮書》(以下簡稱“白皮書”)發(fā)布,首次為我們從全局的角度盤點了數(shù)據(jù)競賽的發(fā)展歷程、現(xiàn)狀以及價值。白皮書指導單位為“大數(shù)據(jù)系統(tǒng)軟件國家工程實驗室”,和鯨科技攜旗下第三方數(shù)據(jù)競賽平臺和鯨社區(qū)(Kesci),聯(lián)合AWS共同發(fā)布。
據(jù)發(fā)布方的信息顯示,白皮書通過搜集整理1000場全球競賽數(shù)據(jù)、1000余份問卷調(diào)研、幾十位行業(yè)專家及企業(yè)辦賽負責人的訪談、超過1200小時的分析研究,共同打造并發(fā)布了《數(shù)據(jù)競賽白皮書》(以下簡稱“白皮書”)。白皮書分為《數(shù)據(jù)競賽白皮書·上篇·1000場競賽的深度分析》和《數(shù)據(jù)競賽白皮書·下篇·辦好一場競賽的實操手冊》兩部分。

《數(shù)據(jù)競賽白皮書·上篇·1000場競賽的深度分析》中指出,數(shù)據(jù)競賽的發(fā)展起點可追溯至 1997 年首次問世的 KDD Cup,由國際頂會KDD 牽頭舉辦,這也是數(shù)據(jù)科學領(lǐng)域迄今為止最重要的國際賽事之一,至今已經(jīng)舉辦22年。
今天,就讓我們跟著白皮書一起,回顧一下這二十多年數(shù)據(jù)競賽與國際頂會的歷程吧。

2019年夏天有件令人驚喜的事件傳遍了全國——KDD CUP 2019三個賽道的冠軍全都被華人面孔拿下。被譽為數(shù)據(jù)挖掘領(lǐng)域「奧運會」的 KDD CUP,從1997年到現(xiàn)在已經(jīng)舉辦了22屆,是目前數(shù)據(jù)挖掘領(lǐng)域最有影響力的賽事。也是從今年開始開始, KDD CUP 擁有了專屬的獨立議程,供世界數(shù)據(jù)挖掘界的頂尖專家、學者、工程師、學生等前來參賽,在KDD中的分量越來越重要。
K D D(Conference on KnowledgeDiscovery and Data Mining,知識發(fā)現(xiàn)和數(shù)據(jù)挖掘會議)隸屬于 ACM(Association forComputing Machinery,國際計算機學會),是響譽全球的頂級學術(shù)會議。1997 年, KDD 正式推出 KDD Cup,KDD Cup 要求參賽者通過數(shù)據(jù)分析,判斷出哪些人有可能成為美國癱瘓退伍軍人協(xié)會的捐贈者,從而幫助協(xié)會更精準地發(fā)送求助郵件,開啟了數(shù)據(jù)競賽的新模式。此后,KDD Cup 保持了一年一度的舉辦慣例。

1999 年KDD Cup 的賽題更為經(jīng)典,選用了來自美國國防部高級規(guī)劃署在 MIT 林肯實驗室操作進行的入侵檢測評估項目數(shù)據(jù),希望參賽者能夠分辨那些操作是外部入侵,獲勝者是廣為人知的統(tǒng)計分析軟件公司 SAS。作為數(shù)據(jù)挖掘領(lǐng)域影響力最廣、水平最高的國際頂級賽事,KDD Cup 20 余年以來的賽題設(shè)計始終帶有鮮明的工業(yè)應用色彩,每年都會吸引大量優(yōu)秀的企業(yè)、高?;蚩蒲袡C構(gòu)協(xié)辦賽事,或直接參給與競賽角逐。
通過KDD Cup 的歷年成果上不難看出,雖然面臨的問題日益復雜,但始終帶有強烈的工業(yè)應用色彩,高度契合各類組織機構(gòu)的實際需求,不斷涌現(xiàn)出全新的應用場景。KDD Cup的成功,帶動了ICCV、NeurlPS、ISBI、Euro CSS、ECML-PKDD、VoxCeleb、MICCAI、C-MIMI、IEEE-CIS、CVPR(ActivityNet)、IWCS、ECCV 等國際頂尖學術(shù)會議紛紛加入這一浪潮。
他們除了在世界不同地域舉行年度性盛會外,也開始聯(lián)手全球各地的企業(yè)、科研機構(gòu)共同籌辦數(shù)據(jù)競賽,以短時間競賽的形式幫助前沿數(shù)據(jù)科學技術(shù)的進一步發(fā)展。這類享有頂會權(quán)威背書和國際影響力的重大賽事在全球范圍內(nèi)得到了積極響應,參賽對象不僅限于技術(shù)水平突出的個人,還囊括了科研實驗室、高校和企業(yè)等一系列組織。
國際頂會數(shù)據(jù)競賽也往往會積極兼顧市場應用的需求,通過與企業(yè)、政府機構(gòu)合作,聚集當下技術(shù)與數(shù)據(jù)應用中的難點尋求解決思路, 不斷縮短科研成果與落地應用之間的距離,賽題內(nèi)容廣泛覆蓋醫(yī)療、軍事、互聯(lián)網(wǎng)、交通出行、快消零售、生態(tài)及文化保護等眾多場景。

中國企業(yè)、高校及科研機構(gòu)和個人參賽者在國際頂會數(shù)據(jù)競賽的獲獎次數(shù)呈現(xiàn)逐年上升的趨勢,亦反應了中國在數(shù)據(jù)科學領(lǐng)域的實力和影響力不斷加強。在中國也有一些企業(yè)開始和國際頂會合作,舉辦基于行業(yè)應用的數(shù)據(jù)競賽。而數(shù)據(jù)競賽的進程也伴隨著人工智能相關(guān)科技專利的爆發(fā)期,從2000年開始不斷向上。

根據(jù)麥肯錫全球研究院發(fā)布的 MGI 行業(yè)數(shù)字化指數(shù)報告,在產(chǎn)業(yè)數(shù)字化動態(tài)發(fā)展的過程中,完備的數(shù)字資產(chǎn)積累、充分的資本投入與研發(fā)、可持續(xù)的人才連接與協(xié)同推進了產(chǎn)業(yè)數(shù)字化程度的不斷加深,進而帶來了較高的平均利潤增長率以及勞動增長率。
《數(shù)據(jù)競賽白皮書》中提到,通過數(shù)據(jù)競賽形式并以此建立基于數(shù)據(jù)價值流動的生態(tài)系統(tǒng),才能充分利用生態(tài)內(nèi)不斷升級的人才資源和技術(shù)資源賦能商業(yè)發(fā)展,已成為越來越多商業(yè)領(lǐng)袖的共識。相較于傳統(tǒng)的數(shù)字化進程,主動采用數(shù)字化戰(zhàn)略的企業(yè)明顯能在后續(xù)發(fā)展中與競爭對手拉開差距。

中國數(shù)據(jù)競賽的崛起并非偶然,也不止是對國外先進模式的亦步亦趨,而是在技術(shù)落地應用需求增長、宏觀政策支持和云計算基礎(chǔ)不斷成熟等原因之下的必然結(jié)果。建立基于數(shù)據(jù)價值流動的生態(tài)系統(tǒng),充分利用生態(tài)內(nèi)不斷升級的人才資源和技術(shù)資源賦能商業(yè)發(fā)展,已成為越來越多商業(yè)領(lǐng)袖的共識。

據(jù)悉,在《數(shù)據(jù)競賽白皮書·下篇·辦好一場競賽的實操手冊》中,和鯨科技將首次公開自身100+場專業(yè)賽事的服務(wù)經(jīng)驗,開源其數(shù)據(jù)競賽管理的方法論,這將對數(shù)據(jù)競賽行業(yè)產(chǎn)生不小的沖擊。和鯨科技是中國對標Kaggle成立的,最早的數(shù)據(jù)競賽平臺之一,且在這個過程中形成了在用戶數(shù)、用戶質(zhì)量、活躍度方面均有出色表現(xiàn)的中國數(shù)據(jù)科學家社區(qū)——和鯨社區(qū)(由Kesci發(fā)展而來)。在和鯨社區(qū)上,有來自中國聯(lián)通、中國平安、招商銀行、騰訊、百度、字節(jié)跳動、攜程、IBM、華為、默克中國、南京市人民政府、深圳市人民政府、鵬城實驗室等頭部企業(yè)與機構(gòu)舉辦數(shù)據(jù)競賽。通過開放競賽的機制和數(shù)據(jù)科學的手段,解決各個行業(yè)的業(yè)務(wù)難題。
國內(nèi)最高規(guī)格的大數(shù)據(jù)競賽,由教育部主辦的“中國高校計算機大賽-大數(shù)據(jù)挑戰(zhàn)賽”,以及獎金規(guī)模最大的人工智能大賽,由深圳市政府主辦的“全國人工智能大賽”,都選擇在和鯨社區(qū)完成全流程的組織。由此可見,《數(shù)據(jù)競賽白皮書·下篇·辦好一場競賽的實操手冊》必然會促進“數(shù)據(jù)競賽”這一高效、敏捷的數(shù)字化創(chuàng)新模式,在中國進一步發(fā)展。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
傳統(tǒng)數(shù)據(jù)中心因依賴風冷技術(shù),能源使用效率(PUE)普遍在1.5以上,導致大量電力被用于散熱而非計算本身。面對“雙碳”目標與可持續(xù)發(fā)展的緊迫需求,RAKsmart憑借其創(chuàng)新的液冷技術(shù),成功將數(shù)據(jù)中心的PUE降至1.2以下,為行業(yè)樹立了綠色標桿。
2023數(shù)據(jù)中心科技成果獎發(fā)布11月16日,素有IDC行業(yè)“諾貝爾獎”之稱的行業(yè)大獎——數(shù)據(jù)中心科技成果獎如期而至,由中國工程建設(shè)標準化協(xié)會在2023第11屆數(shù)據(jù)中心標準大會上進行了隆重發(fā)布。今年是第七次與行業(yè)見面,40項技術(shù)、2位杰出貢獻人才和6位青年科技人才獲得殊榮,折射出行業(yè)熱點和趨勢,并激發(fā)
作為數(shù)字經(jīng)濟基礎(chǔ)底座,數(shù)據(jù)中心的角色正在從業(yè)務(wù)工具成為企業(yè)數(shù)字化生產(chǎn)力。越來越多的企業(yè),需要一座貼近業(yè)務(wù)的高品質(zhì)數(shù)據(jù)中心,比如建在企業(yè)總部大廈的寫字樓內(nèi),滿足隨時隨地、安全、可靠的數(shù)據(jù)處理及交互需求。在金融行業(yè),數(shù)據(jù)中心已經(jīng)從成本中心發(fā)展到服務(wù)中心,從支撐業(yè)務(wù)上升為驅(qū)動業(yè)務(wù)演變。位于成都的一家證券公
2023年8月23日,以“蝶變奮進數(shù)商之都”為主題的“中國數(shù)谷”2023杭州峰會(夏季)在杭州高新區(qū)(濱江)順利舉行。會上,信雅達成為“中國數(shù)谷”數(shù)據(jù)產(chǎn)業(yè)發(fā)展聯(lián)盟首批成員并參與授牌儀式。本次峰會由浙江省發(fā)展和改革委員會,杭州市人民政府指導,由杭州市發(fā)展和改革委員會,杭州市數(shù)據(jù)資源管理局,杭州市金融投
把脈中國數(shù)據(jù)智能化
2023年,幾乎可以被定義為中國互聯(lián)網(wǎng)公司的“大模型元年”。ChatGPT的全球爆紅,徹底點燃國內(nèi)的大模型賽道,曾經(jīng)的“創(chuàng)業(yè)英雄”、如今的商業(yè)領(lǐng)袖們親自下場,接連發(fā)布生成式人工智能產(chǎn)品與大模型布局。大模型火了,沉寂許久的互聯(lián)網(wǎng)行業(yè)又有了新的“戰(zhàn)事”。同時,大模型的快速發(fā)展也改變了云市場的現(xiàn)狀,企業(yè)對
近日,數(shù)字化市場研究咨詢機構(gòu)愛分析發(fā)布了《2022愛分析·數(shù)據(jù)智能廠商全景報告》,愛分析從技術(shù)研發(fā)能力、服務(wù)客戶數(shù)量、收入規(guī)模等維度對廠商進行了全面專業(yè)的評估
2022年11月18日,首個國家級大數(shù)據(jù)產(chǎn)業(yè)創(chuàng)新賽事——2022第一屆中國大數(shù)據(jù)大賽圓滿落幕。工業(yè)和信息化部信息技術(shù)發(fā)展司數(shù)字經(jīng)濟推進處處長張建倫,中國電子技術(shù)標準化研究院副院長孫文龍出席頒獎典禮并致辭
2022年11月17日,在廈門市工業(yè)和信息化局的指導下,以“數(shù)據(jù)確權(quán)”為主題的2022數(shù)據(jù)資產(chǎn)(廈門)論壇在廈門成功舉辦。本次論壇以“數(shù)據(jù)確權(quán)”為主題,由廈門市互聯(lián)網(wǎng)域名應用服務(wù)產(chǎn)業(yè)協(xié)會和構(gòu)信網(wǎng)(公信.中國)聯(lián)合主辦
近日,國內(nèi)知名數(shù)字化市場研究咨詢機構(gòu)愛分析正式發(fā)布《2022愛分析·信創(chuàng)廠商全景報告》(以下簡稱“報告”)。報告綜合考慮企業(yè)關(guān)注度、行業(yè)落地進展等因素,遴選出在信創(chuàng)市場中具備成熟解決方案和落地能力的廠商。
10月31日下午,由數(shù)博會執(zhí)委會主辦、數(shù)據(jù)觀(北京)傳媒科技有限公司承辦、貴陽大數(shù)據(jù)交易所協(xié)辦的第四期數(shù)博思享會“實踐先行觀公共數(shù)據(jù)價值與應用”活動成功舉辦。
近日,由中國國際數(shù)字經(jīng)濟博覽會組委會主辦,中國電子技術(shù)標準化研究院、河北省工業(yè)和信息化廳承辦的“第一屆中國大數(shù)據(jù)大賽”(簡稱大數(shù)據(jù)大賽)正式啟動。
廣州光點信息科技有限公司自主研發(fā)的數(shù)據(jù)中臺產(chǎn)品GI大數(shù)據(jù)中臺V2.0產(chǎn)品是國內(nèi)率先推出符合新創(chuàng)標準的中臺產(chǎn)品,基于“大數(shù)據(jù)+AI”等技術(shù)全新打造,集數(shù)據(jù)采集、融合、治理、服務(wù)、管理為一體的旗艦平臺。
廣州光點信息科技有限公司自主研發(fā)的數(shù)據(jù)中臺產(chǎn)品GI大數(shù)據(jù)中臺V2.0產(chǎn)品是國內(nèi)率先推出符合新創(chuàng)標準的中臺產(chǎn)品,基于“大數(shù)據(jù)+AI”等技術(shù)全新打造,集數(shù)據(jù)采集、融合、治理、服務(wù)、管理為一體的旗艦平臺