當前位置:律師網大全 - 註冊公司 - 目前國內數據標簽市場規模有多大?

目前國內數據標簽市場規模有多大?

數據標註是指對圖片、聲音、文本等數據進行分類、分幀、標註、標註等處理,將對象的特征標註出來作為機器學習的基礎材料的過程。按照參與方式,中國數據標簽行業的參與企業主要分為眾包和自建工廠。其中,眾包主要包括百度眾包、JD.COM眾智和龍貓數據。工廠模型主要有貝西、雲測、愛數智慧、海天盛瑞、阿裏數據標註、袁坤智能數據、點我科技等。

頭部企業是自建數據團隊,中小型數據供應商占很大比例。

目前中國國內數據標註市場第壹梯隊包括頭部公司成立自己的數據標註部門,JD.COM(JD.COM中智)、百度(百度中策)、騰訊、阿裏(阿裏數據標註)都有自己的標註平臺和工具。除了頭部公司,近年來國內也湧現出很多數據標簽公司,如龍貓數據、Testin雲測、Besay BasicFinder、Data Hall等。這些公司僅次於頭部公司,都具有相當的規模,位於第二梯隊。

在中國數據標簽行業的參與者中,按規模劃分,品牌數據服務商、中小型數據供應商和需求方自建基礎數據團隊形成市場競爭關系,是AI數據標簽市場的主要供應商,2019年占比分別為30.4%、47.0%和22.6%。目前,中小型數據供應商是市場上的主要供應商。

按照模式分為數據標簽公司和眾包平臺,服務範圍廣泛。

按照參與方式,中國數據標簽行業的參與企業主要分為眾包平臺和自建工廠(專業數據標簽公司)。2020年數據標簽公司排名中,Testin雲測、數據堂、龍貓數據位在前三;在數據標簽眾包平臺排名中,JD.COM眾智、百度中策、數據堂位列前三。

從數據標註代表企業的業務布局來看,大部分數據標註服務商提供文本、語音、圖像、視頻等多種類型的數據標註,其服務應用領域涵蓋安防、智能駕駛、醫療、教育、金融等多個領域,主要客戶包括科技公司、人工智能企業、傳統企業、政府部門、科研機構等。

以視覺業務為主的企業大多自建貼標基地,多分布在山西、河南等地。

AI數據表明,根據業務方向和進入市場的時間,行業內的玩家大致可以分為早期玩家、中後期玩家、專註於視覺服務的玩家和專註於語音服務的玩家。其中,更專註於語音數據的玩家,通常擁有更多自己知識產權的數據集;有自建貼標基地或專職貼標團隊的,多為視覺玩家。

作為人工智能產業鏈中不可或缺的壹環,AI數據標註服務的發展已經成為各地推進AI建設的重要方向之壹。貴州、山西、重慶等地相繼出臺指導意見,引進科技公司,建設數據基地和數據交易中心,打造具有地方特色的人工智能產業園。

目前很多數據標註公司自建標註基地或團隊,如百度在山西的AI數據標註基地、百度大數據百鳥河基地、數據廳的保定數據處理基地、數據廳的合肥數據基地、數據廳的北京TTS錄音中心等,大多分布在山西、河南等地。

北京、上海、成都是需求企業前三名,杭州數量有所下降。

從需求企業來看,根據AI數據標註統計,2020年4月,國內數據標註企業數量為565家,2020年2月,數量增至705家。從數據標註企業的區域分布來看,截至2020年底,65438+2月,北京、上海、成都、深圳、杭州為TOP5城市,企業數量分別達到185、84、68、63、46家。其中,北京、上海、成都、深圳企業數量較2020年4月均有所增加,杭州企業數量較2020年4月有所減少。

市場集中度低,未來會有所改善,行業並購會成為趨勢。

2019年AI數據標簽行業CR5(前五大企業市場份額)為26.2%,處於低集中度競爭階段,行業充滿活力,發展空間良好。五大企業中,海天日盛和百度數據眾包越來越受歡迎。據了解,在國內整體供應商中,大部分公司提供圖像數據采樣服務,涉及人像數據、OCR數據、自動駕駛數據等。業務需求分散,其中百度數據眾包收入分成占比最大。

相比較而言,語音數據的需求相對集中,供給門檻高於圖像數據。內容包括語音識別數據、語音合成數據等。,其中海天盛瑞的收入份額最大。

目前人工智能數據標簽行業集中度適中,既不是寡頭壟斷市場,也不是充分競爭市場。壹方面,百度數據眾包、海天盛瑞、數據堂等企業進入市場較早,積累了較多的客戶資源。另壹方面,由於下遊企業之前使用的是公共數據集訓練模型,對數據高精度的要求仍然是短暫的,由於生態傳導效應的滯後性,市場門檻並不明顯。資本和R&D實力較弱的中小企業仍有較強的發展土壤。

但未來隨著下遊企業的發展,直接使用外包團隊成本低,數據安全性和可控性強。壹些基本需求將由下遊企業自給自足,外部數據服務提供商的現有存量市場將面臨下滑,因此必須承擔高難度、前沿的獨特任務,這就要求他們投入高精度、專業的數據處理工具的研發和人工智能算法的基礎研究,以把握客戶需求,開拓增量市場。因此,資本和R&D實力已經成為壹個較高的行業門檻。同時,由於近年來資本市場的降溫,壹批中小廠商面臨業務收縮。此外,壹些制造商已經開始在行業內進行並購。參照海外數據服務市場的發展(海外行業巨頭阿彭多次收購其他公司),並購也將成為市場趨勢。在多重因素的影響下,行業集中度會提高。

綜上所述,數據標簽行業的兼並重組將成為未來的大勢所趨。目前國內壹個典型的M&A事件就是Bisai BasicFinder收購了壹批專業的人工標註服務提供商,以此來豐富獨立的數據采集系統,完成更加多樣化的任務。全球數據標簽行業的兼並重組步伐加快。

壹方面,頭部企業逐漸收購中小微數據平臺,將議價能力提升到壹個新的高度。在此背景下,全球數據標簽行業的市場集中度進壹步提高。數據標簽行業的並購規模將持續增長,行業競爭將日趨激烈。

——更多數據請參考前瞻產業研究院《中國數據標簽行業市場前瞻與投資戰略規劃分析報告》。

  • 上一篇:美國媒體公布世界軍工百強榜單,中國三家企業躋身前十。
  • 下一篇:南京華東電子信息技術有限公司的公司歷史
  • copyright 2024律師網大全