編者按:數據標注產業,屬于少數有大意義的“小產業”。
說它小,是因為全國市場規模預計今年也到不了300億元,業內僅有幾家上市企業,且其年營收都不超過5億元。但就是以這般小體量,它卻能吸引到國家多部委發專文支持,原因很簡單:AI大模型訓練亟需高質量數據,而數據標注是高質量數據供給的一個關鍵環節。
數據標注本質上是將人類知識轉化為機器可識別的語言,為AI大模型學習提供“教材”。去年,國家數據局公布了首批7個承擔全國數據標注基地建設任務的城市名單,四川省成都市入選。如今試點基地建設已滿一年,產業在蓉發展如何?川觀智庫在專題調研過程中發現了一些值得關注的新情況、新變化。而要深入了解它們,可以從對三個新現象的追問開始。
川觀智庫研究員 熊筱偉
一線調研期間,不斷有數據標注企業負責人提起同一件事:今年開始只招本科生了。
對數據標注產業來說,這件事確實算得上新鮮。畢竟這一行長期被看作是勞動密集型產業,從業者也以大專和中專學歷為主。為什么今年突然招聘學歷門檻抬高?這背后蘊含了怎樣的產業發展新趨勢?

Part.1
現象背后的新趨勢是什么?
下游AI大模型產業的重心轉移,使上游數據標注業務發生結構性變化
多名企業負責人告訴川觀智庫研究員,抬高學歷要求主要是針對標注員團隊。
成都市匯眾天智科技有限責任公司總經理駱靖元說,去年招聘標注員還是大專學歷起步,今年把門檻提到了本科。成都小咖邦智能科技有限公司總經理馬欣偉談到,如今新員工要求至少本科學歷。澳鵬數據科技(上海)有限公司市場及政府關系副總裁項蔚表示,全國員工中有78%是本科及以上學歷,而在今年成立的成都子公司,這個數字達到了99%。
這樣的現象如今并不鮮見。中國信息通信研究院人工智能研究所等單位今年8月發布的《數據標注產業發展研究報告(2025年)》提出,數據標注行業對從業者的專業素養要求越來越高,高學歷背景和多學科融合成為從業者的基本特征。
專業素養要求為什么會越來越高?今年為何開始強調高學歷?
對此,企業負責人的回答基本一致:因為業務需要。“以前業務相對簡單,基本都是常識類、生活類信息。圖片上有一只貓,你把貓的輪廓標出來就行。”駱靖元表示,如今甲方項目的難度明顯增加,比如看圖片變成了看CT片,標注貓變成了標注人體骨腫瘤位置,這當然會對標注員專業性和學習能力提出更高要求。成都優易智數科技有限公司總經理金守超提到,下半年要招聘一批漢語言文學專業的大學生,“因為接了相關項目,需要有文學底蘊。”
綜合受訪企業反饋,大體能勾勒出當前數據標注需求正在發生的結構性變化:一方面,語音、人臉標注等傳統需求增長開始減速甚至停滯;另一方面,聚焦垂類領域的數據標注需求出現快速增長,尤其智能駕駛、具身智能兩個領域最多,醫療、美學、文學等領域次之。
這些變化的根源,是下游AI大模型產業的重心轉移。根據億歐智庫《2024中國“百模大戰”競爭格局分析報告》,2025年至2028年通用大模型格局逐漸趨于穩定,垂類大模型賽道將成為大模型產業激烈競爭的領域——相對于通用大模型,垂類大模型聚焦特定領域或行業,對數據標注的專業性自然會提出更高要求。

Part.2
趨勢帶來的新變局是什么?
從數據標注產業視角看,地方和企業的比較優勢都在被重新定義
上述趨勢的發展,會給數據標注產業帶來什么變局?
馬欣偉的經歷,直觀反映了其中一類變化。他所屬母公司2015年在上海市成立,但直到去年他才受命來成都組建子公司。為什么不更早來蓉?馬欣偉的回答很有意思:以前沒必要來成都。
至于原因,他說得很坦誠:因為成都人力成本相對較高。這一點也得到受訪企業廣泛認同。四川淘金你我信息技術有限公司總監楊志發坦言,企業把全部約200名標注員都搬到了山西、湖南兩省,在成都僅保留管理運營團隊。這樣做的主要理由就是節約人力成本,“山西、湖南(普通標注員)人均工資差不多,都是每月3000多元。但成都周邊區市縣現在沒有4000元就招不到人,市區更貴。”此外,受訪者談到即便是省內其他市州,目前和部分已經形成產業集聚的省份(如河南、山西)相比,仍然缺乏人力成本優勢。
但上述事實和看法,都是基于數據標注作為勞動密集型產業的大前提。而馬欣偉和同事如今選擇落地成都,反映了這一判斷前提正在發生改變——隨著AI和垂類大模型進一步發展,數據標注產業將逐步從“勞動密集”向“知識密集”轉變,“人才儲備”也將逐步替代“人力成本”,成為企業更看重的地方資源。多位受訪者都談到,這或許也是國家級數據標注試點基地之所以落地在高校云集的成都,而非其他人力成本更低城市的重要原因。
川觀智庫研究員注意到去年至今,一批頭部數據標注企業已經或正在考慮落地成都。澳鵬數據科技(上海)有限公司于今年5月、路米科技(江蘇)有限公司于去年9月均在成都設立新公司。京東云西區業務負責人談到,目前正在和成都接洽數據標注業務落地事宜。至于落地理由,受訪者普遍提到看重成都人才梯隊相對完整且數量龐大。
地方的比較優勢正在被重新定義,而同樣的事也發生在企業身上。
根據受訪企業反饋,卷價格等傳統競爭方式的有效性將逐步減弱,數據標注企業之間的競爭焦點將轉向構建專業團隊和相關能力。而這一變革的出現,又催生了AI大模型風口中的一些新現象。對此川觀智庫將在《三問數據標注產業②》中持續探討。
相關閱讀
【未經授權,嚴禁轉載!聯系電話028-86968276】
AI技術已經廣泛應用了
地方的比較優勢正在被重新定義,而同樣的事也發生在企業身上。
勞動密集型
密集型產業需要創新人才!
厲害
提高勞動者素質,促進企業發展!