首页 十大品牌文章正文

南方观察|发力数据标注新蓝海,东莞万江将凭何突围

十大品牌 2025年09月29日 15:57 0 aa

9月26日,东莞市数据标注产业园(下称“东莞数标园”)供需对接会在万江街道举行。现场,万江街道下属国企东莞市万智科技有限公司与10家有意向入驻园区的企业签约,标志着园区建设迈出实质性一步。

南方观察|发力数据标注新蓝海,东莞万江将凭何突围

记者了解到,该产业园规划建设为粤港澳大湾区规模最大、技术创新最领先的高端数据标注产业集聚区,其布局的“一园两基地”中的百度智能云(东莞)数据标注产业基地是目前大湾区规模最大的百度标注基地。

数据标注并非新鲜赛道,尤其在AI大模型问世后,相关行业快速扩张。2023年,我国数据标注产业规模已达800亿元左右。截至今年上半年,全国首批7个国家级数据标注基地已建设数据集524个、服务大模型163个。

近年来,广东清远、肇庆、韶关等地也相继建成数据标注基地,在龙头企业带动和产业集聚效应下,发展势头如火如荼。在这样激烈的产业竞逐中,为何东莞数标园的建设仍旧值得关注?它能否“复刻”先行者经验,又将凭何突围?园区建成后,预计为东莞及万江当地带来怎样的经济效益?

押注高端数据标注

通俗来讲,数据标注就是给数据“贴标签”或者“做记号”,使原始数据成为可用于训练人工智能大模型的燃料。

过去,这一领域因门槛低、人工参与度高,常被视为人工智能产业链里最不“性感”、最缺乏想象力的一环。然而,随着AI模型训练进入下半场,数据标注的重要性正被重新评估。

北京交通大学教授、国家数据专家咨询委员会委员张向宏在接受媒体采访时曾指出,如今,算力和模型对人工智能应用的制约已大大缓解,数据供给的规模和质量才是影响大模型应用水平的最关键因素,这也对数据标注提出了更高要求。

与此同时,行业垂直模型和智能体方兴未艾,数据需求逐渐走向细分化、专业化,标注工作开始涉及更复杂的学术难题和行业专业知识。有业内人士称,数据标注已从简单的人工标注,进化为“高技术含量、高知识密度、高价值应用”的优质数据产业,并将持续往高阶方向发展。

东莞数标园正是瞄准这一趋势,定位高端化、智能化、生态化。区别于传统的语音识别、文本分类、图像识别等通用场景领域,园区将重点面向具身智能、工业质检、医疗影像、金融风控、遥感、AIGC等垂类高价值行业。

南方观察|发力数据标注新蓝海,东莞万江将凭何突围

为支撑高质量数据需求,园区高标准建设行业领先的数据标注产业基础设施,包括大湾区首个高质量数据集及大模型测评中心和具身智能数据采标实验室,以及高规格的数据标注全栈式平台、数据人才实训认证平台、行业级数据可信空间、数据标注展示中心等。

产业园所在的万江街道有关负责人还提到,园区引进了两家数据标注技术领先、产业规模大的龙头企业——中国电信和百度智能云,二者强强联合,将为园区带来先进技术与优质市场资源。

南方观察|发力数据标注新蓝海,东莞万江将凭何突围

预计3年时间内,东莞数标园将引进50家以上数据企业、2000名数据产业人才,形成20个以上高质量数据集、10个以上垂直领域模型。

抢占错位发展先机

目前,全国首批7个国家级数据标注基地主要集中在成都、沈阳、合肥等内陆城市,广东韶关、清远等地虽有小规模的传统数据标注基地,高端数据标注基础设施仍相对欠缺。

华为、腾讯、比亚迪、大疆等在粤龙头企业,以及大量独角兽和“专精特新”小巨人企业,都在加速布局人工智能大模型和智能体。它们对高质量、专业化、场景化的数据标注需求庞大又迫切。

然而,高端数据标注产业既是人才密集型又是成本敏感型行业。在广深等一线城市,产业发展的关注度相对有限;在二、三线城市,其人力资源素质又难以完全满足新业态需求。在这一背景下,新一线城市东莞抢先布局,正当其时、潜力巨大。

南方观察|发力数据标注新蓝海,东莞万江将凭何突围

“东莞的区位协同优势、制造产业基础、政策生态支撑和人才资源储备,都是企业选择在此建设数据标注基地的重要因素。”百度智能云华东及华南区总经理吴军华介绍。

区位上,东莞地处粤港澳大湾区几何中心,1小时经济生活圈覆盖广深港澳四大国际都市。在东莞投资布局,能高效承接海量的人工智能市场订单,快速搭建便捷的供需对接通道。此外,园区选址于东莞中心城区的“三江六岸”片区,拥有集研发创新、生产制造、宜居生活于一体的完整生态。

南方观察|发力数据标注新蓝海,东莞万江将凭何突围

产业上,东莞经济活跃,制造业基础雄厚,拥有超190万户市场主体,“8+8+4”现代化产业体系完备,工业门类涵盖34大类、6万多种产品,拥有1个万亿级、4个千亿级及多个百亿级集群。丰富的制造场景是数据标注技术应用和迭代的最佳“试验田”。

政策上,市委、市政府在3年内安排30亿元财政资金,支持人工智能产业创新升级。今年初发布的市政府1、2号文,提出设立最高1500万元模型券、打造不少于30个行业级数据集和知识库等一系列重磅政策。万江街道还将安排1亿元专项资金,支持企业平台搭建、数据集建设、模型开发和贷款贴息等。

人才上,东莞是技能人才之都,就业创业综合成本较低,园区周边大湾区大学、香港城市大学(东莞)、东莞理工学院等高校每年稳定输出人工智能、大数据专业人才,能够以高效、可持续的方式承接大规模、多样化标注需求。

“建设东莞数标园,是围绕产业链关键环节、突出城市错位发展的坚定之举。”在供需对接会上,万江街道相关负责人表示,希望园区全力打造立足湾区、辐射全国、链接海外的超级数据基地,为人工智能赋能千行百业提供有力支撑。

带来多重叠加利好

在供需对接会现场,“打造全链路数据服务能力”“推动产业数字化、智能化转型”“输送数据技能人才”等发展目标和未来利好是绕不开的话题。

数据产业能力建设方面,中国电信AI公司技术方案专家刘贺表示,将托企业自身在云网融合、算力布局与人工智能领域的深厚积累,打造完整的智能标注工具链,提供涵盖图像、语音、视频、3D点云等多模态数据的自动化标注与质检能力。

南方观察|发力数据标注新蓝海,东莞万江将凭何突围

北京天阳融信科技有限公司此前已借助百度智能云的标注算法与人工质检的“人机协同”模式,将标注准确率稳定在99.5%以上。入驻东莞数标园后,企业将通过自研工具,把标注效率再提升40%,并将成熟的场景化标注方案,共享给本地相关企业。

区域转型升级方面,两大龙头企业及其生态伙伴将聚焦电子信息、电气机械、纺织服装等传统产业和智能移动终端、机器人、新能源等新兴产业,赋能其数字化、智能化转型,并推动数据资源的标准化、合规化流通与应用。

专业人才培育方面,园区将建设人工智能技能实训平台,为入驻基地的企业和人才提供培训,并为基地及周边企业和相关行业从业者提供人工智能职业技能认证培训服务,实现产业人才孵化和集聚。

南方观察|发力数据标注新蓝海,东莞万江将凭何突围

在东莞数标园组织的首次供需对接会上,就有10家有意向入驻园区的企业签署合作协议。可以想见,在不远的未来,随着数标园建成落地,万江将加速形成集数据采集、标注、流通、应用为一体的人工智能数据服务生态,东莞也将成为大湾区数据要素流通核心节点和全国领先的生产性服务业集聚区。

采写:南方+记者 王颖 通讯员 李蓉 叶靖

图片:吴松琦 刘冠希

【作者】 王颖;吴松琦;刘冠希

【来源】 南方报业传媒集团南方+客户端

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap