0
他们是藏在数据世界里的“画家”、他们是正在拧紧新世界人工智能螺丝钉的工人、他们是人工智能世界的基石——数据标注师。
一、AI崛起,数据标注开始“走南闯北”
ChatGPT的出现,正在给全球劳动力市场带来颠覆性变革,很多人担心工作就此被人工智能替代。那么,AI的崛起到底会不会导致大规模失业?
迄今为止,历史上重要的技术进步并没有对人类的生活与工作产生单方面毁灭性的打击。虽然蒸汽机替代了传统骡马,印刷机取代了传统抄写员,但与此同时,新技术、新业态也在酝酿出新职业,人们不仅得以从重复性的事物中解放双手,更重要的是,还多了一些更好的职业选择。
像以往的新技术一样,人工智能也催生了一系列新职业,其中之一便是数据标注师。他们每天坐在电脑屏幕前,切换图片、点击鼠标,为识别物体画框和打点,通过建立人工智能训练数据集来提升计算机辨识现实世界物体的能力。
人工智能的发展离不开数据标注这一“助推器”,可以说,数据标注是研发无人驾驶、智能医疗、工业自动化等诸多新兴技术与产业的起点。
一位业内人士曾说过,仅北京就有一百多家数据标注的垂类公司,很多头部互联网技术企业都有自己的数据标注公司,全国从事这项工作的人超百万。
随着行业的不断发展,数据标注释放出更大的社会价值,开始走到全国的各个区域,带动当地数字经济发展。就拿位于重庆市东北部,集库区、山区于一体的奉节县来说,曾是全国有名的煤城,当下也正在发展人工智能产业。
据了解,奉节县政府和百度智能云合作共建的百度智能云(奉节)人工智能基础数据产业基地,于2022年6月投入运营,基地目前有500余名员工。
百度智能云(奉节)人工智能基础数据产业基地作为当地引入的人工智能产业标杆项目,一方面为当地培养数据标注人才,将人力资源转化为人才资源;另一方面引入孵化数据标注企业,培育区域数据要素市场,构建数据标注产业集群,形成集数据采集、清洗、标注、应用为一体的基础数据服务体系。
百度智能云(奉节)人工智能基础数据产业基地
这是奉节县引进的第一个重要的数字经济项目,这一举措加速了奉节县人工智能和大数据上下游及周边产业的集聚,助力奉节县打造成数字经济产业高地。
数据标注产业正在呈加速度走入全国各地,在加快区域数字化转型、开辟数据标注师新职业方面不断释放价值,AI普惠的意义由此体现。
二、从宝妈到数据标注师,不可小觑的“她力量”
(点击文字观看纪录片)
过去几年,现代化、城市化和工业化进程不断加快,我国大批农村剩余劳动力涌进城市打工,大量留守儿童在缺失父母陪伴中独自成长。
余兆容就曾是一名留守儿童,为了避免让自己的孩子再有相同经历,她决定放弃外地的工作,回到老家陪伴孩子。
回到奉节老家后,余兆容去电子厂当过工人,在幼儿园当过幼师、保育员,就在种种尝试依然找不到理想工作之际,一次偶然的机会让她成为了百度智能云(奉节)人工智能基础数据产业基地的一名数据标注师。
从去年8月开始,余兆容开始在百度智能云(奉节)人工智能基础数据产业基地做语音项目,主要是四川、重庆的方言标注。比如,车载导航系统需要关键词唤醒,标注正确语音、剔除错误语音,从而让人工智能听懂四川话、重庆话。
数据标注师其实就像教孩子一样教AI,看似简单的工作,背后倾注的是人类的情感和认知。只有像切割钻石一样标注,才能获得价值更高的数据,因为数据精确度直接影响了人工智能模型训练效果。
除了耐心和细心,这份工作还需要相应的专业知识。比如部分自动驾驶领域的数据标注要求标注师已拿到驾驶执照,医疗以及金融等专业领域的数据标注需要具备一定行业背景,因此数据标注师也并不是没有门槛。并且,随着大模型不断发展,行业对于数据标注师需求增加的同时,专业能力要求也将变高,数据标注师们需要不断学习和进阶。
数据标注师的工作让余兆容感叹道,身边人确确实实得到了便利。她说:“有时候小孩在小度上学儿歌、学拼音,即便发音不标准,也能用方言唤醒小度。”
对于余兆容来说,数据标注师这份工作不仅让她在老家找到了自我价值,也让孩子幼有所养、老人老有所依。除此之外,余兆容家还是奉节本地脐橙种植户,工作之余,她还有精力种橙子。
而余兆容也是AI普惠化趋势下,受益人群当中的一个个体缩影。百度智能云人工智能基础数据产业基地作为人工智能行业的落地载体,让更多的普通人在新时代里找到了自己的价值,他们在老家“另起一行”,让三四线小城市散发了新的活力。他们是大时代下的小人物,也是小县城里的勇敢者。
三、数据标注师们的高光时刻
数据标注行业和数据标注师正在迎来高光时刻。
2022年1月,国务院发布《“十四五”数字经济发展规划》,提出要充分发挥数据要素作用,强化高质量数据要素供给。支持市场主体依法合规开展数据采集,聚焦数据的标注、清洗、脱敏、脱密、聚合、分析等环节,提升数据资源处理能力,培育壮大数据服务产业。
数据要素逐渐成为数字经济深化发展的核心引擎,这些年各区域积极迎接数字经济新趋势,谋求产业转型,而数据标注基地成为区域数字化转型的重要突破口。
随着百度智能云(奉节)人工智能基础数据产业基地的落地,奉节县依托基地在加速当地产业转型与专业人才培养方面取得显著成效。截止2022年9月,百度智能云(奉节)人工智能基础数据产业基地总占地面积约4000平方米。已培育企业12家,人才培训次数超600次,在职数据标注师超过500人,其中80%为奉节本地人。
不仅是奉节,在山西太原落地的百度(山西)人工智能基础数据产业基地,办公面积超19000平方米,入驻服务商超40家,拥有百万量级的数据处理能力,累计产值超5亿元,已成为当地数字经济的前沿阵地和数字转型的窗口和名片。
从市场规模视角来看,数据标注行业增势明显。曾有行业专家提到,目前AI公司的总支出中20%—30%都用于数据,而现阶段国内数据采集和标注的规模保守估计已经有50亿元。市场研究机构Research and Markets也预测,到2030年,全球数据标注市场规模将比现在扩大6倍,从21亿美元增长到127.5亿美元。
人工智能行业里流传着一句话:“有多少智能,就有多少人工。”人工智能需要大量的结构化数据,筛选、处理数据的过程离不开数据标注师。
早在2020年2月,人工智能训练师作为新职业被纳入国家职业分类目录。2021年,人力资源和社会保障部发布该职业的国家职业技能标准。
数据标注师在这场人工智能浪潮中,既是见证者,更是重要的参与者。就如余兆容所说:“只要进入了这个行业,即使身在家乡奉节,也能看到全国各地、甚至全世界的人工智能发展趋势。”
每个人都有仰望星空的权利,百度智能云人工智能基础数据产业基地为数据标注师提供了平等上升通道,数据标注师既可以通过自学、基地培训等多种途径提升职业技能实现纵向发展,也可以学习管理知识,担任管理角色以实现横向发展。
在百度智能云人工智能基础数据产业基地,每个人都可以“另起一行”,并通过每一个看似小小的标注动作,为人工智能行业留下时代的注脚。
(雷峰网(公众号:雷峰网))
雷峰网原创文章,未经授权禁止转载。详情见转载须知。