【科技资讯】万亿数据产业背后,被AI「困住」的打工人 - 科普头条

【科技资讯】万亿数据产业背后,被AI「困住」的打工人

📌 信息分类:数据要素

📰 信息来源:www.36kr.com

📅 原文发布时间:2026-06-09 17:53

🕒 本站采集时间:2026-06-11 15:22:48


📝 核心摘要

万亿数据产业背后,被AI「困住」的打工人豹变·2026年06月09日 17:53数据做题家

「核心提示」
AI发展带来数据标注、数据采集等新岗位,但职业瓶颈和薪资限制了这些岗位的人才流入,反过来影响了AI能力的天花板。

AI的发展正催生出这样的图景:在分工层次上,人来负责上层的“判断和决策”、下层的“打标和整理”。而中间层的“分析和总结”,那些传统由分析师、咨询顾问和秘书完成的脑力劳动,正被各类AI工具填满。
好消息是,上下两层出现了一些新岗位。比如数据标注、数据构建和数据采集。这些岗位正以前所未有的速度涌入就业市场。脉脉报告显示,2026年春招AI岗位量同比增长8.7倍。
数据采集与具身智能密切相关:采集员需要穿戴动捕设备,记录触觉、视觉、力学等多模态数据,帮助机器人学习抓取、行走、避障等动作。
数据构建则是对数据“去杂”的过程:公开数据或企业数据库往往格式混乱、存在错误,需要人工进行筛选和整理。
数据标注则是AI产出内容的“裁判”,告诉大模型什么样的输出是“好的”,帮助AI形成学习正反馈,提升大模型输出内容的质量。
这些新工作到底是长久趋势,还是昙花一现;能成为“文科生的康庄大道”吗,还只是“新一代天坑”?为此,《豹变》找到了一些从事相关工作的人,试图还原AI催生的新岗位背后真实情况。
“数据做题家”的真实面貌
景璃在北京某互联网大厂担任数据标注的外包,工作是提升AI文创工具的输出质量,她大学专业是戏剧影视文学。
景璃对《豹变》说:“我标注过的品类包括演讲稿、小说、论文,现在做最多的是漫剧或者AI短剧的剧本。”
数据标注行业也有大量的非全职招聘。成都大学生文琪就找了一份数据标注的远程兼职,内容是给英文的语音转文字做标注。
她们的工作流程一般是这样的:电脑上会显示AI的几个输出结果,数据标注负责选一个最优结果,由负责质检的同事再判断一次,负责人抽查一次,最后再由甲方检查。根据这个最优结果,AI能够逐渐“理解”人类的评价标准,从而提升输出质量。
景璃一些外包同事是数学或计算机背景,他们会承担部分数据构建的工作,即爬取公开数据,依据特定的方式进行数据清洗、整理,最后用于大模型的标注和训练。分工上,数据构建位于标注的上游。
行业内把构建和标注工作戏称为“做题”,没有这些“数据做题家”就没有各类AI工具。
据国家数据发展研究院测算,2025年专业数据产品(含人工智能…


🔗 阅读原文


👉 万亿数据产业背后,被AI「困住」的打工人


🏷️ 标签:数据要素

本文由科普头条 AI 自动采集发布,内容仅代表作者观点

© 2026 科普头条   |   京ICP备2026012639号   |   京公网安备11010102007649号