【科技资讯】万亿数据产业背后，被AI「困住」的打工人

📌 信息分类：数据要素

📰 信息来源：www.36kr.com

📅 原文发布时间：2026-06-09 17:53

🕒 本站采集时间：2026-06-11 15:22:48

📝 核心摘要

万亿数据产业背后，被AI「困住」的打工人豹变·2026年06月09日 17:53数据做题家

「核心提示」
AI发展带来数据标注、数据采集等新岗位，但职业瓶颈和薪资限制了这些岗位的人才流入，反过来影响了AI能力的天花板。

AI的发展正催生出这样的图景：在分工层次上，人来负责上层的“判断和决策”、下层的“打标和整理”。而中间层的“分析和总结”，那些传统由分析师、咨询顾问和秘书完成的脑力劳动，正被各类AI工具填满。
好消息是，上下两层出现了一些新岗位。比如数据标注、数据构建和数据采集。这些岗位正以前所未有的速度涌入就业市场。脉脉报告显示，2026年春招AI岗位量同比增长8.7倍。
数据采集与具身智能密切相关：采集员需要穿戴动捕设备，记录触觉、视觉、力学等多模态数据，帮助机器人学习抓取、行走、避障等动作。
数据构建则是对数据“去杂”的过程：公开数据或企业数据库往往格式混乱、存在错误，需要人工进行筛选和整理。
数据标注则是AI产出内容的“裁判”，告诉大模型什么样的输出是“好的”，帮助AI形成学习正反馈，提升大模型输出内容的质量。
这些新工作到底是长久趋势，还是昙花一现；能成为“文科生的康庄大道”吗，还只是“新一代天坑”？为此，《豹变》找到了一些从事相关工作的人，试图还原AI催生的新岗位背后真实情况。
“数据做题家”的真实面貌
景璃在北京某互联网大厂担任数据标注的外包，工作是提升AI文创工具的输出质量，她大学专业是戏剧影视文学。
景璃对《豹变》说：“我标注过的品类包括演讲稿、小说、论文，现在做最多的是漫剧或者AI短剧的剧本。”
数据标注行业也有大量的非全职招聘。成都大学生文琪就找了一份数据标注的远程兼职，内容是给英文的语音转文字做标注。
她们的工作流程一般是这样的：电脑上会显示AI的几个输出结果，数据标注负责选一个最优结果，由负责质检的同事再判断一次，负责人抽查一次，最后再由甲方检查。根据这个最优结果，AI能够逐渐“理解”人类的评价标准，从而提升输出质量。
景璃一些外包同事是数学或计算机背景，他们会承担部分数据构建的工作，即爬取公开数据，依据特定的方式进行数据清洗、整理，最后用于大模型的标注和训练。分工上，数据构建位于标注的上游。
行业内把构建和标注工作戏称为“做题”，没有这些“数据做题家”就没有各类AI工具。
据国家数据发展研究院测算，2025年专业数据产品（含人工智能…

🔗 阅读原文

👉 万亿数据产业背后，被AI「困住」的打工人

🏷️ 标签：数据要素

本文由科普头条 AI 自动采集发布，内容仅代表作者观点