文丨镜相工作室 马舒叶
编辑丨卢枕
AI焦虑已经从大厂渗透进了大学这座象牙塔。一群来自非北上广深、非985高校的大学生,主动跳进了这股浪潮——他们不是来做实习的,是来兼职“拧螺丝”的,拧的是AI大模型的螺丝。
在“AI将替代99%的岗位”和“拿AI offer月入3万”两种声音的共同影响下,这批不容易挤进大厂实习队伍的大学生,走进了大厂数据标注的流水线,成为新的AI工人。他们每天在大厂提供的兼职平台上抢单、标注、纠错、优化,月收入大多在1000到2000元之间。在这条看不见的AI流水线上,他们既是训练者,也是被挑选的对象。
他们分散在成都、郑州、武汉、厦门等非一线城市的角落,在课余或下班后的时间里,登录那个决定他们今晚“有活干”还是“白蹲守”的后台,他们标注图片,校准对话,贡献乡音,优化代码,试图找到新的机会。
对于大厂来说,大学生群体兼具垂直领域的专业知识和充足的参与热情,是完成最基础的AI数据标注、AI回复纠错、AI声音识别等最合适的人群。通过向大学生伸出兼职橄榄枝,他们不仅能高效率地找到符合大模型训练要求的人,还能减轻雇佣正职员工的成本。
这成了一场“双向奔赴”,甚至由于供不应求,大厂AI数据标注的兼职还需要抢单。只是,这份兼职真的能成为大学生们通往AI大厂的一条曲径吗?
大学生进“厂”,拧大模型的螺丝
郑州某高校大学教室里,刚刚结束一堂课,学生们鱼贯而出,只有大三学生张莹立刻打开手机。她要在下课的十几分钟内“抢单”——在名为“Xpert”的平台上,几分钟的不间断重复点击下,她终于抢到了一个任务。一旁的室友没有她这么幸运,任务就像春节返家时的票,前一秒显示还有6个,点进去的瞬间就归了零。
她们都在做同一份兼职——张莹称这是给大厂的AI大模型“拧螺丝”。
起初,张莹在学校兼职群里看到了学长的推荐。他只知道和AI训练有关,项目名称是“字节大模型领域专家招聘”。这份兼职不需要AI相关经验,只要在任何领域有专业知识即可,一次任务就有50-200元的收益,很适合她这样的在校大学生。
抢到任务后,她需要根据出题专家给定的题目和答案完成评估,比如审核大模型在中文教学场景下的回复是否存在语音或语法错误,然后进行语言纠正。作为熟手,通常不到2分钟她就能完成一个任务。接下来张莹只要等待专家质检,通过就能领到对应的兼职费。
整个过程,张莹都接触不到真人。申请成为Xpert专家时是网页提交验证资料,做任务时也是在线查看提前准备好的说明文档,没有人教她怎么做,在进入这个大模型兼职平台后,她只能单向对大模型输出。“我像是大模型的饲料。”张莹表示。
来自武昌理工学院的王磊今年21岁,9月开始在“Xpert”平台上接单,做的是最基础的数据标注:将图像划分为不同类别,区分风景图或人物图;给文本打标签,判断一篇新闻的主题属于科技、娱乐还是体育。
“这工作听起来简单,但做起来挺磨人的。”王磊一般会选在没有课的下午或晚上,一次做一两个小时。在后台界面上,系统清晰地记录着他的“数字工时”:某天下午花费1.5小时,完成了8条文本标注和2条模型反馈优化任务,总耗时1.5小时,完成任务量10个。这些数据是他参与AI大模型训练的证明。
● 大模型高薪兼职宣传。图源:受访者截图不过这份兼职没有宣传的那样高薪。
从去年下半年开始,王磊每周会拿出五天时间,做1-2小时任务,一个月下来扣除审核不通过的任务,收入在800-1200元之间。为了抢到更多兼职,王磊要找准工作日的空闲时段不断进入后台查看任务是否有更新。综合算下来,时薪在80元左右。“和去校门口奶茶店摇奶茶差不多。”王磊告诉镜相工作室。
时间长了,王磊也想尝试那些单价更高的“出题”任务,这些任务单次完成就能赚300-1000元,但往往限定在金融、法律或医疗等专业领域。“想拿到更高的兼职费用,得有硬知识储备,还得会抓大模型的知识盲区。比如出医疗题,你得知道专业术语和临床常识,不能瞎编。”非相关专业的王磊只能继续做数据标注。
据镜相工作室了解,除了字节推出的Xpert会招揽大模型兼职训练专家外,阿里有晓天睿士、腾讯有AI Expert,这些大厂都会通过组建大模型专家社区构建AI数据集。高薪则是这些兼职平台共同的宣传重点,比如阿里晓天睿士宣称参与者可以获得高达每小时1000元的高薪,只是在详情页里,将兼职费用的下限定为50元,并标注了“以最终项目定价为准”。
● 兼职的出题要求,希望题目难倒大模型。图源:受访者在为大模型做数据标注、纠错之外,这些远离一线城市的大学生们也有别的兼职机会。
远在福建的林薇正在读博一,今年在一位山东曲阜师大的朋友介绍下,她踏入了一个更为隐蔽和原始的AI数据采集层。她主要为大模型提供“声音”——闽南语和台湾腔普通话的录音及转写。
由于福建方言“神似”台湾腔,林薇得到的第一份任务,是用闽南语或台湾腔普通话进行自言自语或双人对话,录制好的音频将作为“语料”用于训练大模型的语音识别能力。随着和AI打电话、AI录音转写成为大厂AI App的标配功能,大厂也需要更多方言作为语料喂养大模型。因此,林薇接触的也不止Xpert,还有一些专门为大厂处理数据需求的中介平台。
只是想凭卖声音赚钱并不容易,这份兼职的要求极其繁琐。有的项目要求在不同的环境噪音(低、中、高分贝)下进行录音,但“录音平台非常不稳定,有时一直进不去”,而且噪音分贝往往很难把控。
平台审查更严格的是后续的文本转写工作,她称之为“翻译”。转写的文本将被喂给大模型,打磨大模型方言音频转化文字的识别能力。而由于阅读这份文本的是大模型,林薇必须要写成大模型能读懂的样子。她不仅要把音频里的内容一字不变地转写,且转写文本只能使用逗号、句号、问号和感叹号四种标点。这些细微到极致的格式要求,是在用最原始的人力,喂养AI的“标准化”输出。
这样的录音往往会持续2-3个小时,但“收入情况却不是很理想”。林薇会被一些平台骗稿,有些中介会以各种理由推脱、扣钱。她和她的“搭子”都曾深受其害。她描述了一种典型的陷阱:一个声称是“豆包”项目的老板,最初承诺每人100元,但在录音数小时后,却以“音色不符合”等模糊理由拒绝对“搭子”付款,林薇本人也只收到了60元。
双非大学生,把AI兼职当敲门砖
真正让这些大学生感受到自己在“训练”AI而不仅仅是“服务”AI,来自于成功“难倒”大模型的时刻。
王磊在一次针对专业编程问题的反馈任务中,提出了一个用Python实现二叉树层序遍历并优化时间复杂度的问题。豆包大模型给出的代码虽然能运行,但时间复杂度并非最优,并且漏掉了一个边界条件处理。
“我把这个问题标注出来,并详细解释了代码中因冗余导致的复杂度偏高,还附上了优化思路。”王磊说,“这时候我感觉到,我们其实就是针对它的知识盲区找出逻辑漏洞,相当于帮大模型查漏补缺。”
林薇偶尔也会有一丝参与感,她专长是闽南语和台湾腔,在和AI用方言打电话时,她会感觉“自己确实也在参与训练大模型,给一个新的生命注入一些自己的特色,比如我们的腔调,或者地方的一些文化”。
有一次标注,张莹的题目是:当用户说今天下雨没带伞,淋成了落汤鸡,AI的回复是“建议下次带伞”。张莹立刻标注“情感类吐槽别讲大道理”,建议AI要先情感关怀,再加一句实用建议。还有次张莹向AI吐槽课时太长时,大模型回复“我懂这太累了,忙完记得喝点小甜水”,张莹会嘀咕,“这搞不好是我当初标注过的”。
尽管做的是最基础的工作,但偶尔,他们也能从“拧螺丝”中获得一丝超越金钱回报的微妙体验。
而对于这些双非大学生而言,这份兼职的更大意义,是给自己的简历添彩。
“我做这个,一是因为和专业相关,二是想给简历加上AI相关经验。”张莹坦言,她学的是国际中文教育专业,中文语用偏误纠错本就是课程内容。
在AI引发热潮的这两年,中文教育专业的就业越发紧张。不少教辅和留学机构都引入了AI辅助学生学习,传统的中文教育岗位薪资一再走低。而张莹在郑州读书,能接触到的大公司并不多,这份AI兼职对她意义重大。
就在这个月,张莹得到了一家头部教培机构的实习面试邀约,是做“AI+教培”的课程开发岗位,HR在邀约时就表示了对她大模型兼职经历的兴趣。“如果没有相关兼职经验,我连实习邀约都拿不到。”张莹告诉镜相工作室,并非985学历的她在之前找实习时总会在第一轮简历初筛时就被筛下来。
面试时,张莹也被HR问到了大模型训练的具体流程和错误校准的逻辑,这些她都能结合之前的经历讲解清楚。最终,她得到了这次实习机会。
计算机相关专业的王磊也有规划。“我会在简历里写‘参与过AI大模型训练相关兼职,负责过文本或图像数据标注,累计完成了多少任务量’。”他强调,“这样就不是空泛地说‘我做过AI兼职’,而是有具体成果。对非相关专业、想往AI领域靠的同学来说,是给履历添彩的。”一段大模型相关实践,或许是他们跨越学历和地域门槛,拿到理想offer的一次机会。
AI时代的另一面:焦虑的大学生们
时代变了,象牙塔里的大学生们也感知到了用人市场的变化。
一方面,企业期待引进AI以实现降本增效,在微软、亚马逊、X等科技大厂宣布更多代码由AI生成的同时,美国科技行业截至今年7月已累计裁撤近9万岗位,同比增长36%。传统岗位在缩减,AI相关岗位招聘在增多。根据猎聘数据研究院,今年上半年,AI技术新发职位整体增幅为36.82%。大厂校招成了风向标,以阿里今年秋招为例,计划发出的7000多个offer中,AI相关岗位占比超六成。
随着AI技术的狂飙猛进,这群身处浪潮之中的年轻人,对于自己的未来既有憧憬,也有危机感。
王磊已经开始感受到就业市场的压力。作为计算机相关专业的学生,数据分析师是此前不少学长学姐的就业方向,而如今不少岗位已经被AI替代。“有学长告诉我,他的公司引入大模型后,数据部门裁员了30%。”再加上处在湖北,能供王磊选择的公司并不多,他也没有双一流的学历优势,毕业后,王磊要面临更严峻的就业环境。
除了找工作越来越难,王磊还意识到,“AI时代一个人要身兼数职,比如会软件开发的人还得懂运维。以后数据分析也可能被AI替代。企业需要的工作人员要同时兼具多个角色,或者被机器人取代。”但他还是保留了一丝乐观,“不过机器人还是要有人来操控的。”
做大模型相关兼职成为了他们在大学阶段对抗焦虑的方法之一。
大厂的模型训练需求催生了这些兼职平台,在国内有Xpert、晓天睿士、AI Expert和各种中介平台;在海外,也有以OpenAI为大客户的Mercor,刚在8月完成3.5亿美元的C轮融资,估值达到100亿美元。不过,对这些双非大学生来说,即便是这些低门槛的兼职平台,也越来越卷了。
已经工作3年的张毅见证了这条流水线从“蓝海”到“红海”的变迁。“2022年那会儿,抢单接单都容易。平台刚推出这类任务,做的人少,甚至不算严格意义上的抢单。”他回忆,那时平台每天有固定任务或时段性上新,无需掐点蹲守,即便下班晚上七八点登录,也照样有活干。
与王磊这样的“新手”相比,在成都工作的张毅可谓是这条流水线上的“老师傅”。93年出生的他,从2022年就开始游走于美团的“龙猫数据”和字节的“Xpert”两个平台之间。
他记得自己是如何“入行”的:“当时刷到一个职场圈的公众号,推送了龙猫的兼职,标题写的是‘本地生活内容校准,下班就能做’,就去了解了一下。”他所做的“本地生活内容校准”,是为AI对话进行校准,涉及社区周边商铺的推荐、便民服务点的位置信息,以及口语化表达的准确性。
那是属于早期参与者的“红利期”。张毅细数着当时的“好光景”:一条合理的方言便民指引能拿到1到2元,一组十条的地址校准报酬是8到10元。“那会儿下班做个一两小时,周末抽半天时间,一个月下来赚2000到4000元都非常轻松。”不过,当下抢单变难了,随着越来越多人涌入,数千个任务往往不到一分钟就会抢光,他说:“未来肯定会更卷。”
随着大厂在AI大模型训练上的持续加码,这条由代码、数据和声音构成的庞大流水线将持续运转,这些大学生们则是这条流水线上沉默的大多数,终将成为智能涌现后不被看见的“微尘”与“声纹”。