每当我们使用搜索引擎、与聊天机器人交流,甚至只是简单地使用智能吸尘器打扫卫生时,我们都在触发全球数据和资本的流动。
【编者按】“AI”无疑是过去一年最热的话题之一。国产大模型能力的迅速跃升,让越来越多的人开始尝试用AI解决工作和生活中的问题。这股AI使用热潮的背后,《投喂AI》像一束探照灯,向人们展示AI产业劳动者们的现实处境。
经出版社授权,第一财经节选了书中部分篇章,以飨读者。
在广义上,AI指的是一种基于机器的系统,它通过数据处理来生成决策、预测和建议等输出。其应用范围极为广泛,既可以执行电子邮件的自动填充这样的日常任务,也可应用于无人机战争中的定向武器系统等高端领域。“AI”这个词更像是一个营销术语,或者更确切地说,它是涵盖了计算机视觉、模式识别以及自然语言处理(即对日常语音和文本的处理)等诸多技术的总称。然而,这一概念的外延依然模糊,它既能激发人们对超越人类智能潜力的惊叹,同时也警示我们它可能带来的毁灭性风险。AI已经成为公众热议的话题:有人视其为经济增长的新引擎和科技进步的象征;而另一些人则担忧自动化会导致工人失业,引发不公平的决策,甚至使人类沦为科技的附属品。随着技术浪潮的不断推进,AI的定义也在不断演变和拓展。
近来,焦点已转向驱动聊天机器人的核心技术,即大语言模型(LLM)。这些模型的训练基于从互联网抓取的庞大数据集,其中包括海量文本数据。大语言模型(如ChatGPT)之所以被称为“大”,主要体现在两个方面:一是其训练数据集规模巨大,达到了数千亿千兆字节(GB)的数据量级;二是模型训练所涉及的参数极多,例如,ChatGPT-4的参数约达1.76万亿。参数是提升系统性能的关键因素,它们可以在训练过程中进行微调,从而优化模型对数据中模式的识别能力,并进一步提高其处理新数据时的性能。
当前,我们正处于技术炒作热潮之中,众多企业竞相将AI工具整合到各类产品中。无论是物流业、制造业,还是医疗保健行业,都因AI而经历前所未有的变革。AI在疾病诊断、设计高效供应链以及货物运输自动化等领域均展现出了应用价值。据统计,2023年全球AI市场规模已成功跨越2000亿美元的门槛,并以每年约20%的增长率稳步上升。预计到2030年,这一数字将达到近2万亿美元。尽管AI的发展相对隐秘而不透明,难以精确统计全球参与该产业的具体人数,但肯定已超过百万。若按目前的速度持续发展,这一规模还将显著扩大。
通过使用AI产品,我们无形中与全球各地的劳动者直接且紧密地相连。不论我们情愿与否,这种联系已经悄然形成。就像品味一杯咖啡时,我们实际上已经参与了一个由咖啡豆到咖啡杯的全球供应链。同样,每当我们使用搜索引擎、与聊天机器人交流,甚至只是简单地使用智能吸尘器打扫卫生时,我们都在触发全球数据和资本的流动,这种流动将全球各地的工人、公司和消费者紧密相连。然而,许多科技公司在对外展示时,只呈现出光鲜、时尚、自主运行的机器形象,让人们认为机器能检索海量数据并自主学习,却刻意隐瞒了这些机器的制造过程,对那些拿着微薄薪水、艰辛训练机器却又被机器所束缚的幕后工作者避而不谈。作为消费者、社会活动的参与者和公民,我们的积极行动能够切实改善这些工作者的工作条件,让他们工作得更舒适。这些工作者站在技术变革的前沿,但AI驱动的监控和生产力工具正席卷各行各业,即使是那些自认为不会受此影响的从业者,也无处可逃。为此,我们首先需要了解AI的生产逻辑与运作机制。只有这样,我们才能清晰地看到AI如何将权力、财富和塑造未来的能力集中到少数人手中。
神话背后的冷酷真相
企业只是一味地宣扬AI是多么的智能和便捷,而对于其背后大量的基础投入以及人工劳动只字不提。一提到AI,人们脑海中便浮现出发光的大脑、神经网络和失重的云朵等意象,仿佛AI本身就能飘浮在以太中。我们往往不会去想象这样的真实图景:在高耗能的数据中心里,装在重型机架上嗡嗡作响的服务器,不断释放热量,制造白噪声,以及触须般交错纵横的海底电缆将AI训练数据传输到全球各地。AI是有实体的,它存在于由芯片、服务器、电缆以及各种配件构成的机体中。如同人类身体一样,AI的材料结构也需要源源不断的“营养供给”,它需要电力来维持运转,需要水为服务器降温。无论何时何地,当我们向ChatGPT发问或使用网络进行搜索时,AI便在它的电子躯壳中呼吸着,运行着。
另一个常常被忽略的事实是,AI看似自动运行,实际上背后隐藏着人力劳动,以弥补技术的局限性。从标注数据、检查输出到调整参数,AI的运行需要大量人工劳动来维持。一旦它不能正常运行,就需要人工介入,调整算法完成工作。当Siri这样的智能助手不能正常识别语音指令,或者人脸识别系统无法正常运转,这些问题就会被反馈给人类员工,由他们确定哪里出了问题以及如何改进算法。18世纪末,由沃尔夫冈·冯·肯佩伦(Wolfgangvon Kempelen)发明的“机械土耳其人”(Mechanical Turk,亚马逊众包平台以此为名)曾在欧洲巡演。据说它是一个可以自动下棋的真人大小的木雕人偶。实际上这就是一个骗局,因为在人偶的内部藏着一位真人国际象棋大师,他借助机械杠杆和镜子在暗中操作。如今,所谓AI自主运行,也是类似的把戏。事实上,复杂的系统需要依靠大量的人工劳动来维持运转,这种工作耗时长、薪酬低廉、单调乏味,工人们被迫像机器人一样工作,只为使机器更接近人类状态。
AI的运行不但需要物质资源和人工劳动,还需要依靠其训练数据集中所包含的人类智能。AI在抓取到人类知识后,会借助机器学习模型将其编码为自动化程序。AI其实是这些数据的衍生品,通过训练数据,它学会了进行各种各样的活动:驾驶汽车、识别物体、生成自然语言。追根究底,它依靠数据集运行,它学会的每项技能都建立在数十亿数据点构成的人类知识库之上。背靠如此庞大的数据集,AI的表现超过了人类。它所收集的大部分数据具有公开版权,但也有未取得版权方授权的数据。AI企业常常通过限制访问数据库将集体智能变为私有财产,或者使用某些专利软件将有争议的版权数据洗成新数据。AI对智力资源的渴求,丝毫不亚于对物质资源的需求。
我们把AI称为剥削机器,并不仅仅因为它的诞生源自对资源的掠夺、人力的剥削以及对集体智能的榨取,还因为当AI系统被应用于实际工作环境时,会催生更深层的剥削。最核心的就是对劳动者精力的榨取。AI系统集中了劳动过程的知识,并通过程序化和简单化操作来降低完成任务所需的技能水平,导致工作强度更大,节奏更快。这样一来,雇主就可以从劳动者身上榨取更多的价值。这将是AI给普通人带来的最大伤害。短时间内,我们或许并不会转行成为内容审核员,但AI同样在侵蚀我们的工作岗位。
从平台时代到AI时代
我们即将迈入一个技术发展的新纪元,对AI所处的社会大环境的研究日益重要。在21世纪第2个10年,少数“数字守门人”崛起并迅速发展,在各自的平台上积攒了数十亿用户,成为市值万亿美元的巨头,并利用自身地位施展前所未有的政治和经济影响力。AI的发展也导致科技行业内部发生巨变,对全球经济产生了深远影响。2005年前后到2022年是平台时代,而现在我们已经踏入了AI时代。随着ChatGPT的推出以及大型科技公司与AI公司之间新合作关系的建立,投资策略和商业模式正受到一股围绕AI的新合力的驱动。
AI时代的到来催生了一个新的主要参与者格局,这一格局与平台时代有所重叠,但又有所不同。21世纪第2个10年占据主导地位的大型科技公司逐渐被一群新兴的“大AI”公司所取代,成为新时代的核心力量。这些公司包括亚马逊、谷歌母公司Alphabet、微软和Meta等传统科技巨头,以及OpenAI、Anthropic、Cohere和英伟达等AI初创企业和芯片制造商。如果将目光转向中国,AI时代举足轻重的第二梯队科技巨头有阿里巴巴、华为、腾讯和百度。尽管这个群体的具体成员可能会发生变化,但这些公司的共同特点是将AI视为可以为公司赢利的商品,其相关技术需被严格保密。它们试图封闭有关训练AI的知识,这样它们就能保持先发优势继续开发AI产品。随着ChatGPT的公开亮相,传统科技巨头与AI初创企业之间掀起了一波新的战略合作浪潮:微软向OpenAI注资100亿美元,谷歌向Anthropic投资了20亿美元,亚马逊对Anthropic投入了40亿美元,Meta与微软及AI初创公司Hugging Face展开合作,微软在AI初创公司Inflection中建立了一个新的AI部门。与此同时,英伟达已经成为一家市值2万亿美元的公司,占据机器学习领域图形处理器(GPU)95%市场份额。
在平台时代,社交媒体和广告平台占据主导地位,它们有极大的网络效应,即平台用户越多,服务效率越高、价值越大,所获利润也就越高。大量的用户数据既让平台更加深入了解数字世界,又让平台通过收费和打广告等形式具备了更高的变现能力。在AI时代,软件所有权仍然重要,但底层硬件的重要性也日益突显。平台时代公司的一大特点就是轻资产。爱彼迎名下没有实际房产,优步名下也没有汽车。它们卖的是服务,依靠用户网络来运营和赢利。而大AI得益于我们所说的“基础设施力量”,即拥有用于训练大型基础模型所需的计算能力和存储资源。这主要通过控制大型数据中心、海底光缆以及用于训练模型的AI芯片来实现。全球大型数据中心有一半以上属于三家大公司,只有少数几家公司能够提供训练尖端AI模型所需的硬件。这种基础设施力量吸引各路AI人才,行业中的拔尖人才都想加入顶尖企业,从事最前沿的AI开发。AI非但没有为社会提供更多创新机会和多元化可能,随着新入局的人大多选择加入行业内的成熟公司,财富和权力进一步集中在一小部分人手中。
这就导致企业融资模式和初创公司的股权结构发生变化。AI公司起步就要几百万美元,后期还需要上亿美元的资金来维持云平台运行以训练基础模型。因此,许多初创公司选择与现有的云服务提供商建立战略合作关系,这些提供商通常会购买初创公司的少数股权。大型科技公司拥有大量现金储备,能够为初创公司提供数十亿资金支持。在平台时代,第一代平台获得了风投的资金支持,但创始人会对平台业务决策拥有控制权。这样一来,许多平台变成了由一位身家上亿的创始人统治的庞大帝国。但在AI时代,这种事不太可能发生,因为任何新“帝国”都必须与现有的大型公司合作或合并。AI产品的商品化导致AI行业形成了多足鼎立之势,老牌科技公司会与有能力的初创公司结成新联盟,以击败竞争对手。
或许最有趣且尚未为人所知的转变要算领先的AI公司的商业模式的改变。在平台时代,留下最大恶名的是广告平台,典型代表就是Meta和谷歌,肖莎娜·祖波夫(Shoshana Zuboff)提出监控资本主义理论,对广告平台进行了批判。监控资本主义是指一些大型科技 公司通过为用户提供免费数字服务来向用户推销定向广告。这是平台时代的典型特征,但广告并不是唯一的商业模式,比如,亚马逊可以利用自己的垄断市场赚钱,爱彼迎和优步会收取交易佣金,网飞和Spotify(美国流媒体音乐服务平台)采取付费订阅模式。目前,尚不清楚监视模式是否会对新一代AI公司产生同样的影响,毕竟祖波夫提出的是一种商业模式,而不是资本主义新形态。科技公司也愿意通过其他方式赢利,具体会出现什么形式还有待观察,但从目前来看,早期AI公司的赢利方式大多是付费授权、收取会员订阅费、提供AI嵌入服务和出租AI云服务。
AI时代的背景较为复杂,气候危机、能源危机和中美两国间的紧张局势等极端问题和地缘政治因素都会深刻影响AI的发展。数字平台始终与安全、监控和边缘技术问题紧密相关。AI与第一代社交媒体App(应用程序)和电商之间的区别在于,政府普遍认为AI具有巨大潜力,可以直接用于提升国家的军事和经济实力。中美关系愈发紧张,技术在文明发展、军事力量和经济竞争方面,都扮演至关重要的角色。
地缘政治竞争还需要关注环境的可持续发展问题。所有大型科技公司至少表面上都提到了要认真考虑环境问题。在平台时代,没有太多关于数字基础建设需要消耗环境成本的报道,但如今情况大不一样了。可持续发展诉求会影响不同国家获取先进AI芯片所需的关键矿产的途径,并重塑特定地理区域在矿产开采和加工链条中的战略地位。在一个日益动荡的世界中,这些因素都将直接影响AI的发展方向和格局。
AI时代的技术是基于过去数十年的技术进步发展起来的,两者之间有深刻的连续性。非要说有什么不同的话,那就是AI时代的科技公司更有野心,它们想主导世界,想渗透社会生活的方方面面,想拥有政治话语权。AI将会助它们一臂之力,让权力更加集中于权贵之手,让美国科技巨鳄变得更加富有。相反,对于底层人民,AI留给他们的确实不多。“全球南方”(新兴市场国家和发展中国家的集合体)的许多国家在数字监控平台的建设和部署上几乎没有发言权,在需要庞大的网络资源和强大的运算能力做支撑的AI领域更说不上话。但作为剥削机器的AI将不断向这些国家索取,却仅将其视为可吞噬的原材料,投喂给那贪婪运转的机械核心。
“全球南方”的声音
评论家们总是热衷于争论AI在未来几十年可能的发展,以及它可能带来的社会危害,却忽略了当下这些构建AI的从业者的重要性。人们只顾着猜测AI是否会像电影《终结者》(Terminator)中所描述的那样,对人类生存造成威胁,却忽略了对当下AI背后强大利益集团的分析和批判。现在已经有许多研究表明AI系统给出的结果带有偏见与歧视,会危害人类社会的发展。然而,却没有人去分析这些偏见与歧视如何进入生产环节,给女性、少数族群和来自“全球南方”的劳动者造成负面影响,也没有人去深究AI在工作场所和社会环境中是如何被使用的。
2009年,东非成了世界上唯一一个仍未接入全球海底光缆网络的主要人口聚居区。但当距离蒙巴萨—乌干达旧铁路终点站不远的蒙巴萨港口铺设了第一条光缆后,一切都变了。从那时起,这些光缆将整个东非接入互联网,使得该地与世界其他地区之间的信息能够以接近光速的速度进行传输。与此同时,肯尼亚政府也提出了一个大胆的愿景:要在新兴的外包领域创造数万个工作岗位。肯尼亚的劳动力价格低廉,又会讲英语,在正式经济活动中的工作机会有限,所以外包行业很适合这些人。这样一来,肯尼亚的企业就可以跟印度、菲律宾的企业竞争欧洲和北美市场的外包后台工作。
尽管铁路和网络改变肯尼亚的方式非常不同,但它们有一个关键共性:把基贝拉等地的劳动者纳入了全球网络。这些网络跨越大洲,传递信息和价值。最近,AI产业利用这些网络来寻找数据标注员,让他们在AI数据集上工作,并将成品传回“全球北方”(北美、欧洲等地的发达国家)的AI实验室。但数据标注员发现自己在机器面前显得很无力,拿到的工资与自己所创造的价值也不成正比。尽管付出劳动和创造价值的是世界上最贫困的人口,获利的却主要是欧洲和美国的大型科技公司。这不是一个偶然性的错误,而正是AI机制的设计初衷。
AI产业具有剥削性、不公正性和残酷性。它压榨劳动者,获取大量劳动成果,却只给他们微薄的报酬。但是,AI的未来并不一定非得如此。如果要改变这台剥削机器,就需要先理解它。那些掌握AI的力量固然强大,但我们还是看到了在工作场所、街头和法庭上抗争的劳动者,他们在努力抗争剥削者。他们团结起来捍卫自己的利益,也向全世界寻求支持。
《投喂AI:人工智能产业的全球底层工人纪实》
[英] 詹姆斯·马尔登 卡勒姆·坎特 马克·格雷厄姆 著 贾青青 牟一凡 译
中信出版社/中信·万物 2025年10月