在ChatGPT时代,数据标注员仍在从事基础工作

热搜大全 > 新闻热搜 > 科技热搜 > 正文

在ChatGPT时代,数据标注员仍在从事基础工作

热搜大全 2023-07-27

肯尼亚内罗毕一群年轻人挤在狭小的办公室里,专注地在电脑屏幕上阅读着来自遥远国度OpenAI的英文字符。这些年轻人,热衷于追寻最新的科技发展,既希望拓宽自己的知识视野,也希望能从中获得更多的启发和激励。他们勇敢地挑战着语言和文化的障碍,力求将国际前沿的科技知识带回故土。 在这逼仄的办公室里,年轻人们用他们坚定的目光和忙碌的手指,翻阅着OpenAI的编程代码和技术文档,拼凑出一幅幅前所未有的科技图景。他们自愿承担着严苛的工作压力,毫不畏惧地攀爬技术的高峰。正是这种坚韧不拔的精神,让他们能够跨越时空与国界,将创新的火花传递给肯尼亚乃至整个非洲大陆。 这群年轻人怀揣着对未来充满希望的梦想,在这个遥远而又繁忙的城市里形成了一道革命的风景线。他们相信,在知识与智慧的指引下,非洲的青年们能够创造出具有国际影响力的科技成果。为了实现这个目标,他们不断追求学习和进步,展现出非凡的勇气和敢于创新的精神。 岁月的长河中,肯尼亚内罗毕这一群年轻人与国际科技发展潮流相连,用自己的双手书写着属于非洲大陆的科技时代。他们是未来的使者,为正在快速崛起的非洲科技产业注入了活力与活跃。他们勇往直前,用坚定的脚步和无畏的精神,打破了语言的壁垒,让知识的火炬在这片土地上绽放出耀眼的光芒。

他们工作的 9 小时中,要阅读、标注 150-200 段文字,每段文字在 100-1000 个单词之间。而这群人的薪水是每小时 1.32-2 美元。

当你和 Bard 和 ChatGPT 聊天时或许并不知道,它给出的每一个机智答案背后,都凝聚着无数数据标注员的血汗。

很少有人关注标注员,也很少有人深究他们的工作。然而,标注员是 AI 产业链极其重要的一环。在他们一次次枯燥、乏味的工作后,AI 模型变得越来越聪明。这群人有不同的工资和待遇,共同点是重复着同一份机械、辛劳的工作。他们就是 AI 时代的流水线工人。

近日,谷歌一份内部文件曝光。文件显示,Bard 的标注员要在 3 分钟内审阅、标注完 Bard 的回答。这些数以千计的外包工,在 deadline 重压之下吃力地阅读自己完全不熟悉的专业文字,一个小时挣 14 美元。

" 人们感到害怕、压力大、挣得太少,而且完全不知道正在发生什么。" 一位外包标注员这样形容自己的生活。

数量上百万的标注员遍布全球,很多都是外包工,在零工经济中赚取微薄的薪水。他们参与每一轮 AI 浪潮,又离台前光鲜性感的故事极其遥远。行业人士为 ChatGPT 和大模型将如何革新世界侃侃而谈,而这群标注员生活却没有任何改变,他们仍然 " 隐身 ",甚至生存状况更糟糕。

大战之下的小兵

谷歌正处于久违的危机中。在生成式 AI 竞赛中,谷歌已然落后于 OpenAI。

被颠覆式创新扔到大潮之后的恐惧笼罩谷歌,以至于内部一度发布极其罕见的红色警报(red code )。CEO Sundar Pichai 亲自上阵,全权负责 AI 业务。

在 2 月季度财报的电话会议上,Pichai 告诉投资者:" 接下来你们会很快看到谷歌的动作。"

接着,它们匆忙推出聊天机器人 Bard,5 月又发布了大语言模型 PaLM 2。

谷歌急迫地上马新项目,对 Bard 迭代心急如焚,最终的结果就是压力转移到最底层的数据标注员身上。

有很多个谷歌的合同工说,自从谷歌开始加入 AI 军备竞赛,他们的工作几何增长,内容也更复杂。这群标注员要处理药物剂量说明和法律文书等等专业文件,时间只给了 3 分钟,而他们根本没有经过相关知识的培训。

这种有时间限制,又要求精准的工作让人一直神经紧绷。标注员们的劳动伴随着恐惧,当然会影响工作质量。在一份员工提交的报告中,他们写道:如果一直要求他们这样求快,Bard 会变成一个危险和充斥着错误信息的产品。

然而,在白热化的竞争中,谷歌无暇顾及数据标注员的感受。他们受雇于 AI 数据训练公司澳鹏(Appen)和埃森哲,和谷歌切身利益没有太大关系。

AI 是个彻头彻尾的全球化产业。澳鹏的正式员工只有 1600 人左右,而外包员工数量高达上百万。这家位于澳大利亚悉尼郊区的公司伴随 AI 行业崛起成长为明星,一年收入 6 亿澳元。

可以预想,这一次生成式 AI 的狂欢会催生对标注员更庞大的需求,澳鹏也会从中分得更多利润。

只是,无论 ChatGPT 迭代多少代,硅谷大厂市值上涨多少倍,最底层的标注员不会得到太多好处。

我们可能摆脱标注么?

标注员的工作是纯粹的人类劳动。他们要比较两则新闻,评估哪条新闻相关性更高。他们也要判断 AI 给出的答案中有没有 " 一本正经胡说八道 " 的事实性错误。标注员们都有本守则,会从 6 个角度指导他们做出判断。

以目前 AI 的技术水平,根本无法离开真人训练。AI 标注其实就是不断地动用人类主观性做出常识判断。

AI 行业其实是一个劳动密集型行业,即便在大模型时代也是如此。

国家之间发展不平等的现状客观存在,所有劳动密集型行业要获得超额利润,必须全球分工。

对当地人来说,这种全球分工其实不是坏事。OpenAI 合作的外包公司 Sama 总部虽然位于旧金山,但它的员工来自乌干达、肯尼亚和外包大国印度。在肯尼亚,这些标注员工的工资为每个月 2.1 万肯尼亚先令(约合 1158 元),算当地普通工人的平均水平,而且坐办公室,不用做体力活。

ChatGPT时代,数据标注员还在搬砖

SAMA 公司员工,图片来自官网

澳鹏这样的公司会很精明地将工资定在最低工资基准以上,而且还会给一个月 70 美元的奖金。这对当地人来说是笔不错的收入。

在加尔各答郊区,穆斯林女性因为全球分工获得了工作机会。她们给亚马逊、微软、eBay 等等训练 AR 算法和自动驾驶数据。

一些中国年轻人则很欢迎这样的工作。在贵阳市百鸟河数字小镇,数字标准员中会有刚从高职学校毕业的学生,一个月挣 1500 元。比起送外卖、当服务员,他们其实更喜欢坐在办公室训练 AI。

作者项飚曾经很客观地评估过这种共生关系:" 由于 IT 行业的劳动密集型的特征,如果没有一个巨大的、额外的劳动力储备,该行业或许根本无法快速发展,由此无法向当地工人提供现有的就业机会。"AI 需要发展中国家的廉价标注员,而标注员们也需要这份门槛不高的工作维生。他们从来不是受害者,也不是需要人同情的弱者,而是一群努力、勤奋工作的普通人。

当然,我们不能因此将低工资、高压力的工作合理化。国家和国家之间的不平衡也不是压榨标注工人的借口。即便只是自私地为了 AI 学习数据的质量,这些吝啬的科技公司也应该给标注工人更好的待遇和工作环境。

AI 催生了明星公司、百万富翁,它还将改变各行各业,产生难以想象的收益。只是,这些宏大的愿景和坐在乌干达办公室埋头苦干的标注员无关。当某一天,AI 进化到不需要标注员时,这群从来不被承认的功臣又会被毫不留情地扫去角落。

" 我告诉我的朋友和家人,谷歌、亚马逊、苹果等公司的工程师就像人工智能婴儿的亲生父母和私人教师,而我就是清扫他们的育婴房并给他们洗衣服的女佣之一。" 一位标注工这样形容自己的工作。

或许,即便我们不可能短期内改变经济、知识结构的区域不平等,起码可以看见他们,衷心认可他们的价值,承认他们在 AI 时代的不可或缺。

故宫博物院:禁止穿拖鞋参观!

故宫博物院:禁止穿拖鞋参观!

热点 博物馆 微信公众号 拖鞋 网友 新闻 资讯 直播 视频 美图 社区 本地 热点 2023-07-23

张柏芝穿紧身露背长裙亮相 卷发造型显气质

张柏芝穿紧身露背长裙亮相 卷发造型显气质

娱乐热点 张柏芝 造型 长裙 紧身 气质 新闻 资讯 直播 视频 美图 社区 本地 热点 2023-09-23

全长183.663公里!绥大高速公路正式通车运营:共设9处收费站

全长183.663公里!绥大高速公路正式通车运营:共设9处收费站

科技热搜 绥化 大庆 高速公路 卫星 中国铁建 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-06

北京千万资产家庭数量全国第一:人员平均工资均超20万 半导体等行业最吃香

北京千万资产家庭数量全国第一:人员平均工资均超20万 半导体等行业最吃香

科技热搜 工资 行业 资产 北京 家庭 新闻 资讯 直播 视频 美图 社区 本地 热点 2023-12-07

圣旗H610M-HIH 嘿嘿主板图赏:别出心裁的H610 D5主板

圣旗H610M-HIH 嘿嘿主板图赏:别出心裁的H610 D5主板

科技热搜 ssd type-c 京东 酷睿 intel 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-06

曾被卖出19万美元高价!这台初代iPhone太猛了 曾被卖出19万美元高价!这台初代iPhone太猛了