本字幕由TME AI技术生成
大家好
欢迎收听本期的不合时宜
我是主播若涵
那很高兴又和大家在节目里用声音见面了
其实今天这期节目呢
我们想要延续一下这几年不合时宜经常会聊到了一个话题人工智能来继续展开
我相信这几年可能有很多朋友跟我的感受很类似
就是好像我们的生活一下子被ai 包围了
比如说我自己现在的生活里遇到了一些具体的问题
我自己可能下意识的就会打开gpt 来问一问
在节目录制之前的一个场景是我在给家里的植物浇水
然后家里有一株植物感觉快死了
我现在连这种问题也会拍一张照
然后问问叉海gpt
说可不可以给我解释一下为什么这个植物快死了
所以我会觉得好像一下子我自己的生活或者是工作已经有点离不开ai 了
前段时间回到老家
我发现家里人也会时不时的和这个豆包聊聊天
然后我三岁的侄子会经常跟他ai 玩具聊天
我能够感觉到大家一边在享受ai 发展的便利
但同时也产生了一种焦虑
前几年我们做了一期节目
叫做在ai 狂飙猛进的时代
人的价值是什么
那像我的侄子
他的爸妈可能会担心如果他过于依赖ai
会对他的成长或者是心理产生什么样的影响
我觉得除了这些从自身出发的担忧之外
Ai 作为一个产业当中其实有无数工作的工种
比如说那些为ai 进行数据标注的肯尼亚工人
他们的工作处境是什么样子的
目前处理很多很多ai 的这些数据中心都建在哪里
他们会对当地的环境产生什么样的影响
以及在硅谷从事这些所谓的前沿科技的it 工程师他们是怎么工作的
因为在这个过程中
有无数的工人
工程师还有创作者
他们成为了投喂ai 的所谓的饵料
我觉得理解这些问题对于理解我们今天ai 的发展也非常非常的重要
那今天我们的节目也请来了一位研究中美科技产业发展的学者
他目前也在浙江大学教书
应该是去年版
我们的嘉宾吴桐宇老师也写了一本深度研究硅谷it 工程师工作文化的书
叫做牛马游戏
先请吴老师给我们大家打个招呼
Hello
大家好
谢谢若涵的介绍
今天我们对谈的话题部分是来自于中信出版社最近出版的一本新书
叫做投喂ai 人工智能产业的全球底层工人计实
那这本书呢
它其实是三位牛津大学的学者一起写成一本科普的关于ai 产业的书籍
然后他们在做这个研究的过程中
其实做了相当多的采访
跨越了六个大州
采访了两百多个人
跨越了ai 产业的不同的面向
做了一本这个关于当代数字劳工真实困境的研究
那首先我们要不要先请童宇来聊一聊你在看到这本书的时候的第一阅读感受
我跟华东师范大学的夏冰清老师一直在做这个中国的ai 数据标注的研究
所以因为这个机缘
就跟牛津的这个oii 的这几位老师有了认识
他们这本书我是就是从中性开始关注
我就知道
我觉得他们是希望让大家更加准备好面对这个ai 进行一定的足够的反思
所以他们用的是更平实的语言跟公众沟通
我觉得这个点非常不容易
刚才若涵说的一些观察和交流
这本书可以帮助你去更好的反思
比如说你家的小朋友对吧
他们在用这个ai 的玩具聊天对不对
我之前其实听了一期那个圆桌派
他们邀请了那个李诞老师
然后聊到了一模一样的问题
然后李诞老师就是说他对这个ai 是一个极度乐观主义
然后他举了一个例子
就是说现在的小孩等于从他们开始接触世界
也就有一个非常全知全能的这么一个聊天工具
所以它比我们小时候接触的这个知识面要广的多
当时徐子东老师他对这件事儿是有担心
读了这本书的话
就可以让大家很明确的知道担心在哪
比如说这本书就会告诉大家说
你看见的这个ai 好像似乎是一个中立的陪你聊天的玩伴对吧
给你知识的玩伴
但其实它的背后是充满了很多的价值判断偏见的
然后这些偏见是怎么形成的
是因为它的所有的头位
它的数据是被一些数据标注员标注之后
如何去标注这个数据
它的数据更偏向让男性等
女性等更偏向黑人白人
这些东西都是有一定的分类和设计的
它会再往前退一步说
那隐藏的让这些数据标注员选择一些具有一定偏见式的标注的背后是什么
是资本嘛
对吧
是各个硅谷的大厂
硅谷的大厂它背后是有商业利益的
比如说是这些垄断资本
比如谷歌呀
什么苹果啊
这些利益
也有可能是书里面说的风投这些公司的一些利益对吧
他们的利益不是让他们从最一开始设计这个产品和设计这个数据的训练的方向的时候
就是想着如何更好的教育一个小朋友
而是想的是说我设计这个工具是怎样可以笼络最多的用户
那这个就出现了很大的问题
所以我觉得这本书就是以非常平实的语言
把一个我们很关心的事情的背后的庞大的系统给说的算比较清楚的
这个是我觉得这本书最可贵的地方吧
嗯 谢谢分享
我自己也有类似的感受
因为它涉及了这个ai 生产过程当中的很多不同的环节
那这些环节其实对于我们理解ai 其实是怎么被创造出来的非常的有帮助
我觉得今天我们再去消化一个信息或者吸收一个信息的时候
对于它怎么样制造的这个逻辑理解是非常重要的
因为我看到的东西会构成我的世界观
构成我对这个世界理解的一部分
但其实很有可能是算法的偏见构成了你理解这个世界的一部分
尤其是在今天我们看到很多东西其实都是根据你的兴趣在推送的
或者是根据你自己平时的这种思维模式在推送的
刚刚童宇提到的互联网公司的逻辑是希望能够让最多的用户去跟他进行交互
但如果你看到的东西并不是你想看到的
你可能就不想再继续去在这个页面浏览了
所以我觉得在这个程度上
它的这个逻辑是很像的
不管是ai 时代还是我们之前所说的社交媒体时代
我觉得如果我们要在这个过程中保持新型
那可能去理解它的这个链路是挺重要的一件事情
说到这个偏见的问题
我觉得应该可以分类成有意的偏见和无意的偏见
也就是说刚才我说的都是比较的有意的偏见
就是比如说资方因为一些商业利益把它往某方向去导向
但其实还有一些是无意的偏见
因为我是社会学的嘛
在技术研究里面有一个应该大家也很知道
就是这个数据鸿沟对吧
一个新的技术
像ai 的技术一引入到社会里面
其实越有接入口access 的人其实越有更好的运用这个工具
而越没有access 的人就越没有资源这个东西
某种也造成了一定的偏见
最后导致了不平等的加剧
我听你说你会用chat gbt 或者ai 去问一下怎么浇花儿什么什么的
我记得之前是跟一个某一个大厂研究员他们用研的讨论说他们发现很有意思
如果你去看美国的黑人旅行
你就会发现他们用chat gbt 更多的时候是在干嘛
是跟chat gbt 去聊一些关于宗教的问题
就是他把他当成了一个宗教的伴侣
所以你可以看见
就是说说人和人之间的这个差距也就拉大了
所以整个的机器其实会制造一个更加
如果用的悲观一点
就是偏见一些的
带一些难以挽回歧视的世界
我觉得这个点特别有意思
Ai 的出现似乎会让这个信息鸿沟进一步的拉大
举个简单的例子吧
就是如果回到老家
然后看爸妈那一代人用手机
其实很多时候都是被假信息包围的
而且他们很难拥有区分这个虚假信习的能力
他们的这个教育或成长过程中
其实没有受到过关于社交媒体信息筛选的这样的一种训练
那我觉得在今天的时代
如果不是一个对ai 这个逻辑有足够了解的人
你可能使用ai 的方法
就是像我刚刚说的那个场景
就是你有个什么生活的问题你就问一下
但是也有人使用ai 的方法是非常高级的
可以用ai 其大提升自己的生活效率
那在这个过程中
其实你产生的这种信息认知的差距是成倍成倍增长的
没错
应该是最新有个研究
就像你刚才说的第二类人
就是ai 变成了一个良性对他进行辅助的这些人
其实ai 是会增长他的思维逻辑
相反
Ai 是完全代替某个人去完成一些任务的人
代替人去思考
以这种方式去运用ai 的人
其实某些方面的思维能力和智商的降低
那篇文章还是很残酷的
所以你会看见人和人之间的这个鸿沟变得越来越大
包括我们同事之间
恰恰是因为读了太多的这种东西
就会让我自己用它的时候会非常谨慎
一个方面就是我会害怕它的那个幻觉
如果给了我一些错误的知识或认知
这个东西很难去改
所有一方面是因为我自己做数据标注的研究
所以数据产业我还是挺担心这些数据进入到无论是哪个ai 的系统里面
他们到底是以什么方式被应用流通
被流转
像我们现在最新的这个关于数据标注的研究
你会发现高质量的数据其实是这些大厂无论中国
美国或世界上任何一个国家是极其稀缺的东西
所以我就有一点会担心
说那我的数据他们这么稀缺
这种人类供给的而非互联网上扒下来的新鲜的数据
我的数据会不会被他们所用
所以这方面让我还不太愿意把我的自己的数据贡献给他们
但是我我们就在讨论说面对现在的世界
比如说我们在教书的时候
你不能拒绝说学生一定是会再去用这个ai 作为他们的辅助工具
那应不应该就是说借用在大学的这个环境进行一些系统的反思
所以我们现在态度是有一个转变的
从最开始我是很抵御的
就是说在课堂上我都甚至不喜要学生去用
但是到后面我觉得是
那我们能没有这种机会说用一个空间去讨论一下ai 是什么原理
有可能发生什么问题
然后再去用
所以我说这本书很重要
它会给你展现一个你天天用的这个工具的背后的系统和问题
是的
其实这几年在做ai 调查的很多记者
包括我身边有一些记者朋友也会出于各种各样的原因就是不使用ai
或者是尽量不使用大厂的ai
如果说你有一些小的工具
它是ai 驱动的
那可能也ok
我身边有一些环境记者
因为这个ai 它的数据中心其实对很多的自然环境造成了极大的破坏和影响
以及我们知道ai 这个数据中心是需要大量的使用到水这种资源的嘛
这个书里面有一个数据统计
是说一个国家数据中心建在那里之后
它的水资源的消耗量是在整个全国水资源一整年消耗量的三倍
那应该是说的是冰岛嘛
然后我觉得那个书里面写的就是冰岛的一个纠结就是在于他一方面很知道数据中心接纳进来贡献了他们国家的很大的gdp
但他一方面又知道说这个东西就会对它的环境进行破坏
就是一个非常矛盾的态度
其实我读在这儿还挺心酸的
因为就是说我们自己去贵州去做调查嘛
贵州也是一样是有这个很多的数据中心
他们去吸引各个中国的大厂进入贵州
甚至中际的大厂对吧
比如苹果到贵州去开这个数据中心
会强调自己的
因为贵州是那个喀斯特地貌嘛
然后它有那个落差
所以它的那个水利导致它的电费降低
对
他非常强调希希望各个厂厂我这边边去建数据中心
然后第二非常强调利用这种就像书中写的
就是原来本身是一个深内陆环境
如果是一个受空间局限的
任何产业都难以进入到贵州
但是因为恰恰像数据这种东西是靠光缆传播
空间对的限制降低
就跟冰岛其实一样
所以他就会觉得很愿意把这些数据中心引入进去
但是不存在就是像冰岛的这种反思
因为我们国家还是会觉得先把数字经济引入入进来发展为重吧
你的记者朋友们还是太
太先进了
我只能说 对
我觉得确实在整个全球ai 发展的过程中
欧洲其实一直扮演的是一个监管的角色
当然这个背后也有很多的争议
欧洲在这样的一个全球竞争的过程中
其实一直在落后
欧其在ai 的这种发展过程中
但是因为他一直都是在以监管作为他的一个在这种科技发展过程中的一个特色吧
可以说
所以我觉得自然而然的就是不管是这边的记者啊
还是这边的从业人员
他们都会优先的去考虑到监管这样的问题
但确实当你聊到创新这件事情的时候
你监管越多
确实创新就会受到一定的约束吧
一个双刃剑一样吧
刚刚童宇提到你的很研研究究关注中究究这这数数据标注的
就是你能不能跟我们详细的讲讲讲你的研究过程中数据标注这个事情到底是怎么完成的
然后他完成了之后是怎么样去构成我们今天所使用的这些ai 工具的
这个研究是我跟华师的
因为我们是两人的
因为是一个很庞大的那个研究
然后我们两个人从一九年开始进行这个研究
我们刚开始做这个研究的时候跟书里很像
就是中国当时起步主要是做这个图片标注
那会儿的话
大家在没有被大语言模型的注意力吸引的时候
大家都认为接下来人工智能会集中在无人车驾驶这件事情上
那你为了让这些车去识别出来
比如说马路上这个是红灯那个是绿灯
这个是行人
你就要把车能看见的一个一个图片里面的红灯绿灯行人给框出来
所以这个就是最一开始的这个数据标注的雏形
当然伴随着后面的ai 的发展变得复杂
而且像语言模型转向数据标注的形态变得更复杂了对吧
它变成了有更多的是对语言
对逻辑
对数学的标注
我觉得数学的这个要说一下
因为我在去做讲座什么的时候
我认为大家也有一个误解
就觉得这个数学什么叫标注呢
对吧
其实如果你到这些数据标注中心
你会发现它其实就是让标注工人去做一道数学题
给出一道数学题的答案
然后把这个答案给固定成了一个标准答案
然后再回味给这个机器
其实就是让机器学习到原来这么回答这道题是更合理的
然后他们再通过反复的
比如说机器再吐出一些答案
然后他们再给机器吐出的好的答案打高分
给机器吐出来的不好的答案打低分
然后让机器慢慢的往他们更期待的好的数学答案这边发展
然后大家可以想象
在产品落地阶段
就会变成一个比如说辅助我们小学生答题的
或者帮助辅导的这么一个chapble
这个就是大概整体的数据标注的这么一个逻辑和他的这个发展变化
就是等于是从比较简单的图片标注到比较复杂的逻辑文本标注
然后有几件事儿可以围绕这个说一下
就是说在中国的话
目前其实二零二二年左右
随着叉gbt 的普及
大家意识到就是大语言模型变成了一个重要赛道之后
开始着重的去做这个大元模型的这个数据标注
这时候面临了一个什么问题
这个就跟梳理我认为有一定的出入
我也跟他们讨论过这个事情
就是是其实数据标注员的技能的需求被急剧的提升
可以想象一下
以前的数据标注员需要的就是像书里写
或者说我像我刚才说的
给图片里面标出这是红灯绿灯行人现在变成了这些标注员需要会做数学题
比如文本的
甚至需要会鉴赏一些名著
写出一些就是短的这个鉴赏的评语
所以现在比如说中国的数据标注面临一个什么问题
既有的数据标注工人的学历和能以和现在所需要的数据标注的任务之间的不匹配
中国这边呢
我们的数据标注员还是教育上会偏低一些
然后因为就是无论是政策导向或者各种的比如人力成本的考量
都会给一些相对第一教育水平相对边缘群体
所以我们的调查里面覆盖了三种很有意思的人群
一个就是女性
比较偏远地区的女性
一个就是是职业高中的学生
最后一种其实是残疾人
残疾人是做数据标注很重要的一个群体
然后中国有一个很有意思的现象
我跟夏老师和james 的论文也写了
就是其实通过网上去云标注给大厂提供数据的比较少一些
相反
我们国家因为对于这个数据保密性等等等考考量
各个厂厂认为如果网上去标这些
他就把他们公司的一些关键数据泄露了对吧
所以他们都是得建一些大厂自己拥有的数据标注中心的
就是相当于是盖一个厂房
然后把人都放进去
那这些中心一般都会在中国的相对偏远一些的内陆的地区吧
这个就大概是中国的数据标注产业的情况
那就其实中国的这些数据标注员
他们都是更加成规模的在一个数据中心或者好几个数据中心集中工作的是吗
他们不是像是书里面会提到的一些案例
在家里就可以轮换的去进行这样子的工作
在网上我就领一个任务
我做完了就可以上交
他们是其实更多的是更像一个所谓坐班工作吧
是这样的一种模式
对
这个也是我们都会在国内和国际上一些学术会议去探讨的问题
就是很独特的一个中国的现象
所以一开始也会去关注这个所谓云标注
就像书里提的这些相当于自己坐在家里
你只要拥有一台电脑对吧
你可以同时为美国或者说其他国国家去做标注任务
但是中国好像是因为这些云标注的员工流动率非常
流失率也非常高
比如说一组任务或者是做一周他就不干了
所以让很多的大厂觉得这个不值
他的培训成本它搭进去了
而且这样干的话不好监管
就是你把所有人放在一个屋子里
还是很好的去监督工人的这个工作效率的什么的
所以中国还比较独特
那像这些数去标注工人
他们在了解说我要怎么标注这些数据之前
就这个前置环节是由大的科技公司他们来设计说我今天需要标注的数据量是哪一些吗
还是说其实工人们就是拿到了一个很大的数据库
他们会随机的投喂给这些数据标注工人
其实他是要有一个大的规模的任务从一个大厂会先选择去派驻到他自己的哪一个数据标注中心
这是一种形式啊
我们还有很多其他形式
比如一个大的数据标注基地
同时服务很多个大厂
但是我先说这一种
就是一个大厂它在中国
咱们说比如北方某些城市
南方某些城市拥有很多个标注基地
然后他决定把这一组任务先派到哪个基地
然后这个基地接到了这个任务之后呢
比如说你是一个标注无人车驾驶的图片的
或者标注医疗图片的
这个基地的经理和负责人
他们去去组织工人进行一次这个培训
就比如说遮盖雾遮挡物的标准是什么
他们是有一个非常厚的手册的
大厂会派给这个标注中心干完这件事情之后
是由标注基地去把这些任务分配给工人
做完了之后收上来质检
质检是交回给大厂
大厂如果觉得这个不合格
可能还会打回去返工
合格的话
这一批任务就完成了
那还有一种是说
比如说大厂说这一段时间我们都做这一个
就是比如说图片标注
要不然为什么说职高的小朋友说就跟上课一样
就很像你课程说这学期我们就学这个
就是一个月我们就做这个
然后你已经熟悉了
大厂开始按批次的给工人去派这些任务
那这个时候就其实是跟输也有点像
就是相当于大厂能掌握每个工人的完成的数据
那他看了这个工人比如完成的多一些
那我就接着给他更多的数据
如果那个文工工人完成少一些
我就少了一些
那这种的话
基本上要计件结算的
就是你多干的话
你就多得嘛
少干就少做吧
因为我们在书里其实看到在肯尼亚的标注工人们
他们的生活处境其实是蛮艰难的
并不像我们所想象的那样啊
不用做体力活了
就是在电脑前看看图片什么的
好像还挺轻松的
但其实是跟我们的想象很不一样的
因为首先他们的工作强度非常大
他们是有这个所谓的时间限制
你的鼠标需要动得非常非常的快
然后第二个就是他们工作时间很长
还有他们要处理非常非常多其实没有经过审查的照片
所以很多可能是会影响人的身心健康的
可是他们也没有办法在工作过程中得到相应的支持
所以我想知道在中国也是类似的情况嘛
像书中说的这种因为未经审查的这种图片造成伤害也有
但是感觉就是我们访谈的时候不是大家觉得他们焦虑的最大的来源
中国的有一个困境来自于想在大家都不知道什么叫数据标注
所以最一开始的话存在一个心理落差
就很多人进入这个数据标注基地
都以为自己变成了某大厂的雇员了
想象这是一个白领工作
但一旦进进入之后
我们访问的很多工人就会说
这个其实也就是电脑上的富士康嘛
对吧
就很快大家就会知道是枯燥的高重复性的工作
然后一个是觉得这份工作不可持续
就是中国很多的人都觉得做一阵这个东西
我可能就去做别的了
还有的就是他们会觉得这个订单非常不稳定
因为大厂做很多的这个人工智能开发的时候很具有实验性
那实验性一意味着什么
就是说有的时候我会在这一时刻需要大批的数据
就是去帮我完成这一批的程序的优化
或者说这个模型的设计
有的时候我就不需要这么多数据
所以导致你在这个偏远的地区接收到这些任务
就是有的时候你的任务量非常高
这时候就是出现很大量的加班到夜里十一点什么什么的
但有的时候是面临什么就没有数据
意味着就是说你的收入非常低
所以这份工作会造成很不稳定的这个收入情况
这个是可能中国很多的标注员工焦虑产生的来源
当时就是deep sik 问世了之后
我也有测试traack gbt 和deep sick 他们在回答相似的问题的时候的不同的答案
我发现其实国内的这些ai 工具还是蛮有中国特色
或者是他还是包含了很多中国文化的元素在里面的
比如说你要是问这两个软件一些关于成功的态度啊
或者是说对于亲子关系的态度啊
你会发现traack gbt 他的回答是非常的个人主义的
他会说你要先照顾好自己自己之类之类的
但是deep sik 他可能会说你也应该要理解你的家人
我就会觉得这个真的非常有东亚特色吧
我想这个其实也是可以溯源到我们背后去做数据标注的过程中
以及这个数据标注体系到底是怎么样产生的
对
其实我感觉这件事有点复杂
就是它能形成它的这个其实我们叫价值对齐嘛
就是你更对齐中国的价值还是希望价值
它应该有两步都要完成
一个是在相当于数据标注工人这边
虽然你给这些工人一些比如说呃
样本对吧
案例说你按照这个东西去标注
但其实就是我们的研究
我就会发现它还有很多的东西在你操作层面是非常主观的东西
我举个例子我觉得非常有意思
其实现在的chapboat 是有分不同类型的对吧
有的chapboat 是一个陪伴聊天似的chabot
这些大厂就要定说那我这个陪伴呢
Chapboat 是一个什么样的性格的
把他们要设置置这个像
像这个chaabboat
我是一个温柔的女性啊
我是一个这个幽默的男性啊
推到最极端
要么就是说我是温柔的志玲姐姐
要不然就是我是非常我北京人啊
然后就非常逗的那个葛优似的
就是那种葛大爷似的是吧
那这怎么实现
他要通过标注
他是需要标注员说说好
你现在要给他们写一些更像葛优似的
就是语言似的聊天那内容
这是一种
第二种是说好
我现在给你一些机器吐出来的聊天
你帮我来判断哪个更像葛优
那你说这事儿是不是很多都集中到了这个标注员的判断上了
就是这些标注员的风格判断吧
就融入到了这个机器的最终形成
因为他判断
比如说这个机器给他的答案
他觉得哎
这个东西不够葛优
你要继续再练对吧
或者说他是一个南方的标注员
他判断不出来
他觉得第一个就够了
所以这个你会发现是一个标注员的判断
但问题是在于它还有两步
标注员的判断都要归总到这些大厂对吧
大厂里面是有他们的跟标注员去对齐的负责数据的部门
其实这些部门的人是具有更高的话语权的
那在中国的大厂里面
他们是会经常开会的
聘请很多的专家
专家会对这些标注员的标注结果进行进一步的评判
然后进一步的
其实他们要制定那个标注手册的这些人
那这些专家往往都来自于比如说心理学
比如说社会学
比如说教育学对吧
然后他们就带入他们自己的视角
我还觉得很有意思
确实没有做性别训练专家进入到
其实我觉得他们但是他们很多的争议
其实该有一一个性别视角的专家
所以你会发现就是这个积器的训练里面
这些更偏社科科学的专家的声音进到这个里面
那第三个还有什么
就是纯没有这些人的价值判断是通过他们的这个微调ftuning 的算法的判断去完成价值对齐
那这个时候的话是有一定的技术门槛的
但我觉得我的猜测是
那在设计这些算法的时候
工程师的价值判断就进入到了
因为我们另一个有名的一本书是写这个审核的
他就说因为工程师缺乏一些这个人文社科的训练
其实也不是说他有意义的
而是说他设设计算法的时候他不考虑这件事情对吧
所以他经常设计的那个算法后面后续带来很多社会问题
你反推其实就是当时的不注意
它里面举的最典型的例子
社交软件就变得越来越极端
然后这个作者他就说回溯
其实就是最一开始工程师在讨论的时候
他们认为算法去筛选出来更极端的声音可以让他们拿到更大的日活量或用户量
就是一个完成工程的考量
但他没有想到这件事会引发这个社会问题
所以我相信工程师在他们的这个算法设计里面
他们认为他们做了一些工程的判断
其实背后也有社会价值的融入到这个机器里
导致了最后这个机器变成了各种各样样的
我觉得聊到工程师这个话题也很有意思
因为你其实之前的另外一个研究当中
是在你之前出版这本书叫做牛马游戏当中
其实是有非常深入的研究过科技公司他们是怎么样去塑造工程师身份的
以及工程师们在硅谷的这些大厂里面又是怎么工作的
所以我觉得我们既然聊到了工程师这个话题
也可以顺着它继续深入的来讲一讲
你知道当年在学校里面理工科特别好的学生
如果说大家未来有一个什么所谓就业的理想目的地的话
那就是去硅谷当工程师
所以我蛮好奇你为什么会对他们产生兴趣的
对对对
我觉得现在工程师已经不授于那个理想的那个是吗这个群体了啊
因为硅谷的我们很多人也在说这个问题
就是现在的这个叉gbt 第一波会替代的人其实是初级的工程师
我们都在讨论
没有定论
就是说这事儿到底是不是硅谷这些大厂有夜为止
因为比如他们新训练的当时的那个ctgbt 最突飞猛进的进步其实就是算法编程的进步
那后来工程师说这不就是逮着我们要替代吗
因为工程师的那个工资太贵了
那我还不如把这钱放在去优化这个下一gbt 呢对吧
对 算法
一堆优化算法的工程师最后发现他们更年轻的一帮人被替代了
所以这是现在的境遇
其实我那本书是讨论就是说如何让工程师去驯服到这个非常高创意占用的这么一个生产
但是其实我当时最触动的发现
那是跟我另一个背景上有关
因为我另一个领域是性别训练
然后我当时会觉得硅谷里面占有话语主导权的工程师完全不是我想象中的这些所谓的技术宅
什么
就是白白弱弱的那种白男是吧
我要强调就是并不是二零二零年以后的硅谷
我是之前的硅谷
你会发现竟然主导当时硅谷话语权的也是那些非常aggressive 出现在就是美国电影里面老说这个东海岸常青藤高校里面兄弟会里的这些
就是如果你看过社交网络那个电影
就讲facebook 嘛嘛
Zacbook 几次被排除出去的那个club
有一对兄弟就是是那种高又又体育非常好对吧
那那个电影里面讲的zebook ook 是特特例嘛
是
是通过他的这个产品闯出出来了
但是其实在硅谷当时占据主导权的其实是那对兄弟这样的人
他们就是常青藤毕业的
进入过这种非常精英界阶级的club
然后有非常漂亮的履历
他们毕业之后其实是去华尔街也行
去硅谷也行
但只不过在那一波互联网泡沫之后
他们都会觉得硅谷是一个更好的投资方向
所以他们就去了硅谷
那我当时觉得这件事特别突破我的想象
因为他们带来了很多的常青藤里面这些club 的这些风气
就是互相之间的蹂躏
耻笑
强调运动
练肌肉等等等等的
然后冲击到我们原以为的这些技术宅白男他们的在硅谷的主流的话语体系
像这本书里面也提到
本身硅谷是被一个加州意识形态主导的
会同时强调比如说平等自由对吧
就是它是极端左翼和极端右翼的一个结合的主体对吧
他希望在足够平等足够自由的情况下开发出来最前沿的产品
所以在这种风气导向下
其实是有一段时间以前的这些技术宅的这些工程师还是很尊重比如女性
然后去甚至参加一些feminist movement 这些东西对吧
但是因为有一批我们说在美国非常的霸权式的男性气质的男性进入到硅谷
导致了这些白男技术宅们也变得很紧张
也要证明自己的男性气质怎样怎样
所以当时硅谷出现了很多丑闻
就比如说这些工程师开始去开发一些非常的歧视女性的软件啊等等等等
然后这件事儿对我的冲击反而是挺大的
当然他没在我书里面写太多
有一本书是castle 写的
然后他就说
说在互联网文化里面有两种人
一种人就是我刚才说的技术宅那些人
苹果里面的这个初代是steve jobs 和这个wassniark
Wasniac 是那个技术宅嘛
Castle 写的书里面就说有一批人是wasniarc
他就专注于代代儿
非常的nerdy
还有另外一批人被castle 这个作者形容成什么叫具有双头鹰的头脑的人
他一边有一个engineering had 工程师的头脑
一边有一个什么manager ahead
就是说他也有一个经理的管人的头脑
然后他就会说
说这种具有双头鹰式头脑人会主导互联网文化
其实就是硅谷文化
其实这批人他们进入到硅谷之后
很快的就升到了中层或中高层的经理为职
最典型的就是谁吗
Ellamsask 嘛
问硅谷的人
他们不都说他不是engineer
他就是一个engineer manager
其实就在说这件事儿吗
就你们那边的
我觉得还有一个特别有意思的点
就是像硅谷的这些工程师
他们的工作都是极具有创造性的
那你在研究这些硅谷公司是怎么样去管理工程师的过程中
发现他们会涉及很多游戏化的管理方式
所以工程师们在这个过程中会产生一种游戏主体性
那你觉得这种主体性和我们真正所说的一个人需要在工作中所拥有的主体性到底有什么区别呢
对对对
我试图展现的他是会更微妙一些啊
我当时在书里面试图论证的是说
首先这种主体性他不是被资本后期建构出来的
就是说资本说啊
你给我表现一个狼性文化对吧
那你不愿意表演
你的主体性里面没有资本去硬给你建构
那这个就是很拙劣的一种管理或者统治方法嘛
硅谷这些资方还是很精明的
微妙的
所以他琢磨就是说他雇的这些工程师身上本身具有一些什么东西
这些东西如果他们调动出来
这帮人更容易认同他们
然后他们就发现了
说这些人基本上都是生于一九七零到二零零零年左右
他们都是电子游戏蓬勃的一代
其实就跟现在你可以想象中国一样
中国只不过凑后了几年对吧
现在小孩儿就是你问他王者荣耀怎么玩儿
他们都很熟对吧
很有一种长期游戏训练练来的一些技能
能比说反应很快
然后说也要倒计时要到了
就是迅速能集中起来注意力对吧
就是说我要把这个关给过了
然后就是说如果是打打战战对吧
一组人还特别有那种英雄主义
说我带着这组人一块儿去打
然后硅谷你调动
哇塞
就这些东西
如果能把他们调动出来
用在他们的工程开发里面
它是跟工程开发有相似性的
比如工程开发里你碰见的困难
我也希望你调动这种打团的这种去攻坚一下对吧
比如说你碰见了一个棘手的这个错误
你希望快速解决
如果我给你安一个那种赛车式的timer
你也能调动他的那种危机感
然后高度集中注意力形成脑瘤什么什么的
这个如果只是调动
那其实我觉得不够微妙
只不过是原有的工程师的这些主体性被他们也调动出来
但他的问题是在于硅谷调动出这个主体性的同时
要把这个主体性往他们所希望的这方向去调整微调嘛
也就是驯服对不对
咱们刚才说的那种玩家或者游戏主体性对吧
他是有硅谷要的这一边的东西
但是你也有硅谷不想要的那一边边
比如叛逆啊
不喜欢监督啊这些可能他又不希望有
所以他是怎么用一套统治或者控制术把他们希望有的能贡献他们生产的东西给调动出来
又把他们身上有的东西往资本希望的方向去改造了
但你要知道
虽然表面上看可能他用这种方法让你的痛苦可能少些
你一边玩着或者一边干着你喜欢的东西
你就把这个事儿给干了
但你要知道
你贡献出来这个劳动力是被资方占有的
被大厂占有的
他支付你的钱跟他因为占有你的劳动力获得的钱之间是有很大差距的
他可能一周的工作为大厂贡献的东西是他的工资的二十倍
这个就是咱们所谓的剩余价值的问题吗
没问题
就是你可能也有成就感
但你要知道在这件事儿里面谁更占便宜
因为我出完书之后
回那个鬼谷的那个弯曲沙龙也去做讲座
我跟他们也讨论过这种工程
说
说你这书不能停了啊
要接着研究究
我们现在日子过得更惨了
就是
就这意思
对
我希望提醒大家就是不要太爱好你自己的事作
把你的工作当爱好似的
你会太透支自己
我自己也提醒自己
因为学术也一样
透支你自己的结果是什么
就是有一些工程师会发生的事情就是他觉得他上班也是一件他喜喜的事事对吧
也跟玩游戏似的
他回家也干的是一个跟上班差不多的玩游戏的
他一天就是都消耗在这事儿里面了对吧
有些工程师就是彻彻这受不了了
就离开这个行业了
甚至有些工程师说离开了这个行业
由于这个行业又把他的爱好就是这个电子游戏给消耗了
他甚至再也不玩游戏了
同时丢失了你的工作和你的爱好
当然这个其实在劳动社会学也有一个概念
就就叫burn out 嘛
然后我经常提醒那个硅谷的工程师
就是说你要是哪天下班突然开始不想玩游戏了
那你就微笑
你就可以缓缓了
这个就是burn out 的那个前兆嘛
我觉得回国跟很多我身边的朋友聊聊天
我觉得大家其实都多多少少处于这种工作倦怠的状态
我很累
我不想上班儿
但是你没有办法去停止
那你如果停止工作了
你就没有工作
那你这种失去工作焦虑更能
甚至比burnout 的焦虑更强
所以大家就变成了一个齿轮
你其实没有办法停下状态burburrow out 有一个非常重要的点是什么呢
就是你的工作和说生活的边界急剧的模糊嘛
这是burn out 的一个触发前因
很多的学生在写
就是说那你这个模糊边界的机制是怎么回事
他当时用的案例是facebook 嘛
Facebook 本身是一个非常private 的social media 对吧
但是慢慢的随着这个东西延
它变成成了一个恨不得你作作的推
推销自己一个什么project
这个那个
我觉得这事儿真的是在微信上更严重
其实很难
但是就是说你能不能你个人私人领域的东西保护好了
然后有一个很重要的边界给自己设定说几点
那之后的空间都属于我自己
我觉得最危险的一个症状就是属于你突然对你工作之外你生活的兴趣都不感兴趣了
我经常拿这个去检验我自己
我想接下来可能我们会做一期播客节目
讲讲今天的社交网络和算法是怎么样让大家的生活变得很糟糕的
我觉得确实
当你需要重新回归到自己生活
重新去感受自己跟生活的联系的时候
你首先是要远离一个虚拟的世界和一个被算法驱动和操控的世界
那我不知道童宇你会不会觉得就是ai 的出现
可能会让我们一定程度上从一些所谓的狗屁工作当中解放出来
其实我觉得就比较丧
以前的就业市场是有上中下的
比如最上面的是个高技能高知识的
中间是这些可能更加的文书性的
稍微重复的
但也需要一些技能的
最底下的可能是那些不需要技能的
我们讲社会学经常会用的
比如说在麦当劳打工对吧
其实现在新的是像数据标注员
就是等于你可能快速能掌握一个东西
你还不需要文凭等等等等
就是把中间这一档抽空之后
会面临的是什么
就是你的labor market 变得就是往两边更加极端
要不然你要挤到那个最creative 的
就是你是做出deep ick 的那个算法的那个人
如果你做不到这个的话
可能ai 把这些都替代了
那你就直接下沉到什么了
就下沉到了数据标识工人
对
所以就是说这个就是我们所谓的一个非常两端极化的就业市场的出现
那可能很多人以后做的就是在学术里面说什么就是辅助机器等更加低技能的工作
而且很容易被替代的
比如说你年龄大的或者怎样
你就被替代
倒不是说那个技能被替代了什么的
然后你这个在一个极化的劳动力市场里面
你对上面的creative work 的要求也就更高了
以前如果ai 不能替代初级工程师的时候
你就是会写代码也是可以的
但你当把他给替代了之后
你都得是硅谷这种精英的工程师
就是我说现在硅谷很多人很担心的就是你必须得升到那个高级
就是设计将来的这些人
那对这些工作的从业者的要求压力就变得更大嘛
我不知道你有没有追踪过你当时研究的这些工程师他们后来的一些境遇
因为其实最近我们看到很多新闻
像亚马逊大裁员
能够明显感受出来的是初级的工种消失了
所以如果你是一个刚从大学毕业的这个it 程序员
你很有可能就找不到工作
因为你需要从可能最基本的这个初级工程师一直升上去
但是现在这种上升路径和阶梯好像消失了
因为ai 的出现
对呀
你说的太久了
我们当然追踪越来越多
其实这些工程师都是说准备就是退休了
不到四十岁
没有再往下的干头了
为什么
就是比如说你刚才说的一个现象
他们就在讨论
他们招小孩儿就是招这个初级工程师
这些小孩已经不会写太晚了
因为他们开始学习写代码的时候已经有ai 了
所以这些ai 是帮他们写代码
你要让他们用一个白板写代码
他已经不会了
就是说随着这样的话
大厂就不太招初级工程师了对吧
但问题是你现在的高级工程师都是初级工程师变成的呀
那你要是现在不招初级工程师
那再过十年谁是这些高级工程师呢
这是一个我们经常会讨论的问题
就无解对吧
第二个让他们觉得挺丧的
就是说提早退休
天天那数我自己挣够那个退休工资了吗
是怎么造成的呢
就像我刚才说的
其实在一个小的工程师市场里面
也有这个劳动力市场的极化问题
Zagberg 花一个亿争抢六个工程师
是每个工程师都能变成那六个人吗
被争抢的那六个人
那不就大家都是那个被裁掉的那个省下那批去雇他们那个钱的那个ai 部门嘛
所以就是不太乐观
我觉得硅谷的两波裁员
第一波裁员其实当时是为了了开源节流吧
为了省钱
就是经济不景气
那第二批其实你会发现所有公司都在向ai 去转向
聊到这里
我可能问一个可能听众朋友们也会很感兴趣的话题
那就是那在这样子的一个时代
到底你拥有什么样的工作能力比较容易保持自己的这个工作主体性
这个问题我觉得也个人
但也非常社会学
也起码劳动社会学学
我们一直关注的就是你在劳动力力场里里面
你最大的跟跟orpower wer 是有多大程度上你是不可被替代
其实这个问题换一下就是说你拥有什么样的技能是不可被替代的技能
各种学者有各种不一样的见解
比如说有的学者他的意思是以后倾向于情感的
陪伴的
或者说这种互动式的
其实就是说你想这个东西可能还是机器的最后一公里嘛
就是虽然他能模仿人
但是他能在多大程度上pass 这摩尔定律说我就是
就是说跟人呢
比如说护工一样的这种陪伴的这个水平能力
可能这个不见得那么容易实现
所以这种陪伴性的工作可能是一个反而被替代的技能
在美国的就业市场
比如说像护士啊这些
他们其实是一个很难被替代的工种
所以他们的工会也强大
工作也相对稳定
那还有的
我觉得肯定是这个高创意的
就像这个书里面很很多都是在写的
就是说这个代码再好
你是需要一个最一开始具有极度的锻裂性创意的人把这个代码给发明出来
或者把这个技术给发明出来
我比较倾向于他书里面叙述的另一方的这个看法
就是说你所看见的这种真正的世界上改变历史的或者说具有伟大成就的创造力背后其实是一个积累
然后你才有这个灵光乍现的这一项对吧
那这种积累再到灵光乍现这件事
不是机器的这种大元模型线性的积累
如果要是机器去模仿乌迪
艾伦
他可能想的说我怎么去学一百部电影
最后就出来那一部
算不算一个created movie 对吧
Film 但乌迪
艾伦你可能会想他是什么
他可能用一辈子是在纽约地下的一个爵士俱乐部
他专注在他的爵士音乐里
那这件事儿的积累可能会浸染他电影一些风格嘛
对吧
你会看见他的那个电影其实还是有很多这种即兴吧等等的这种感觉
那这种创造力是机器我觉得还是替代不了模仿不来的
我记得我之前也看过一篇类似的文章
然后是一个心理学家叫做john hardson
他后来被那个open ai 雇佣为了公司的所谓的首席专家
然后跟他们公司的这个高级工程师一起去研究agi
因为agi 他其实是又是更高阶的一种
他是这个所谓的super intelligence 嘛
可能甚至都不需要给他太多指令
他都可以自己自动的完成很多任务了
那他也写了一篇文章
我回头可以贴在我们节目的这个说里里面他就讲说他负责设计这个noa gi
那他会觉得说有哪些能力可能是未来ai 也无法替代的
然后他说
他觉得其实是现在因为知识已经不稀缺了
你所有的知识都可以直接问ai 得到
但是可能某一种智慧是很重要的
然后他把这个智慧总结成了好几个能力
其中就包括你的这个情感成熟的能力
比如他举的一个例子
因为他很长一段时间都是负责给这些硅谷的高管们去做这种leadership 的培训
然后他就发现那些最厉害最优秀的人才
他们是能够在高强度的情况下依然做出冷静的决策
你对你自己的emotion 其实是有很强的把控的
比如说你面对一个可能你自己并不太喜欢的合作者
但他确实有能力可能带领这个项目
你能不能在这个过程中去摒弃自己的一些个人情绪
做出正确的决策
他觉得这种emotional clarity 的能力很稀缺
然后跟人建立connection 的能力非常的重要
有些人就是很有亲和力
很好相处
你在他面前就特别能够展现脆弱
虽然我还不知道这种能力你可能未来用在什么样子的产业或领域
但他会觉得说
因为你可以跟ai 建立很多这种直接的简单的联系
但是人和人的这种展现脆弱
Ai 不知道未来能不能替代
他可能作为一个工具
作为一个机器还是没有办法去承担这个角色
然后他说这几种能力其实在微软公司里面一直被他们作为这个首要的战略去推行
所以在这些科技公司内部
他们会觉得这些能力是他们去培养未来的这种所谓的leader 啊或者是leadership 很重要的几个维度
哎
那这个的话
我可以被社会学打个广告
不是说以后学社会学的更有用啊
而是说我们在社会学非常强调的一种能力叫反思能力
或者说批判能力
就是你有独立的判断这件事情是否成立
以及你经常会问一下为什么会有这么一个结论
那这种能力我觉得接下来配合着这个ai 的发展很重要的
因为你想想chair
Boat 会每天给你灌输无数的知识
你能不能判断出来这个有问题
这件事儿本身就很重要
当然了
另一个更深一层次就是说独立思考的这个批判性能力
其实产生新的知识
我说的这种知识可能不是那个ai 基于之前的所有的这个数据产生的平均知识的知识
而是那种再一次带着
呃
人类往前再走一步的这种知识
那你也要潜知
条件是你有批判性
意识到之前的知识是有不对的
怎么去培养你的一个批判和这个独立思考能力
我觉得也挺重要的
未来
那如果我们把这个话题放在一个更加全球维度的视角来看
就这种大模型的产业链是否在加速形成这种所谓新的全球分工以及技术殖民主义
我个人对这个技术殖民主义这件事我是保守的用的
但是我觉得全球分工肯定是会产生非常大的变化的
这个我是非常同意书里描述的这样不得不接受的一个事实
就是说所有的技术研发更集中到了中国和美国
而更加辅助性的工作
像数据标注会下一道
比如说书中写的像非洲的一些国家
那我自己的观察
比如说是东南亚的一些国家都会变成辅助这些技术的一些工作的地点
然后比如说有一些国家就变成了他不是参与到工人的分工
但参与到这条链条里面呢
就是书中描述的这种数据中心
那我的理解是像他描述的冰岛这些地方是因为它资源的优势
所以会产生这些对的center
还有一个中国企业因为要处理比如说最简单的抖音嘛
他要处理take k off 的这个问题
就是说数据的出海或者不出海
以及如何进入中国和不进入
那他会把很多的data center 放在像东南亚的一些国家
那围绕这些data center 会出现一些新的小的
我管它叫tech up
就是它又不是那个最核心产生核心技术的地点
但它又变成了中国和美国去把它的技术出海向外传输的重要的踏板的地点是什么
就比如像新加坡这种国家
我会把它认为它是更加是帮助这个技术去普及商品化落地出海的一些功能性的国家
所以我是非常同意就是说未来的这个所谓的geopolitical 对吧
全球的这个版图是围绕着中国美国为核心
然后围绕这些其他的次边缘边缘版图敞开的
这个我是非常同意的
你觉得在一个其实特别被男性气质或者是尤其是白人气质主导的这个所谓的人工智能产业
这样子的一种文化会怎么样影响算法的偏见
导致可能我们未来世代或者是在ai 世代下成长起来的人啊
会怎么影响他们的这种性别观念
然后在这个过程中
我们可以做些什么去改变它
这个真的是很无奈
就是当年硅谷很有名的一个性别
但是代表了中产白人女性性别运动者sarsamburg
就是那个meta 的那个女性的那个执行官
他不是写过一本书叫拎in 吗
他认为女性的领导者要set down the table
就是在决策的这个桌子上面
你是要做到上面的对吧
那我觉得这件事情很重要
因为在我观察的像我说的
比如说决定这个数据以哪个方向去标注对吧
决定机器往哪个方向去翻聪明ing 这些事情的时候
如果有一个女性研究者或者决策者加入一个性别的视角说
哎
那这个机器为什么就非得是一个女性秘书式的声音呢
对吧 哎
为什么问的这个关于婚姻的问题
就一定假设问这个问题的人是问女性呢
就需要有这种声音
就发出这种为什么对吧
这个我觉得非常非常非常重要
起码我觉得这是最可行的吧一件事情
还有一些其实就是这些年一直倡导的东西
我不确定就是说将来还有没有用
因为其实在硅谷还算比较乐观的时候
他们会倡导过让女性进入更多的这个steam 领域
就是学engineering 啊
所以他们会有一些cota 去偏向去招女性工程师
更多的女孩进入这些数学program 呀
或者说编程program
我觉得这个的话
反正目前以硅谷的现在这么幼倾的情况可能不太现实了
然后还有的就是我是很担心
还是那个问题
就是数字鸿沟
因为就像我说的
背后有资本的逻辑
资本就会假设女性跟这些模型更多的互动是关于陪伴的
然后他就会想很多的方法吸引女性去用这些模型去进行疗愈陪伴
甚至现在不是都有什么虚拟男朋友什么的对吧
那我就在想
会不会以后的这个chat boat 的是有这个gender segregation 的
就是相当于更加处理职业性的
事务性的
公务性的是倾向男性
而更加处理情感性的
陪伴性的这些东西是被女性用户所拽取
而且资本会发现这个的好处
尝到这个甜头
会把这个事情往更极端的去推
这个是我比较担心的
但我也不知道有什么解决办法吧
我觉得今天其实聊了很多话题嘛
技术进步的这个暗面
它的背后其实是怎么样进行权力集中的
然后他怎么样让很多人的劳动不被看见
甚至是剥削很多人的劳动
像我们刚刚提到的这个肯尼亚数据标志中心的工人
甚至很多这个数据处理中心当地的很多的工人的生活处境
以及怎么样造成这种工作的不平等的家具
你觉得普通人有没有什么可以去实际采取的行动
就比如说你可以尽量少的去使用大公司的这些超保产品
是不是可以支持一些更小的公司
可能可以平衡一下这个资本在这个背后的关系
除此之外
我确实也会觉得有点无力哈
因为它的这个技术发展就好像是像洪水一样朝你袭来
你自己都很难去完全的避免在这样的一个环境下
就是完全绕道而行吧
但是我觉得有一个挺类似的例子是在就是全球环境变暖的这样的一个大的背景下
有很多的这个所谓的环境爱好者
或者是说他们很在乎我每天的这个碳足迹的一些普通个体
他们会从自己的生活当中去做出选择
比如说我就少坐飞机
我能够用火车出行的我就用火车出行
虽然我觉得这种你从个体来看
你可能减少碳排与这个世界总量相比还是非常微不足道
可是如果很多普通人都可以为他的生活消费进行选择的话
或许他最后也会造成很大很大的改变
对
其实我刚才跟你讲有一个很一样的一点
就是去多元化使用
不要去完全使用那些垄断的这些大的ai 产品
我觉得这个就是挺有用的一点
然后我个人的话
希望特别鼓励像我的父母一辈去用ai
还是那个数据鸿沟
就是数据鸿沟
还有一个鸿沟是什么
是年龄吧
就是一个新的技术出来
最脆弱的一个群体其实是岁数更大一些的群体
我自己做也是就是很微小的事情
我觉得不希望父母一代这么快的因为这个这么迅速的技术就被更快的淘汰
对
我觉得这个提醒特别重要
就是我们其实今天很多的视角都是从我们自身或者是我们的同辈人的角度出发去讨论的
但是回到父母身上
我也是在临走之前都给他们各自装了很多的这个所谓deep seek 啊
然后豆包这样子的语音软件
因为我会意识到
如果他们不用这些工具来查证一些信息
他们每天都被很多铺天盖地的假消息所包围
如果说有一个工具能相对而言还稍微好一点的给他提供各种视角的信息
我觉得已经比之前的那种境遇要好一些了
我特别同意
好呀好呀
那今天我们其实非常感谢童宇来到节目里面
然后大家对如我我们今天天的话话感兴趣趣
可以去看一看中信出版社最近出版的这本书
叫做投喂ai 人工智能产业的全球底层工人纪实
那我们也会在节目的评论区抽出几位听众来送出我们的这本书
非常感谢
谢谢鹿涵
谢谢童宇