本字幕由TME AI技术生成
the是
欢迎收听三五环
我是刘飞
今天是一期单口
篇幅比较短
很快就能听完
今天想聊聊近期科技圈和投资圈的热门话题
manners和AI智能体
二零二五年三月六日凌晨
manners横空出世
一夜之间刷爆了朋友圈和微博
虽然我们经常讨论AI
但智能体这个概念对很多人来说还是比较陌生的
所以咱们聊聊什么是AI智能体
minus为什么能引起如此轰动
它可能对我们的工作和生活带来哪些感变
首先
让我们了解什么是AI智能体
智能体agent这个概念并不是最近才出现的
它最早可以追溯到一九八五年
人工智能创始人之一
认知科学家马文明斯基在心智社会一书中提出的概念
当时他给出的定义比较模糊
大致意思是当环境给予反馈时
智能体可以根据反馈来改变策略
以便更好的与环境交互
直到现在
科学界对智能体仍然没有一个非常明确的定义
但我们可以通过一些例子来理解
比如二零一六年击败李世石的阿尔法狗就是一种智能体
AI智能体和我们现在常用的拆GBT这样的大语模型有本质区别
简单来说
拆GBT这样的大语言模型主要是思考和对话
而智能体则是行动
openAI将AI发展分为五个等级
第一等级是对话机器人
第二等级是推理模型
而AI智能体处于第三等级
前两个等级可以视为修炼内功的阶段
而到了智能体这个等级
AI才真正开始能够执行复杂任务
并做出合理的决策来实现人机协作
我们可以把智能体理解为一个能够自主行动的AI助手
它不仅能理解指令
还能主动规划任务步骤
调用各种工具和资源
最终完成交给他的任务
比如
它可以帮帮助筛选简历
分析股票市场
甚至规划旅行路线
接下来聊聊minus
minus是中国团队开发的通用型AI智能体产品
二零二五年三月六日正式发布
开发minus的团队叫蝴蝶效应公司butterflyeffect
创始人是肖红
联合创始人兼首席科学家是记忆超
minus这个名字来源于拉丁语manusetminus
意思是手脑并用
或者说知行合一
这很好的体现了minus的核心理念
不仅要思考
还要行动
minus不只是一个聊天机器人
它是一个真正能干活的AI
官方介绍说
minus是一个通用的AI代理
它能够独立思考
规划并执行复杂任务
直接交付完整成果
季忆超在介绍manus时说
minus不仅仅是一个聊天机器人或工作流
它是一个真正自主的主体
弥合概念和执行之间的差距
其他人工智能只是在生产想法
而minus交付结果
我们知道现在市面上的AI大模型
比如chat
GPT cloud
豆包等等
它们主要是帮我们生成内容
回答问题
但要真正完成一项复杂任务
往往还需要人类的大量参与
minus的目标呢
是让AI能够自主完成整个任务流程
从规划到执行
最后直接给出结果
在技术上
minus也有一些突破
据官方介绍
minus在guy基准测试中
在所有三个难度级别都实现了对openAIdeepresearch的超越
guy啊
是评估通用AI助理解决实际问题能力的一个全为基准测试
简单来说
就是测试AI在面对各种复杂任务时的表现如何
minus在这个测试中表现出色
说明它在处理复杂任务方面确实有一定实例
minus的应用场景非常广泛
官方也展示了几个非常有代表性的案例
比如帮助用户筛选简历
在演示视频中
用户向minus发送了一个包含十份简历的压缩包
minus首先会像人类一样解压文件
然后主页浏览每份简历
记录下重要信息
最后
他会提供排名键e
候选人简历和评估标准等辅助材料
甚至还能根据要求创建表格
minus的一个亮点是
他可以在云中异步工作
所以呢
用户可以随时关闭电脑
等任务完成后
minus会通知用户
在执行任务过程中
用户还可以随时给他新的指示
比如在演示中
工作人员又上传了五份简历
minus就会把这些新简历也纳入考虑范围
从更大的事角来看
二零二五年被业内视为AI智能体商业化元年
其实早在大语言模型横空出世的二零二二年
专家就预测到AI领域的下一个爆点将是AI智能体
因为它是普通人接触AI的门户
如像互联网时代的网页
移动互联网时代的app一样
但这两年智能体的发展一直不温不火
原因之一可能就来自缺乏一款能够让普通大众感知理解何为智能体的普及型产品
如今
minus相将于一夜之间完成了市场教育
目前全球各大科技巨头都在布局智能体领域
去年底谷歌发布的german二点零
一口气推出三款AI智能体
除了搜网页
写代码等常规能力
它还可以在绘画中保持长达十分钟的记忆
并以人类正常语速与人对话
今年一月
openAI推出了名为operator的AI智能体
演示了其独立完成订票
购物
订餐等复杂任务的场景
openAI的总裁兼联合创始人格雷格
布罗克曼在社交媒体上表示
二零二五年将是智能体元年
字节跳动
科大讯飞等国内大厂也在押宝智能体
不过有意思的是
越来越多一夜刷屏的产品和技术来自名不见经传的小团队
小公司
无论是deepseek
还是开发miners的蝴蝶效应公司都是如此
这是因为相较于大模型
智能体的开发门槛更低
适用场景更多
事实上
每一种人类与世界的交互都可以做成智能体
每个人都能根据自己的需求创建智能体
未来的工作模式可能是一个人带着一群智能体完成
minus的官网注册流量激增
甚至一度导致服务器崩溃
据说有人甚至在二手平台上高价出售minus的邀请码
这种现象我们在之前的AI产品发布时也见过
比如最早的chde
GPT
再到国内的文新
译言等等
从专业角度看
市场咨询机构高德纳预测
比智能体更智能的代理式人工智能agentic在二零二五年十大战略技术趋势中位居首位
到二零二八年
将有百分之十五的日常决策由代理式人工智能自主完成
这个预测很大胆
百分之十五的日常决策由AI完成
这意味着我们的工作和生活方式将发生重大变化
不过也有专家持更谨慎的态度
上海七智研究院学术带头人吴毅曾表示
不一定非要成为优秀的程序员
用自然语言交互的方式
每个人都可以是自己的产品经理
也许智能体没有爆款
只有适合
这句话很有意思
也许智能体没有爆款
只有适合
这让我想到了个人电脑和智能手机的普及过程
最终每个人都会根据自己的需求选择适合自己的产品
在日前举行的二零二五年信息与通信技术行业趋势年会上
中国工成院院士邬鹤全表示
二零二五年不仅是智能体的元年
也将是AI终端的元年
从个人助手
心灵导师到知心闺蜜
虚拟分身
尽管过去几年这条AI智能体赛道已熙熙攘攘
但manus的出圈儿让公众真实意识到其中的潜力
展望未来
AI智能体可能会给我们的工作和生活带来深远的变化
首先呢
智能体从单一任务执行向复杂决策跨越
代表他们能够处理的问题会越来越复杂
解决方案也会越来越全面
这会不会导致一些工作岗位被取代
确实
一些重复性的工作可能会被智能体取代
但同时也会创造出新的工作机会
比如
我们可能需要更多的人来设计
训练和监督这些智能体
就像工业革命时期
机器取代了一些体力劳动
但同时也创造了新的工作岗位
而且
智能体更可能是作为人类的助手和合作伙伴
而不是完全的替代者
正如前面提到的
未来的工作模式可能是一个人带着一群智能体完成任务
这样人类可以专注于更具创造性和战略性的工作
根据市场分析
医疗 金融 制造
教育和客户服务等领域可能会率先受到影响
比如在医疗领域
智能体可以帮助医生分析病例
提供诊断建议
甚至监控患者的健康状况
在金融领域
智能体可以进行风险评估
投资分析和欺诈检测
在制造业
智能体可以优化生产流程
预测设备故障
几乎每个行业都会受到影响
而且随着技术的发展
智能体的能力会越来越强
应用场景也会越来越广泛
不过
我们也需要关注一些潜在的风险和挑战
比如数据隐私安全问题
以及如何确保智能体的决策是公平
透明和可解释的
对于普通人来说
我们应该如何应对智能体时代的到来
首先是保持开放的心态
积极学习和适应新技术
其次
思考如何利用智能体来提高自己的工作效率和生活质量
最后
也是最重要的
我们需要发展那些AI难以替代的能力
比如创造力
批判性思维
情感知能和跨学科思考能力
虽然智能体可能会改变我们的工作方式
但人类的价值不仅仅在于完成任务
还在于我们的创造力
情感和人际关系
技术应该是为人类服务的
而不是相反
技术的发展最终是为了让人类生活的更好
而不是让我们成为技术的奴隶
技术本身是中性的
关键在于我们如何使用它
未来以来我们必须面对
希望每一位听众朋友都能在这个智能体时代找到属于自己的位置和价值
感谢大大家收听
哎 再见之前
不知道各位朋友有没有听得出来啊
今天我的情绪格外稳定
因为前面你听到的全部音频都是由minimax生成的
而文稿呢
是由minus生成的
这其实是一次挺有意思的尝试
这些内容啊
我基本上还是认同的啊
就让大家感受一下
这几天呢
一直在试用minus
接下来说一说比较主观的方面
一个是具象一些的
呃
总说agent啊
说minus是通用智能体
大家其实估计很多都还没有啊
真实的体感
没有什么概念
我简单描述一下
就是
我们可以给出一句话
就跟在deepsik啊
在其他拆的GBT啊
这些大语言模型一样
呃
跟它用自然语言交互
呃
给出的这句话呢
它可以完成很多在电脑里可以完成的各种各样的任务后
它的方式式是打
打开一 虚
虚拟里
你就可以看到在你的界面里
因为minus它是网页版本
那网页这个界面里呢
它会打开一个远程的虚拟机
就用过虚拟机的朋友可能知道啊
就比如说
你可以在macbook里面啊
装一个windows的虚拟机
相当于电脑里面有了一个假的电脑
一个模拟的电脑
那这个虚拟机呢
就有点像
像一实习习
你打开了电脑
你看着它操作
manus它可以以开浏览览器
以写脚本
可以处理理媒体文件等等
比如说说天
我有一个尝试就很有意思
我试着让它在极客客上定时发布内容
极客它是有网页端的
那minus打开网址之后
他发现需要登录
他就会问你
OK
现在用户是不是可以帮助我登录
可以接管
那这个时候
manusus在执行的这个页面
你都能看得见
所以你可以看得到它打开这个页面之后
有一个登录的二维码
那我就拿我的极客APP扫码登录
他就会去找
现在登录完了
那在哪发布呢
发布按钮是哪儿啊
怎么发布啊等等
中间的过程其实很摁住
比如说他发布按钮找不到
那我就会输入啊
因为你在任何时候都可以通过对话来打断他
来指挥他
所以我当时就跟他说
你看左边那个红色的加号的按钮
那就是发布的按钮
他就说 哦
我知道了
这个是发布
然后就能打开了
然后呢
发动态的时候
也会出现各种各样的问题
那我中间就会不断的指挥他
他就会慢慢学会怎么发出这个动态
那现在呢
各位也能在即刻找到这个ID叫阿卡琉斯那个卡呀
是这个显卡的卡
阿卡琉斯的这个小号
这个小号目前只发了这么几条
因为到后面它就崩了啊
服务器崩了
这是目前用manneas最常见的一个问题啊
就太容易崩了
那整个体会下来
指挥一个AI在虚拟机里做各种事情的感觉
很奇妙
确实就是你在指挥一个
呃
AI实习生的感觉
比如说我用一句话让AI写了一个海贼王的人格测试题啊
我也会把这个网址放在shownote里面
大家可以感受一下
很有意思
最有价值的地方就是在于
现在他能把很多任务去做一些拆解
这种拆解的过程有点以假乱真
真了
它跟人做任务的步骤接接近
比如说
我让他开发一个
呃
击击游戏戏
他的任务进度度怎怎么排呢呢
他说
创游游戏
开任务务清单啊
研究这游游戏原始机制和设计
搭建游戏开发环境
设计和游现物理引擎
开发飞船控制系统
创建游戏障碍物和元素
设计视觉和背景
测试和优化游戏玩法
最后向用户交付
那这种拆解其实是非常非常有价值的一步
可能过去的AI
它没有到达这种智能的程度
能把一个任务这么好的拆解下去
那对我来说
写半导体的稿子经常用到AI
但是搜集资料
很多时候还是得靠自己啊
因为现在的AI搜索
只能搜到最核心的关键词
比如说你
呃
问一个企业的历史
那它基本上在搜索引擎里就会只搜某某某企业
某某历史
那就完了
那manus它会怎么拆了解呢
比如说我让他搜一个企业的历史
他会把任务拆成撰写创始人传记章节
撰写公司早期历史
撰写创新与里程碑
撰写它的全球扩张的章节
撰写挑战与适应
撰写现代发展与未来的展望
那每个环节
它搜索的关键词都会做是适应性的调整
这种感觉就很奇妙了
那说回来
当下mannas还是有两个比较性的问题
嗯
第一是从时间来说
平均一次操作要在半小时以上
有的困难点的项目啊
浏览器打开的速度很慢
信息整合也很慢
那几个小时可能就过去了
慢倒也还好
对吧
我们做领导的
毕竟要给实习生一些宽容嘛
但是我目前的几个会话
多数已经在宕机的状态了
就是你反复聊天之后
它会提示哎
上下文过长
或者说显示有
呃
服务器负载的问题
就会强行关闭对话
也因为这样
所以每天虽然给了好几个额度
但是好几个额度做不了多少任务
就很快就超标了
第二个问题是
产出的质量效果也还不够稳定
呃
除了服务器的不稳定
产出的结果呢
你会发现
有的还不错
有的很不稳定
不可用吧
这可能还是因为产品刚刚上线
没有多少迭代
也没有多少用户真实的使用案例
所以对minus的期待是有好的结果
哎
每一次结果都是好的
这种期待啊
是不太现实的
希望这个实习生一上手就特别有专业度
也是不太现实的
但是这也不妨碍乐观的一个方面
首先
刚刚说的这些问题啊
其实感觉上都还是技术上可以解决的
你包括说卡顿呢
太慢啊 呃
在输出结果不稳定
呃 等等
这些问题
其实可以通过迭代去发现
该怎么优化用户的这个任务啊
产品上要做哪些支持
我会相信minus在年内
至少从结果来看
做到七十五八十分太上的水准
难度不会特别大
那你可能也会问
哎
从信息搜集和整理报告来说
deepsick和cloud是不是也能比较好的完成啊
或者说是搜索能力的差异
或者说你输出的结构有一些差异
这些似乎好像不是技术门槛
其实很关键的区别在于什么呢
manus它作为agent
它用的是虚拟机
虚拟机就意味着原则上AI能跟我们日常操作一样获取信息
而不是通过固定的接口
举个例子
未来minus也许可以接手我们手里的photoshop
我们的powerpoint
提供更多输出的可能性
再比如说目前的搜索引擎
它有的结果质量不好的原因在于
我们也知道
现在网页里面有好的信息的可能性不是特别大
因为很多内容平台都是封闭的
我们要去各个内容平台去找有价值的信息
那么虚拟机是不是有能力在保护安全和隐私的情况下
用我们自己的账号去获取公众号
小红书
知乎等等这些平台的信息来作为补充的输入呢
那这些场景就代表着很不一样的价值
所以mannus给了很多身边现在呃
在做AI的创业者很多信心
也给了实际的应用场景可以参考可以学习的一个方向
乐观的地方就在于
AI的入口肯定不是chat
boat
minus这样的产品
它还是初步展示了未来的可能性
因为科技产品的发展
一定是往人性更懒惰的方向去的啊
张小龙当年在演讲的时候讲过经典的一页
人是懒惰的嘛
那跟AI聊天
反复确认
听取建议去自己做事情
还不如让AI把剩下的很多事儿都做了
免费邮箱取代个人建站
微信又取代邮箱
这都是不可逆的道路
AI是上手接管更多我们日常的这些机械的工作
也是不可逆的一条路啊
所以
对于minus当下的批评
批评是容易的
但能不能看到其中的机会
看到未来AI进化的方向
还是需要一点眼光的
从交互方式而言
对人类最自然的
那就是自然语言嘛
自然语言一定会取代代码
关键词搜索
手工的图表绘制等等这些还是我自己比较独信的
自然语言指挥AIAI去完成这些机械的工作
就是minus这样产品形态了
那这这样通用场景的产品啊
就跟十几年前我们用微微信时的卡顿
或说几年前在网上购物的不方便一样
它还需要时间的证明
总的来说
我个人的体验还是
啊 有点会车
开了远光灯
眼前一亮啊
这是今年初在deepsik之后最惊喜的产品了
也是最值得体验的产品
那种看着AI自己在干活的感觉
有点像我们第一次看到电灯的那种体验吧
未来我们的世界可能会灯火辉煌
就说到这儿了
希望对大家有启盼
欢迎在小宇宙
苹果
powcast的订阅和收听三五环
也欢迎在评论区留言交流
如果喜欢三五环的话
也恳请能在苹果powcast
spotify或者喜马拉雅留下你的宝贵好评
下期再见
comeongoodmorning
caniwanttoliveaway
不声彩于ddown
所以根快有忙
toleavewand
youhaveanthecar
嗯