本字幕由TME AI技术生成
好
欢迎大家收听三五环
我是刘飞
今天邀请到的是原智能的两位联合创始人刘潇和罗旋啊
跟大家打声招呼吧
大家好
我是刘潇
呃
我是原智能os 的cto 啊
我是一个互联网人
然后也做了很多年的ai 应用
哎 大家好
我是罗旋
我是原智能的现在cpo
然后负责产品
包括跟对外的合作
包括一些社群的活动
呃
现在我都在负责
我之前是阿里的ai 和机器人的产品总
后来呢
一八年出来又创立了一家机器公司
现在从机器人这块儿出来
跟几个朋友一起成立了这家ai 大模型的公司
就叫原智能
就是因为我知道原智能本身也是罗旋老师组织的
上次在博客的时候聊过那个深圳能的黑客马拉松
然后参加之后那个原智能是第一名
能不能简单介绍一下当时组织的这个活动
以及说对这个原智能的第一名的这个当时的情景
呃
我简单讲等一下啊
就是我们上次是三月十一号
我
我组织了那个中国第一场的aigc 的haackson
然后呢
当时有六十多个团队
最后决赛进决赛有十七个团队
袁志仁这个团队是当时我们的冠军
当时还没有单独成立一家新的公司
全职在里面呢
可能就一两个人
然后后来又兼职的有一两个人进去
呃
但是这个项目本身是非常有特点的
而且非常的在全球范围的这个开源社区还有开发者里面是非常有声望的一个开源大模型
当时那个项目是基于这个开源大模型
我们做了很多的info 和
呃 应用
所以当时我们这个hxson
十个评委一致认为这个项目是最好的一个项目
所以当时是拿了冠军
后来我是经过第一季的hackson 过了以后将近一个月的样
原智能的包括
呃 彭博
包括孔琴还有刘潇就邀请我加入这个团队一起来
我们单独在深圳这边成立一家公司
就叫原智能
因为上次咱们见面聊的时候
那个这个活动刚结束
当时这个评比里面相当有技术含量的一个
不仅是说找了一个场景的探索
就是它本身算是首屈一指的一个开源的大模型对吧
呃 没错没错
它不单是国内隐像
甚至全球范围内的一个非常有特点的一个开源大模型
第一
其实它做的整个的架构不是基于现在open air gpt 的一个架构
其实是在transformer 的基础上做了很多的优化
把整个transformer 的就是时间复杂度把它降下来了
从n 的平方到到了
这是一个巨大大的一个进进
在这个负杂度的同时
整个的性能并没没有出现衰
可以说现在在全球范围内这个模型都是非常有竞争力的
只是因为我们整个团队的人数比较较
现在还在融资的阶段
等我们的的整个的模型的那个参数量和数据集逐步的起来以后
我们可以看到跟市面上的一个大模型的一个竞争优势
刘潇这块是怎么看的
尤其现在的像open i 的路线有哪些区别
什么是rwkv 模
这是rwkv
我们叫软酷啊
其实就是这个
三年前彭老师就开始做这个事儿
那个时候还是gbt 二的时代
彭老师他作为一个毕业于物理系
但是他对这个神经网络脑神经这一块这个特别熟悉
然后他很快的迅速的发现了这个gbt two 的这个优化空间
这个优化主要是在这个时间和空间复杂度上的优化
然后就很受到这个国外这个开源社区的认可啊
后续他就是以这个为起点
然后不断去尝试优化
然后从这个rn 的这个角度去优化这个目标
就将这个transformer 这样n 平方的这样的时间复杂度降到了这个on
然后将这个空间复杂度从on 降到o 一
实际上就已经做的很极致了
其实这个我们也看到
觉得这是一个很神奇的事情啊
就是其实这里面就有很多的这个trick
很多的这种技巧
然后也是一个思考逻辑
怎么去理解这个transformer 里面的弱点
怎么去理解这个transformer 它是怎么去记忆的啊
怎么去推理的
然后他怎么再去把它这个这些技巧去迁移到这个rnn 里面
然后并且能够训练收敛
让这个模型能够去有能力去记忆
这样就比拼这个transformer
这个过程我觉得非常有趣的过程
那能不能说的再具体一些
就是这个大模型和
呃
目前其他家做的
包括大厂做的那些大模型有有哪些可以描述出来的区别吗
首先就是他每次去推理的时候都要去看上下文
Rnn 是一个有状态的
那个状态本身是要能够去
就更像是人的思考的记忆的方式
一个长期的记忆啊
可以这么理解
那么这个transformer 可能在细节上面记得更好
大家都因为觉得这个transformer 替代了rnn 嘛
这么一个过程就是确实这个当时来说性能更好一些
他在做任务和各个指标上面都表现的比rnn 要好很多
在这个rnn 这一块去改进的时候
就要思考说怎么去让这个rnn 能够学习到contest learning 啊
然后学习到这个就是更细节的内容
这个常识的记忆更加有优势势啊
是把这这优势也能体现出来
同时能够把细节也记忆的更好
这个是我们从这个一开始的初心
就跟这个现在各大厂的这个初初衷也不太一样
就是大家可能还是以一个现有的底座去不断的去往里面加数据训练来做的
我们想去做下一代去更远的长远的去看待这个
对这个长远的预期
比如说这个事情我们应该是开放的
然后让这个模型在端上能跑
然后把这个性能指标做到极致啊
这就是我觉得是一个比较大的区别啊
听起来的那个路径和方向是不太一样
那对于大厂来说
它其实不是特别care
说成本
或者说关心可能调用的成本就可以了
不
不用关心这个建上的成本
就未来的目标是让端上都可用
可能都每个人能低成本的去建一个大模型
就是更多的时候大家也可以迁移到这个rn
就是这个rwkv 为底座的模型方向上啊
我们认为这是一个未来的方向
同时在目前的性能指标下面来上
我们是和这个一百四十亿的参数下面是百分之七十的任务是超过这个同类的gpt 的这个模型的
也就是说其实我们是占了上风
在一百四十亿参数的情情况下面
然后我们认为这个参数量再增大的时候
会有更加神奇的事情发生啊
因为实际上很多这个底层的逻辑不一样
以后我们可能同时还能战胜gptgpt 类型的模型的话
将来这个到一千亿的时候
它会发生什么样的神奇的事情
我们都很期待啊
现在的成本有没有比较具象的表述
大家现在感知上
可能比如说你要烧显卡
你要去要非常大量的数据
包括标注的数据
那你们目前
呃
就是在成本上的降低和在效率上的提升
有没有更更具象的一种表述
比如说我要做两倍的参数量
那么这个transformer 架构它需要四倍的这个运行效运行的成本提升
它如果做三倍的参数量
就要九倍
Rn 是不会的啊
就是这个啊
Rau 是不会的
对一百四十亿参数来说
我们的成本可以控制到一百万人民币这么一个情况
其实对一家公司来说
它是有能力去训练一个小而美的模型的
其实在三十亿左右就有涌现嘛
一百四十亿的这个参这个模型它已经有这个比较好的能力表表现了
可能在这个这个chair of salt 这个大面会稍微弱一点
但是对于一些特定的任务上面
比如说写作或者摘要
呃
一些工作流就是有生产效率提升的这个问题上面
都是有空间可以做到很优秀的
我们刚才说这个我们的调优成本就更低了
这个确实是一个比较大的一个优化
对目前来看它可能是比较适合
比如说它不一定是去跟那些大厂做的那种所谓agi 的或者接近agi 的那种覆盖各种场景的大模型去竞争
未来很可能是因为它开源以及成本更低
是不是在很多垂直场景啊
在很多垂直领域
大家都可以用它来搭自己的这个模型
是这样的
开源这个事情在前期的时候
你看默默的做了三年
大家都不知道的时候
他是一个缓慢和呃
需要意志力和这个执行力的过程
因为没有人来帮你
彭博就是rwkv 的作者
不断的去这个调优自己的模型
去清洗数据对吧
还要找算力
这个过程也是一个漫长的过程
但是到后面的时候
这个开源生态就是原来肯定是很慢的一个过程
当大家都知道都了解
然后到开始相信这件事情的时候
这个事情就会有一个把一个质变
那么这个时候还会快于这个闭源的项目
我们这个可能在垂直领域上面就会出现这个很多的这个开源生态里面的小伙伴们都在
就去把这个模型进行各种优化和调好
像搭积积木一样去做一些模块
然后去调整模型的输出
它这个能力的成本很低了以后
它就确实是能够去把这个特定领域打穿的
其实我们在这个不断的去训练模型的时候
我们也想提供更全面的能力
其其实两个都不会冲突
它既会去在垂直领域里很多的快的节奏的这么一个开源生长
也会在这个大的这个这个领域里面和这个open i 直接竞争
我觉首先第一个模型的它最大的两个特点
第一个就是它的复杂度
时间复杂度和空间复杂度
这个带来的绝优势是将将这个模型型端上
尤其是在呃
芯片上跑的话
它跟现在的gbt 相比是有绝对的领性优势的
呃
另外一个呢
就是这个个模型它
它整个的贡献是开源社区区做做多的贡献
献个跟现在的open en i 也不一样
Open i 虽然叫open ni
但是它在三点零以后就已经闭源了
它已经不再open 了
这就是我我们跟
呃
现在的市面上包括oni 和其他基于gpt 的模型最大的两个差异点
回过头来就是说我们接下来会做哪些事情呢
就是 当然了
我们会基于我们的优势去端上走
包括c 端
包括在硬件端怎么样
甚至在芯片端怎么样落地大模型
我们的判断是大模型的未来是在端上
而不是在云端
为什么呢
首先第一
云端有一个巨大的问题
就是我的数据全部都要通过云服服务去到open ai 或者是其他云服务的
呃
或者是ai 厂商的服务器上
这是一个巨大的数据安全问题
这是所谓你们在做的是私有化部署对吧
呃 两个
一个是在c 端的手机上私有化部署
以及在我们b 端的自己的服务器或者是它的私有云上去做部署的
这个是一个巨大的问题
现在大量的商业公司
包括呃
金融
包括律所
呃
包括医药公司
他们都想用当模型
但是关键问题就在于我不敢用
因为这些公司都有巨大的这个数据安全的问题
他们是不敢用的
所以
那现在有没有一家公司能够提供一个能够在本地化部署的一个大模型
这就是接下来可能大家都会看的一个市场
而我们在这个市场上是有领领先优势
就像刚刚说的
我们在训练和推理上对资源的消耗跟gpt 相gpt 这种类型的大模型相比
是有绝对领先优势的
还有一个一个关键的点啊
就是我们现在发现开的gpt 现在是我们大部分人都在用的一个呃
产品嘛 对吧
但tyf gpt 有一个大家一直吐槽的一个点就是它长文本支持的不好
呃
无论是长文本的那个生成也好
还是其他也好
它一旦生成长文本的话
它的整个的性能会出问题
所以cpgpt 实际上是在有意的去限制你的长文本的生成的
因为它本身是一个on 平方的一个复杂度嘛
文本长度越长的话
它的复杂度是一个成几何式的一个增长的
我们反倒是是可以很好的在生成一个常文本的这个领域做的很好
比如说一些商业的文书
比如说代码的长的代码的生成等等
这个领域是有绝对的领先优势的
这就是我刚刚其实提到了我们几个关键的落地还有跟gpt 的差异的点吧
这也是我们接下来可能会要做的事情
就比如说现在大厂投入了很多啊财力
投入了很多呃人才
然后花重金挖人
包括啊服务器等等
那在这方面的竞争
呃
你会觉得你那这个优势是是因路路上的优势
还是说因为你们选择的路线在这个刚才说的这些
不管是呃
人才啊
或者投入的资源也好
并不输大厂
还是说
嗯
你们也会有人才或者财力上的各方面的压力
Ai 这个领域最关键的问题本质上就是未来这个算法要跑在芯片上
过去的pc 的芯片也好
包括后来的手机的芯片也好
包括现在的一些ai 的专有芯片也好
包括包括谷歌的tpu
甚至是现在在端上有很多易构的一些芯片
将来算法肯定是在端上跑
这个是效率最大化
成本最低
最大规模使用的一个场景对吧
那终局这个算法的空间和时间的复杂度就成为了一个决定性的因素
比如说我们的
呃 时间是on
空间是o 一
这已经达到极致了
那这是对芯片极度友好的
第二是什么呢
我们的一个开源的这种方式其实是一个很好的
很快的能够聚集大量的对这个模型感兴趣有热情的开发者来一起贡献这个代码的这种模式
最近在美国湾区也在讨论
到底ai 是应该开源还是应该像open ai 这种闭源
我们的一贯的认为是闭源是闭不住的
开源才是真正的长期能够快速的把大模型这个市场能够提升到一个新的高度
甚至是保证大家所有人的一个平等发展和在ai 这个领域安全的一个最终的一个方案
所以一方面是在大模型的这个技术的底层的逻辑上
我们走到了一个正确路上
另外一个在整个的生态发展上们也是走在一个正确的路上
既然我们的这个目标是对的
方向是对的
那我这个过程是什么样子
你跟大厂竞争
你有没有足够的资源在这个过程中保证怎么样不会死
不死掉
所以一方面我们是在快速的在一些场景下落地
一方面我们自己也在谈一些商业的合作
还有一个就是我们同时在融资
我们也是想确保这样一个在中国的一个非常有竞争力的一个大模型能够很好好的发挥它的价值
我们也是希望能够跟其他的一些商业合作伙伴一起
能够把这样一个目标正确呃生态未来会繁荣的一个大开源大模型能够做的更大
而不是恶性竞争
其实我觉得就是说刚才说到路线就是这一块
其实transformer 核心是因为成本很高
是的
人太少了
其实开源生态核心就是大家的智慧其实就更加的这个开放的时候有更多涌现出更多的模型的底座的这一个生态
那其实我们既然已经往这个最终目标了
就是刚才复杂度空间度其实会出现就是原来这个更多的这种架构
罗大厂也会去关注我们
然后去去研究我们的这个里面的核心的东西到底是什么
那么这个过程其实也促进了我们整个生态里面的小伙伴然后来去认识这个模型
然后去改进自己的东西
这个过程是希望我们希望看到的
对
就传ansmmer 是一个偶然
其实我们认为叫软库这个方向是一个必然
就是刚才聊到开源闭源的问题
我其实在想
像open ai 他之前是讲过
就是他整个团队成立之初
其实讲过要开源嘛
但后来做闭源是不是还是商业化的考虑
就是之前烧了太多钱
想先把钱还上
我刚好前两天也问了陆奇老师三个问题
就是他怎么看待现在的这个ai 的生态问题
他认不认为未来生态是一个开源
开放分布式的一个生态
他其实是非常认可的
但他其实提到了两个点
第一
Oppo ai 呢
开始之初是想做开源的
呃 为什么呢
因为他认为
呃
Ai 这个东西其实威力很大
那怎么样保证它不被坏人使用
最大的好处就是让所有人都能用对吧
那所有人都能用
就是坏人用的时候
好人也能用
对
那这样的话
就会达到一个平衡
就是为什么到了三点零到三点五的过程中
Oppo ai 就闭源了呢
陆西老师给我的回复是
他认为可能open ai 产生了一些别的不同的看法
他认为open ai 是一个出自于一个非常善意的一个理由来做了这样的不同的决定
就是把它闭源了
Open ai 认为在他们往agi 的道路上发展的过程中
发现这个工具威力实在是太大了
在一些局部环境
在威力太大的过程中
即
即使是到到时候能够证证人和坏人都有这个工具
但一旦换人使用的话
这个损失很难挽回或者很难避免
当前的第三个问题就是关于ai 的安全问题嘛
最近弯曲不是提了
包括马斯克啊
包括一些ai 的大佬都说要停止
呃
研究agi 这个方向的
要停六个月是吧
但是我觉得这是很奇怪的一件事情
怎么可能停得下来呢对吧
就是大家
呃 可能对呃
Ai
包括甚至接下来的agi 这个事情的严重性可能应料的还不是特别的清晰
其实我个人认为是两点吧
第一
Gbg 四是被劣化的
是什么意思呢
就是他要对齐人类
所以他能力是比他应有的能力要要差的
就相当于是他其实是可以有更强的能力
所以大家可以知道的
一旦gpp 四的能力不受限制的时候
它
它又会会有多的一个个影响
另
另外一个就是我们现在的最大的直接的影响的安全问题
其实现在是数数安安全问题
就是你发现现现在所有有数据据都在被两两家公司收走就
而且这里还存在说如果大家都都在调用的话
你
你难免会输入一些东西嘛
就你说未来word
Excel 这些通过那这个nrp 通过这些交互
通过ai 这一层交互全都过一遍
确实想想还挺
挺有问题的
你以前是个分布式的
以前就相当于是每个弊端公司它自己在云端有云服务
我每个不同的app 它都会有对应的另外呃
某一家商业公司的这个云端服务去调用对吧
如果它是调云服务的话
它不会这么集中的
集中在一个公司或者是一两个公司的大模型的云服务上面
就相当于是一两家大公司未来可能半年到一年会收集到全球可能有百分之五十以上的人的数据
这是一个非常恐怖的事情
以前
呃
我们在移动互联网或者互联网的时期
如果有这样的
比如说我的数据在一两家公司手上
这其实已经是一个非常严重的一个数据垄断的大模型更严重
它不单单只是收你一部分的数据
它几乎会把你所有的数据收走
你像你想想看
微软一下子所有的都接g
无论是你论你dd 还
还是你teams
包括他现在
呃
En 还自己提供的chat gptt 也很多人在用
包括notion 其实接的也是gpt
包括我们现在学语言的那
那个东林 呃
多林国
它也是接的gpt
相当于是它是一个os
结果这个os 是在云端
它可以实时的把大家所有的数据升上去
我感觉是在造一个神
我们一直认为怎么样保障人类跟ai 的一个和平共处
其实之前有人提过一个点
就是怎么样尽量的让ai 能够对齐人类对吧
对齐人类的价值观
对齐人类的能力
他说的那个怎么样在端上去跑大模型是更容易对齐
结果呢
Open i 的做法是相当于把所有人类的能力
所有人类的知识
所有人类的推理能力都汇总在一个设备上或者是一个服务器上
这个不叫对齐人类
它实际上就是在造神
这些方另外一方面的话呢
就是对齐人类的这个过程中
有可能人跟机器还能够平等的和谐的生存
你就把另外一个ai 看成一个人就好了嘛
他的能力跟你类似
现在的一个云端的ai
掌握了巨大的数据量的一个ai
它的能力是远超过你们我们人类的对吧
我们怎么说能够说我有能力去控制他
或者我怎么说能够说我未来跟他是一就平等和谐共处的一个一个状态
我觉得是不太可能的
未来不像是一个很安全的方向
回到刚才前面聊到的一个点
我觉得挺有意思的
就是所谓平民化也不叫平民化吧
就是所谓因为开源会带来的大家都能用上这个
这个我觉得是一个挺新的视角
因为就我自己之前接触来看
因为大家经常渲染说做大模型这个事儿
你得什么a 一百
得对多少个
然后你得有大量的人去标
因后你得投入多少两年多多少财力
所以让人觉得这个东西天然好像就是
呃
大厂做出来大家等着用
但是听你们这么一讲
我觉得确实或者路线大家知道说有有这种语言模型能够做出智能化的一个工具来
那可能在成本上真的很有机会
几年内
比如说真的做到在端上就能完全实现了
我觉得这个还是挺兴奋的
就未来很可能大家都能调自己的模型
这个和我去调一个通用模型还是不一样的感觉
这个你们会有什么预期吗
就比如说在或者说换换个角度
你们会觉得在哪个场景上就能很快看到成果
那这个其实已经成功了
手机上是可以运行的
我们预计这个库这样的模型一百亿的参数在手机上面运行是没有问题的
推理速度也不会很慢
刚才说两个问题
第一个要不要自己训练一个大模型的
但是很时候既然已经开开出来了
很很多人没必要去训练一个大模型的
但是他可能会像是这个aracstable diffulsion 这样的模型
有很多人去调风格啊
就是做这个lura
那么这个其实更成本更低了
你可能过段时间各个云服务器厂商他们就会提供这样的啊
一个小时两个小时跑一个
或者说半天跑一个这样的一个小的一个模块
这个模块和大模型合在一起
你就能运行出属于自己的这么一个啊
这个又能有安全性
然后又能有这个风格化
也能达到自己的目标
这么一个应用场景啊
今年以内就可以了
我觉得如果现在落地的速度还需要有基建啊
各方面的这个配套设施的一个合并
我非常同意刚刚刘潇说的
一方面我们是自己的这个模型已经在手机包括电脑上面已经在跑了
而且也在跟一些其他的硬件厂商一些终端在聊
包括机器人
Xrlt 等等
对
我们认为未来这一块的机会非常大
另外一个就是我们刚刚也提到嘛
终局其实是这个算法要跑到芯片上
乐观估计可能是三到五年
他会跑到一个专业所有的芯片上
算法的整个框架稳定
包括它工具链相对比较完善的话
我们认为这个概率是非常高的
哎 你
你们现在会比较期待
或者说你们有预期用现在的模型能有哪些杀手级的场景吗
你们现在有在观察或者说有什么途径在在找这些场景吧
你想想看这个rnn 和这个transformer 这个差别
Rnn 这个有一个状态
这个状态保存了这个非常长十万字以上
或者像人脑脑一样
可有几天前的信息
到今天我可能总结归纳成了一个状态啊
然后我这个状态来回答你的问题
这个其实更更像是人的思考逻辑啊
Transformer 很多时候是要去仔细的观察上台文啊
就是像是我在做阅读理解一样的时候啊
这两个趋势势面就是它会会揉合一起起
估计啊
会是这么一个过程程
其实说到到这个长来说
我们会切入这个写写作领域啊
其实我们认为小说其实是最难的
如果大家理解这个这个写作工作者的话
它其实是一个创造的过程
是一个创造世界的过程
那或者说他
他要首先从一个大纲去推演整个世界怎么运行
好多的人物关系在里面
然后穿插这些结构
还要做里面所有的细节的场景的转变
内容创意啊
就是一个非常
呃
就是人最有价值以及最难的事情
我们觉得这个r 就是软酷这样的模型是将要能够去做这样的事情的
就是这个可以在更长文本里面去理解内容
然后在更长的里面里面去常关联一些逻辑啊
就像刚才说的
你这个开cons 特别长的时候
昨天的那个信息到今天的时候
我能够启发我去做信另一个事情啊
那这个是一个
呃
会应用到这个写作小说领域里面
虽然可能有些人觉得这个
这个
这对很粗浅嘛
这小说有什么呀
但实际上这个其实挺难的
对
其实刘潇说了一个关键的点啊
我们现在是纹身纹对吧
它最难的其实是生存小说
其实你再把它的那个模态变一下啊
他有可能会变成什么呢
就是电影的脚本
有可能会变成视频
甚至变成一个虚拟世界
我们其实是沿着这条路往前走的
回过头来说
我们认为现在我们这种模型能够快速的应用落地的场景有很多点
第一个呢
就是它能够在一些新的终端
包括我刚刚说的xr 和机器人上面
能够大大的提升这两个终端的能力
让这两个终端从以前是一个一百万的一个一个一个销售量
它有可能会变成上亿台
我们可能基于ai 的大模型
能够让xr
可能让机器人能够做到每年的出货量上亿台
我们现在的这个ai 有一个巨大的能力
就是它可以在极低的成本下能够生成大量的内容
而且是优质的内容
那它在xr 里面能做什么
其实xr 现在的困境就在于它端到端并没有闭环
就是首先第一它没有足够好的内容
导致没有足够人多的人愿意去消费它或者去买它
或者去买它的服务
导致底层的供应链不愿意投入
大家都是在关注这个市场什么时候能够打开
而打开的关键点就在于怎么样以极低的成本在这个端上生成高质量的内容
而ai 就是这个生产力工具
比如说我看到这个衣服
它可以认出这个衣服
告诉他你穿上它是什么样子
它多少钱
然后甚至生成一段小视频
你穿上它
或者是你看到一个人上面
你可以直接判断出来这个人是谁
你跟他关系是什么
然后你上次跟他聊天是聊了什么
而且是以三维的数据叠加上去的
你看到一个建筑
他可以帮你分析出来这个建筑总共有多高多少层
上面有哪一个公司是你认识
有认识的人你直接可以联系他
然后甚至他可以帮你引导你怎么去那家公司
你会发现你你未来带了这个xr 的这个设备以后
只要你睁开眼睛
你就已经进入到了一个互联网
你闭上眼睛你才离开这个互联网
所以你联网的时间跟手机相比相当于是大大提升了
在这个过程中
那你就有更多的消费数字世界内容和服务的机会了
这就是增量市场
哎
我觉得这个确实挺有意思
因为我总感觉xr 这个是这个可能还面临些硬
硬设设备问题
我觉得不是硬件设备题现现的问题就是没有人认为xr 值得购买
尤其是c 端
现在的困境在这儿
C 端没有量
导致芯片没有办法
就是以很低的成本流片了
因为你量不够大嘛
我们看到以前pc 端手机端的这个这个量是以亿为单位的
结果到了xr 这变成了十万
最多上百万为单位的
然后光学那边也是看着这个
我知道的是很多年前这个算法都有了呀
而只是说我为什么要投入砸钱进去
我看不到这个市场
而看不到这个市场的原因是消费者在这个领域看不到增量价值
都是以前的在二维的互联网上就有的内容对吧
看电影
玩游戏
三维的内容还
还是太少了
比如说游戏
比如说我们看到psvr 的那个游戏
现在还是很少啊
我
我也不想买它
为什么呢
我为什么要单独为了那几个游戏不买一个设备
而设备也不便宜
而ai 就是一个生成内容的巨大的生产力工具
就可能它他缺的是一种种个个的内容
这个新的内容能让大家觉得有一个体验差
就他可能确实在硬件上可能有一些体验的不一样的地方
但是这个体验差并没有那么大
就可能也能玩玩游戏
但是你说他在里面这种沉浸式玩游戏能比我们现在在游戏机上或者在
呃
电脑上玩儿能好多少
这些可能都没有没有差的那么大
但是如果说还真的通过ai 能实现那种以前完全实现不了的
呃 真实感
或者说就是以前体会不到的一些东西
那
那确实还挺有意思的
这个才是我们一直在说新的互联网不是所谓的web 三
其实真正的新的互联网是一个空间的互联网
是基于于三维四维数据的一个互联网
它是有增量的价值
增量的内容
而且这个增量的内容让用户有巨大的动力从一个计算终端迁移到另外一个计算终端上
就跟当年p 四以前都在pc 上上网
为什么现在大家愿意用手机上网
它带来的价值是完全不一样的
我 我的
我的手机能够基于地理位置能够给我提供不同的内容和服务
而且我的场景也大大扩大了
场景大大变大了
内容也完全不一样了
提供的服务也跟之前的pc 端有巨大的增量价值
那
那么下一个终端也是一样的
而这个终端带来的给它带来价值的那个生产力工具就是ai
就是这一代
你可以认为很大一部就是这一次ai 中间的一部分叫generative ai
可能给xr 带来了一些增量的内容
哎 我 我觉得还
还有一个方向是关于
呃 硬件芯片
就未来的这个大模型的平民化
或者说 呃
个人化 你
你之前提了一个观点
说它会在芯片层面也会有实现
这个你是怎么观察的
或者有哪些想法
我是这样看的
首先第一个
大家因为现在的open ni 提供的是一个语音服务嘛
其实大家把这一次的ai 还是像上一代的ai 一样看成是一种云服务
其实这一次的大模型我更倾向于把它看成是一种类似于操作系统
如果还是一个以前的云服务的话
相当于是我一直要为这个云服务长期的去买单
虽然我自己手上有算力
但是呢
实际上我还是要去云端去
去买这个云端的gpu 产生的ai 的
这个大模型的ai 能力
呃
我是在不断的被云服务厂商收割
那未来的话
如果有一个非常好的一个基础的大模型
它在 呃
压缩完以后
它可以在不同的终端去落地用端上的一个算力
比如说我买了一个手机
或者买了一个其他的一个一个硬件设备
它端上有很好的gpu 或者呃cpu
在tpu 或者是一个一个e egle 的芯片上面跑了一个大模型
那实际上我是买了我这个终端上的这个设备的算力
在用我这个大模型
那我相当于是是不需要要再为这个云服务付钱了
就相当于是它是一个分布式了
分布式推理
甚至将来的那个训练也有可能是分布式的
从这角度来说
其实后面的芯片也会有很多定制化的这个场景可以定制到模型
让它效率更高
本身是法库
它这个模型的设计也是更符合这个ask 芯片的这个编可编程的这么一个芯片状态
就是这个里面有存算一体的这么一个一个逻辑
能够很好的利用芯片的能力去这个里面的这些模型的推理的记技能和运算这个上面来说
也其实加速了这个芯片的这个能耗这个降低
然后各方面的的性能的提升就也能更快达到了刚才卢老师说的这个sr 这么一个到端的这么一个设备的可能性
其实我更想说的是
未来哎
我的大模型的能力是平民化的
是能够掌握在每个人手上的
而不是说我需要实时的付费给某一家公司我才能够获取到这个服务这个思路和方法
比如说在海外有没有类似的在座的团队
或者有没有什么你们的新的观察
海外也有不少人尝试在用库去训练
对
尤其是小语种这一块
就最近的论文里面也有很多新的发现
也有跟这个软库的内核很像了
也很有潜力
不过从长远上来看
就是大家肯定是一个互相助力的过程
然后也有多模态的这个空间在里面
我可以提我另外一个观点啊
不见得是对的
我认为现在open ai 这条路
其实是他把整个ai 能力放在云端
最大的目的其实是为了收数据
是为了扩充它这个基座大模型的一个数据量
包括它做plug in
包括果他跟他的合作伙伴签的协议
你要用tp 四
你必须要把数据全部给我
对
他所有最近几个月做的事情都是为了收数据
但这些都不是终局
一方面是他收到足够多的数据以后
他很有可能是会把模型压缩在端上放啊
这是未来的一个发展的一个必经之路
因为这个东西就是要落到端上的
否则他没有不具备经济性
第二个就是当这些c 端和b 端意识到数据的价值和数据交给其他公司的一个知的一个一个利益冲突的情况下
他将来可能不会这么轻易的把数据交给某一家商业公司
比如说open i
所以这实际上是一个打一个时间窗口
那从去年八月份到到去年年底吧
我们发现
呃
像微软包括其他的一些他合作或者投资的公司在快速的接入gbt
而且在短短的三个月时间一下子全面的释放出来
这不像是过去弯曲的一个这些科技公司的一个做事方式
对
就是整体上还是商业考量
去参加那个
呃
陆奇老师那个活动吧
就当时你跟他那那次沟通聊到什么非常有启发的观点嘛
刚刚也其实有说了两点
一个是关于那个是否是开放
为什么opp ni
呃
先开放后闭源对吧
第二个问题是关于未来算法在端上是怎么跑的
陆奇老师说的非常清晰
他
他认为芯片
如果你的算法要在芯片上跑的话呢
要看你这个算法的一个成熟度
如果你的算法完全不成熟
呃
要大量的重构大量的改的话
他是建议是直接跑gpu 上面的
呃 第二呢
就是说如果你的算法呢
呃
已经逐步的在成熟
有一部分还需要改了
有一部分还需要改的话呢
它建议是跑fpgi 上面
然后呢
如果你的算法已经非常确定了
已经稳定的情况下
它是可以说可以跑专有芯片上面
他
他说现在有一家公司有这种ai 的专有芯片
就是google
Google 的tpu 其实本质上就是
就是专有的ai 芯片
我觉得这点对我们也是非常有启发的
就是效率跟
呃
迭代周期怎么样去配合
怎么样去互相促进
另外第三个问题就是安全的问题
其实大家都对安全非常忧虑
而我们也看到了
现在虽然弯曲那边一直在讲responsible ai 对吧
但是我们并没有看到一个完整的框架
我们认为现在ai 的能能力界已经超出了大家的想象
那当然了
他能提高效率
另外一方面他也能做很多危害人类的事情
怎么样保证他是为人类服务的
而不是未来人类为他服务的
对
其实不同的文化价值观下面
也会影响ai 安全的定义和判断
那其实这个rau 也是想去做比如说本土的这个中国自己的价值观体系的东西去输出
因为open ai 其实是美国价值观嘛
这东西不存在对错
但是我觉得是一个
呃
是有一个碰撞过程的
我就引入一个终局的想法
就是其实我觉得到芯片以后
其实是极大提升了生产力嘛
提升生产力之后
这个大家要做什么
就是站下这些人
我们可能工作就不太需要去参与了
那我们要做什么
其实是一个非常值得有想象空间吧
啊
所以说其实我们更多的时候可以去探索人类文明的边界啊
然后这个刚才我们一直聊这个人类对齐
人类对齐其实是一个平均化的过程啊
这是为什么就十几年来这些对话机器人最最难受最头疼的地方就是这个准确性
怎么对齐这些人类
这个就把这个多样性给去掉了啊
因为我们可能不能太超出人类的认知范畴
或者他想要的答案是很有限的
其实在这个ai 领域里面
它可能会有一部分的领域会垂直到这这个人类文明的边界的探索啊
从科学文明
艺术文化都会有一个新的探索的维度
这也是一个很好的一个方向
这个终局下面
可能人人就不再去需要去啊工作
而是做更多的啊探索人类文明边界的事情
或者享受人生的过程
这样的话
我觉得也是一个比较好的一个终局吧
大家因为最近就像我前面聊到的
呃呃
关注现有的这些大模型关注的比较多
所以潜意识里觉得大模型可能就是一种路径
或者说未来它就是一种生态
但是从跟你们交流
我确实感知到整体的这个大的路线和方向其实也是在探索的
哎
我觉得这个非常有意思
我其实还挺关心一个问题
就是你们接下来有哪些非常明确的要做的事儿嘛
就类似比如说你们要招人或者什么
也对
你们接下来公司的规划大概是什么样的
首先第一个
我们正在融资
第一轮融资
对
我们也在接触投资人
呃 我也希望 呃
无论是那个机构还是个人投资者
我们都欢迎来聊
如果您对个非常有价值开源的大模型感兴趣的话
对
或者愿意了解的话
另外一方面
我们在开源社区再招一些
呃
那个开发者在帮我们去优化现有的开源大模型
呃
包括做工具链
包括做压缩
第三个是什么呢
就是我们也欢迎一些看重这个大模型的特点呢
比如说它在端上能够呃
快速的落地
呃
在端上部署大模型
以及在一些to b 的场景能够
呃
私有化部署等等
这种场景感兴趣的一些客户
做xr 的
作为机器人的
做lt 的
甚至手机厂商
我们都欢迎来聊一聊我们能做什么
五月九号
我在深圳也举办了一个闭幕会
就是探讨ai 大模型和硬件的结合
就是我们最近有拿到这个深圳研究所的一个赞助性的这个钱
但这个钱不是给我们的
是他们自己要投入做基础建设的
相当于说是给大家这个一个一个信息吧
一个线索就是希望就去做这个模型压缩在显卡优化这方面的
就移植到端上面的这些应用的这个场景的就实现都都可以联系我们
我们有这个方式让你们去对接这个研究所去参与这个项目的
他们是有钱能拿到的
然后一是这个硬件的优化
包括显卡运运的优化呀
到这个 呃
苹果端的手机和amd 啊
然后移动端的
还有外部gl
然后还有就是这个压缩模型
量化压缩 呃
Int 四啊
Int 三这样的
那ui 这一块产品啊
就是怎么去使用去交互
同时这个想去做这个开源生态的小伙伴都可以联系我们
我们有这个qq 群啊
也有discount 生态
就是国外的社区
在关注大模型或者关注ai 这一波的朋友
你们有什么建议吗
就比如说我现在是一个
呃
可能了解比较少的一个新人
那接下来我你们建议是比如我去开源的社区去找一些模型自己搭着试试看
还是说我现在多试用一下产品
还是说说怎么样
你们会有什么什么建议吗
这方面 呃
第一个建议是
如果是一个创业者或开发者的话
首先第一个你要关注的是客户
你要关注的客户他需要什么
如果你不是一个想接投身于大模型这个研发和创大模型的创业的一个开发者的话
你是想做应用或者也想做英付尔的话
你最先要关注的是客户
包括你的市场规模
包括他的 呃
有没有可能平台化
那他的需求到底是什么
这个需求
满足这样需求的需要什么样的大模型
另外还有一个建议是我们要一定要搞清楚什么东西是最根本的
最具决定性的不会变的那个东西
它是最重要的
就比如说我们为什么说认为我们这个这个大模型有竞争优势
就是因为它的就是空间和时间的复杂度上已经做到极致了
我们认为这个是决定性的优势
另外一方面
即使是现在我们拿出来去做一些黑盒测试
我们也要在同样的一个水平线上
比如说在控制变量
比如说在同样的参数集
同样的那个数据量
以及 呃
在没有做过任何的翻透的情况下去做对比
看新生事物的时候
关注它的本质就是这是一个很好的时代
我觉得
然后如果我是一个个人开发者
或者说我是一个想参与这个事情的人
我觉得开源
拥抱开源是一个非常重要的事情
罗老师说的这个用户需求之上去建立一个开源的一个底胚子
会有更多人参与进来
这个这个促进作用是一个能让这个事情像生长
就是不断生长的一个过程
我觉得是非常吸引人的
而且能够创造更多的这个声望
然后还能创造更多的价值让大家能用起来
然后大家都可以多试一试不同的模型
到这个rw 可以软酷这样的模型
它其实迭代特别的快
里面有好多这个东西
其实你自己不去动手去敲代码
你很难理解里面的精髓
或者说设立者初衷是怎么想的
将来可能没有人在被机器都替代写代码
但是这个学习的过程会有一个发明创造的过程啊
是非常有趣的
然后也非常的吸引人的过程
就是借用彭老师说的话来说
前面一段是我说的啊
Transformer 是偶然
Raccu is all you 的啊
就ruu 是才是你需要的啊
不仅仅是attention is all you need
行
我们也期待看未来你们的模型能落地
给大家一些更新的启发吧
没问题
好的好的
好啊好啊
我们的我们几个模型其实在hacking face 上都有托管
如果大家有兴趣的话
都可以去试用一下
今天就先聊到这儿
感谢二位
感谢罗旋
刘潇 嗯
感谢感谢 好
拜拜
为何the summer is common
欢迎在小宇宙
苹果
Powcast 的订阅和收听三五环
也欢迎在评论区留言交流
如果喜欢三五环的话
也恳请您在苹果
Powcast
Spotify 或者喜马拉雅留下你的宝贵好评
下期再见
Win the toy so wwant understand 等候gnorry man
做梦才好笑
好的着没也别为can 站起来
为何我彼岸color 不理我
无缘无语
Who you are
Who you we
萨摩拉
你那样傻