开场0:00
欢迎大家收听 《 三五环 》, 我是刘飞 。 今天邀请到的是老朋友庄明浩庄老师 , 先跟大家打声招呼吧 。
哈喽大家好 , 我是 《 屠龙之术 》 的主播庄明浩 。
哎庄老师 , 现在做播客感觉怎么样啊 ? 也做了一阵了吧 , 上回咱们录好像就是你放到前几期了 , 你播客里的 。
对对对 , 那时候刚刚开始嘛 , 应该是 23 年 9 月吧 。 因为我刚从日本回来 , 昨天在家拆了一天快递 , 刚刚把那个小宇宙的那个 2 万个粉丝的奖牌拆出来 。
哦 ,有 2 万粉丝了 。 你感觉怎么样啊 , 做播客做到现在 ?
我觉得还是挺符合之前的预期吧 , 就是它算是一个你自己的产品的交付 , 那过程中以产品的心态去面对它 , 去做所有的前期的准备 , 内容的交付 , 包括在中间过程中 ,因为内容可能跟我们今天主题 AI 又比较相关 , 你因为这个事情又用到了很多 AI 相关的工具 , 让这件事情变得一个比较正向循环的过程 。
闭环了 。
对 , 就是你首先要用 , 对吧 , 然后你又在讲这个事情 , 它就正向的就滚起来了 。
对 , 你说到讲这个事情 , 庄老师那个播客应该是非常让人耳目一新的 , 就是 show notes 里面全是 PPT,而且动不动就大几十页 。
今天咱们聊的这个话题 ,其实就是之前看到你在年底刚分享了关于 AI 产品的一些 , 呃 , 各个视角的一些分享吧 , 一些思考观察 。
当时我记得这里面也有好多页的 PPT,有很多印象也都挺深刻的 。 我们今天这一期就顺着这个话题 , 顺着这个 AI, 我们聊一聊吧 , 聊一聊去年的这个感受 。
首先整体上你会感觉从 23 年到现在这段时间 , 就是从 ChatGPT3.5 出来之后, 今年的整个表现在你个人感受来说是什么样的 ?
技术破晓1:43
我觉得有一个更明显的感受是加速 , 就是疯狂的在加速 。 你会发现一个很直观的感受是 , 比如说我去做那个年终统计的时候 , 我是 11 月底开始去做的 , 然后真正做完应该是 12 月的 11 号还是 13 号吧 ,其实距离现在又过去了大概一个月的时间 。
你会发现有很多内容也开始变得过时了 , 或者说有很多内容需要不断的更新 。 我当时做完第一版是 132 页 , 然后我在上周去给一个朋友讲的时候 , 这个 PPT 已经加到了 143 页 。
你每天都在需要用一些东西帮它做这个查漏补缺 , 每一个涉及到的新增方向可能在很短的时间内就会出现很多的变化 。
那过去这一年你会发现 , 呃 , 我们除了大模型本身的技术能力的更迭的这个快速变化之外 ,在很多的细分方向上, 尤其是大家讨论比较多的细分方向上, 可能真的就是每两到三个月就是一篇翻过去了 。
就是你再回头去看 , 可能两三个月 , 甚至三五月之前的很多的无论是新闻结论 、 当时的判断 ,以及当时对很多产品的认知跟理解 , 确实就疯狂的加速 。
而且这种加速就是一浪叠着一浪的 , 风水轮流转 , 对吧 , 今天是这个人站在了这个桥头上, 过了两天就变成另外一个方向的另外一家不知道是哪来的公司 , 突然间站到了所有世界的关注的焦点上, 就百花齐放一般 。
对 , 我感觉是 , 可能对于这种底层技术的迭代或者更新 , 大家还是觉得 23 年底那是最重要的那一波嘛 。
那一波之后其实在应用层或者说中间件上面的这种迭代变化 , 各个领域的发展确实是就变化非常快 , 就可能大家用的这个底层的核心的逻辑还是都是大模型 ,但是它在不断演化 ,有种这种感觉 。
其实从去年 Q3 开始 , 就大家就讨论预训练的事情 ,其实已经基本是到头了嘛 。 那到这个节点 , 这个结论基本上大家是共识的嘛 , 然后大家开始讨论后训练跟分布推理 , 然后所有这些包括 agent 的实施这些事情 , 然后大家开始讨论什么时候真正意义上的现存的互联网数据可能已经被大模型全部吃完了 。
就这个东西的边际效应的放缓 , 大概就是从去年下半年就基本上成为共识了嘛 。 然后纯从模型本身的技术能力来看 , 确实大家在慢慢的趋于接近的状态 。
你看那个无论是看各种各样的评分搒单 , 还是看开源跟闭源的模型的这个接近的程度 , 所有的曲线都在收敛到差不多的地方 。
对 ,而且我听做 AI 的朋友说到一个视角 , 一个数据也挺能证实这一点的 , 就是现在的 CPU, 现在的这个卡的价格也在之前的泡沫之后也回归理性了 , 回归正常了 。
因为有一些公司发现自己去卷大模型可能也卷不出来 , 就慢慢的进入一个更理性的状态 。
或者说那个 Netafla 创始人休寒 ,他用了一个方式是说 ,他说我们把今天这个时间点 , 我们只看中国市场 , 呃 , 比较偏头部的第三方应用 , 我们不算大模型自己的这个官方的应用 , 我们说那些第三方调用的应用 , 然后以 token 的量去计算 , 可能头部的应用每天的这个调用量可能是百亿这个量级 , 然后百亿这个量级的 token 的消耗再乘以单价 , 然后再乘以可能这
样的所谓的头部应用可能有几百个 , 然后计算 , 我们单纯用类似云的方式计算这个市场的盘子 , 可能大概也就是几十亿到一百亿的这个市场规模 。他说的一个问题是说 , 肉眼可见的在 24 年, 单 token 的成本降了两个数量级 , 就是年初的推理的成本跟年底的推理成本可能是差 100 倍的 。
那未来明年大家说 100 倍可能有些难 ,但至少 20 倍 ,10 倍到 20 倍是见得到的 。 然后又因为可能明年多模态的能力会再提升几倍 , 所以明年从总成本来说还会降两个量级 。
可是降两个量级听起来是一个好事情 , 可是纯从行业规模角度来说 , 哪怕你为了保持维持明年这个 100 亿盘子的市场规模 , 你也需要所有这些第三方应用的业务量增长 100 倍 。
可是 100 倍对于我们是一家做社交的公司 , 我们确实也在调用各种各样大平台的这个 token 的能力 , 我们大概日天的消耗量可能所有的 APP 加一起可能也有大几百万 ,也算不小了 。
然后你说你告诉我明年的 KPI 是要 100 倍这个量级 , 我觉得我们业务同事压力会巨大 。
对 , 这就说到其实它是一个相互的过程 , 就是一个是提供的这个成本 , 大家最后会卷到可能非常便宜 , 如果到真的很便宜的程度 , 那一定会大大影响这个生态的 。
因为很多应用很多场景就真的可以很随意的调用了 ,但现在大家调用还有压力 , 你没有好的商业模式的话 , 你只能靠融资嘛 。
应用绽放6:33
另一个点就是刚才你提到的那个可能在整个应用场景层面还需要更大的这个用户体量和更大的用户付费意愿 ,其实也是今天我更想聊的一个方向 , 就是咱们从应用层面看看这一年到底有哪些新的变化和感受 。
对 , 大家都说 24 年是这个应用年嘛 , 对吧 ,25 年是 agent 年嘛 。
哈哈 , 哦 , 都已经有这个说法了是吧 。 你说到这 agent 和应用之间的区别是啥呀 ?
会觉得今天这个时间点很多人会用一个比喻 , 我觉得这个比喻是很巧妙的 , 就是大家会认为 , 比如说我们举个例子 , 比如说 AI 搜索的代表公司 Perplexity 对吧 , 它的这个场景就是说搜索 , 然后我搜索一个问题 , 它根据它的组织方式把这个答案给到你 。
那其实本身来讲 , 你也可以把它理解成是一种所谓的 agent, 它相当于把你的问题分解成各个细分的模块跟推理的过程 , 然后在每一个过程跟每一个模块中, 它用它所知道跟熟悉的信息源跟信息获取工具做收集整理 , 再做呈现 , 然后最后给到你一个统一的结果 。
本身来讲其实它也是一种广义上的 agent, 就是它相当于把你的任务拆解分析 , 然后利用不同的工具跟不同的展现方式最后给到你结果 。
那如果以这个角度来看 ,其实今天这个时间点 , 大部分被划归好场景的应用其实都算是一个小的 agent, 你可以这么理解 。其实在 24 年我觉得整体的状态是说大家开始在画一些小的边界 。
做产品的人很重要一点是你要定义好你的产品边界 , 那产品边界背后可能是用户需求 , 然后底下是技术实现的可能性 。23 年那年比较麻烦一点在于边界也不清楚 , 然后技术在疯狂的迭代 , 所以你两边都是动态的情况下, 你是没有办法在中间找到一个稳定态的 。24 年相对好一点是说技术能力的边界大家慢慢摸得清楚了 , 然后用户场景的挖
掘跟探索与技术能力的匹配 ,其实在 24 年我觉得是所有在做相关公司的同学们 , 对吧 , 尤其是偏比如咱们熟悉的产品人们在做的事情 。
那这些事情在一定程度上在某些板块形成了一些共识 , 那这些共识就被封装成了一个一个的小的功能或者小的产品也好 。
所以其实这一年确实是变化特别大的一年, 我自己也有很强的这种感受 。 你就看这一年好像别的层面 , 就生活上或者说我们这个有一些朋友的状态大家差别不大 ,但是你往回看一年前的这个 AI 领域 , 当时热门的产品或者说大家比较看好的产品 , 大家在讨论的这些大模型的创业公司 ,其实现在已经到一个阶段比赛已经拿到一个结果的这么一个状
态 。 而且在当时可能大家比较看好的某些产品 , 现在好像也有的也听不到声音了 。其实今年感觉上, 呃 , 大家评价发现从最主流的这个应用上获得最大用户规模的可能还是豆包夸克这样的 , 就是我们说从大的这种应用场景层面是这种大厂的产品 。
我不知道你在这方面会有什么样的感受 。
就是这个结论我觉得也是在今年比如说 Q3、Q4 开始趋于变成共识的 。 今年大概呃 6 月还是 7 月的时候 ,也是某大厂的朋友问我在用哪个产品 , 然后我说了一个刚才你提到的产品 , 然后他说当时还没有这些共识 ,他就会疑问 ,他说为什么你选择这个 。
我说我买单或者我 buy in 这个产品或者这个应用的点到底是什么 , 就是说在现阶段肉眼可见的在底层技术模型的技术能力已经接近趋于趋同的情况下, 我 buy in 或者我买单的点是说我相信这个产品团队的产品人们跟运营人们能够迅速的跟上任何一个被短时间内证明形成共识的小的场景 。
就哪怕今天突然间出现了一个什么新的应用或者一个新的场景或者一个新的爆点 , 这个团队也会在很短的时间把这东西跟上 ,而且以一种用户体验跟运营层面更接近于我们所熟悉的方式跟习惯把它跟上 。
就是我买单的是这一点 , 所以我就不需要担心今天突然间有什么东西出现我不知道 。 我的这个时间差不会特别久 ,因为我们相信那样的团队在很短时间就会跟上 。
这个原因完全不是一个技术跟那个什么的原因 , 它就是一个组织运营的角度的原因 。
对 , 就是在所谓的大厂也好 , 或者说更集中资源投入去做的这些产品里面 ,其实你还是能得到更完整的这个用户体验 。
你就类似像豆包可能之前对他的印象就是啊 ,他这个图标也感觉有点山寨 , 刚开始的时候就是一个虚拟人形象嘛 , 那个时候特别火这种虚拟人, 然后用的时候感觉刚开始好像跟其他的大模型工具这种 Chat 工具差不多 ,但是后来还是发现确实体验上哪怕说从视觉和交互上的很多优化和一些细节的这些优化 ,他们都很迅速 。
就你刚才说的这个点确实特别重要 。 你像之前我在极客上说过 ,他们有一些问题回答的特别奇怪 , 然后他们团队就能立马响应 , 这种响应的能力其实对于小团队来说也会比较奢侈 , 就他可能没有那么多的条件去做 。
我觉得这件事情更证明了这个点的原因 , 就是在 Q4 密集的你发现几家大厂做了应用层跟模型层的团队的分割 , 或者说团队的重新的搭配跟组合 。
字节首先不用讲 , 字节的豆包的模型团队跟豆包的产品团队跟应用团队是分开的 ,不是一个团队 。
那阿里其实也做了调整对吧 , 阿里的夸克接收了相当于通义的原来的做通义的 Chat 产品的这个团队来负责 , 包括呃相当于整个把应用层的这些公司的业务放在了一起 , 然后模型层的技术研发放在一起对吧 。
然后也是在这几天我看腾讯也做了类似的处理 , 它把元宝的这个模型团队留在了技术团队 , 把应用团队跟那个腾讯会议的那个团队并在了一起 。
也就是说我把模型是模型 , 应用是应用这件事情至少在团队这一层上区隔的更开了 。 就大家在我觉得在 23 年到 24 年上半年的时候 , 一个偏共识的观点是模型即模型即应用 , 就是大家是在一起的 。
可是你会发现到了 24 年下半年这个时间点 , 呃 ,因为竞争 ,因为模型底层技术能力的越来越清楚 ,因为场景越来越细分啊 ,因为各种各样的运营的需要 , 你会发现越来越多的工作跟技术的实施跟运营的事情变得细碎跟复杂 , 且需要专业的人来做了 。
就是纯单纯依靠技术本身的那些人来做的这个尝试 , 你会发现有点跟不上了 。 我们再从另外一个角度来看 , 我们看 OpenAI 也好 , 本质上来讲 OpenAI 做出了 GPT 模型到 ChatGPT 这一步是一个巨大的跨越 ,但是 ChatGPT 的纯从产品端的实现跟这个东西来讲 , 它更像是一个之前不是也有人说它其实可能只是 OpenAI 内部的一个 demo day 的东西 , 突然间变成了核心的产品 。
可是这个产品本身并没有那么复杂对吧 , 包括它后来出来一系列的基于 ChatGPT 的配套的什么 GPTS, 包括最近出的那个 agent 什么代理服务 , 然后包括 calendar 的连接乱七八糟 , 就是它变成一个不单纯是技术的示范作用的这样一个 , 就是如果 GPT 的模型是一个技术 , 然后到 ChatGPT 的纯对话的这样一个方式变成我们叫卖一步 , 可是你发现现在的用户或者说现在的市场环境
里面要求大家是往外再卖 10 步 20 步 , 然后并且卖的那些步里面是需要非常明确刚才我们讲的那些事情 , 产品的边界 , 用户的需求 , 运营的节奏 , 这些东西的比重更大 。
包括 OpenAI 自己其实它的团队也经历很多的变化 , 从原来纯大部分绝大部分人全部都是技术研发向的人, 开始变成可能今天有一半的人是偏产品跟运营的人。
那其实这个趋势在中美是一模一样的 。
对 , 你说这个我就想到我最近也在反思一件事 ,因为在 ChatGPT 刚出来的时候 , 大家那个时候其实已经出现好多做小模型的公司 , 或者说做各种技术场景 , 很多应用场景的一些技术团队 。
当时其实大家就提出说 ChatGPT 这个技术模型其实它能覆盖所有的场景 。 就是因为我之前读研学的是 NLP, 当时就有个说法 NLP 已经不存在了嘛 , 你不需要再分再做单独做分词 , 再单独做呃记忆翻译 , 单独做各种垂直课题 ,因为大模型其实就能覆盖所有的这种子命题了 。
所以当时我会天然的觉得说哦 ,是不是 ChatGPT 这种形态它已经能够覆盖所有的这种产品形态了 , 就你想知道东西你跟它对话就可以得到了 , 原则上是这样的 。
但是后来我确实发现会存在一些问题 , 比如说为什么出现了 AI coding 的很多产品 , 为什么出现了很多那个 AI 搜索 Perplexity, 刚开始我其实也不是很理解 , 我觉得 ChatGPT 能联网不就是一个 Perplexity, 你像夸克能搜索和夸克用 AI 去搜索和它自己本来这个搜索到底是什么关系 , 就之前其实没有想太清楚 。
但是后来我发现就是刚才你说的那个点 , 我反思明白了一个道理 , 就是底层的这个技术模型是一回事 , 它确实能覆盖所有的场景 ,但是它在每个具体的应用场景上, 每个呃我们能用到 AI 的地方 , 它可能还是得再加一层应用的这种配合 。
因为之前大家说的那个输入这个 prompt 的这个整个的成本 , 或者说学习门槛还是很高的 , 就大家还是想要能直接用起来的东西 。
对 , 就是我之前有个比方是说我说大模型本身像一个巨大的太阳 , 就是它有无限的光亮跟能源跟热量 ,但是很少有人直接可以把太阳变成你的能量跟热量 , 你还是需要中间有一层类似导管的存在 , 导管可能定义好了它的长度 , 它的宽度 , 然后导到你那正好 , 它的热量 , 它的光呃它的能量是恰好符合你这个需要的 。
那做这一层管的输输入跟这个导流这个过程其实也就是产品定义的这个这个过程 。 那当然太阳本身还是非常强大 ,是万物之源 ,但是当太阳本身已经稳定的时候 , 我们更多确实就需要外围那些东西来帮它变成一个我们可用的东西 。
然后说到刚才这一点 ,其实我觉得有一个产品就是刚才提到的夸克是挺值得聊一聊的 ,因为他们最近也更新了新的 slogan 叫两亿人的 AI 全能助手 , 就他们既不提自己是搜索 ,也不提自己是浏览器 ,他们提的是全能助手 。
然后其实就是刚才我们在聊的这个思路的方向 , 感觉就他们今年的下载量确实已经 , 比如说七脉数据发布的这个报告里面也是行业第一了 。
这种新的方向的转变可能也是在匹配我们刚才说的这个方向这个趋势 。 对 , 你觉得他们这种集中的集中的这个趋势是一个什么样的看法 ?
就是我之前在做年终总结的时候 , 我也我有一张是写中国的巨头嘛 , 然后在阿里那一张我写的除了千问的这个通义在开源模型的领域的这个能力 ,以及大模型去改善所有阿里体系内的电商业务之外, 我特意提了一嘴夸克的这个这个段 ,因为我现在基本是夸克的日活用户 , 然后我还特意强调我没有收钱 。
夸克在 AI 大模型这一波之前的时候 , 我其实就是它的用户 。 那当时为什么会用呢 ? 其实更多在那个时间点 , 我觉得是在上一个年代在浏览器的最尾端的竞争的时候 , 呃夸克是通过偏纯用户体验层面的操作 ,在一定程度上获得了一些用户 。
那当时它可能从呃操作界面的简洁性 , 然后比如无广告 , 包括跟当时网盘的合作 , 然后包括跟它做的很多小工具 。
当时我记得当时做过志愿的选择 , 就是给那个报考志愿的 , 然后做了一些呃关于 PDF 文件的处理的那些工具 , 就是这些小工具跟小的呃浏览器内置的插件的这个类似日式日式军刀的这种存在 。
就我们这类人可能不太会去用就国产的一些这个广告比较多的浏览器段 , 我们可能用 Chrome 比较多 ,但是有些时候我们会觉得 Chrome 比如占内存比较大 , 包括有些时候我希望用比如用翻译 , 我可能还需要加一些辅助软件才可以对吧 , 很很麻烦很繁 �。在一些细碎的场景跟一些我真的要用到日式军刀这个东西的时候 , 我会用到夸克的这个东西 。
然后当 AI 这波来之后, 我觉得对于这类产品而言是一个巨大的加成 , 就是原来刚才讲我我们叫浏览器的最后的时代 , 那个时代已经基本上是一个江湖已经定了的年代 。
确实夸克在用户体验层面有绝对强的强势 ,但是在那个时代你单纯只依靠用户体验这一件事情 , 想从中国众多用户的主页的各种叉叉叉浏览器里面去把这市场抢过来 , 我觉得是很难的 。
它不至于有那么大的体验差 。
对 , 它就是它的那个就按于军老师那个产品体验那个那个公式来算 , 它它很难去撬动 。 但是当 AI 来这波来之后, 这个事情就不太一样了 , 就是它给这个事情的杠杆变得非常的大 。
它最早搜索开始到 AI 的各种各样工具的集成 , 到插件 , 到把这些所谓的功能集成好之后再进行新的打磨 。
因为你会发现其实从 23 年底到 24 年初 , 呃很多相关的 PC 软件们都在尝试各种各样的这种东西的功能的增加 ,但是这些功能的增加我觉得十分的考验呃产品团队的能力 。
就最早比如老周他们当时也宣传过一波嘛 , 对吧 , 然后各大浏览器厂商都不会放弃这件事情的尝试 。
但是你会发现在过程中基于自己的模型能力 , 再加上产品体验边界的设计 ,以及对用户体验的感知理解 , 变成最后封装好那一个个小东西摆在什么位置 ,以什么样的方式放在那 , 怎么跟原有的你的已有的核心的功能做结合 , 这些东西是十分的考验我觉得产品能力 。
你你说这个特别关键 , 就是这个一方面是产品体验上, 就是这所谓的首页的八大金刚 , 什么十六十六宫格该怎么排布 , 然后每个功能该怎么安排 , 它的交互之间的关系是什么样的 , 甚至还包括大量的在大厂内部的这种所谓组织关系 , 对吧 , 生产关系到底谁能控制这个 ,但最后可能是总裁是总经理 ,他能控制这个页面的逻辑 , 最后它会
变得很复杂 , 它不是那么简单就能说往上直接累加几个功能就可以的 。
你会发现就是这种事情你你你肉眼可想的就知道它非常的复杂 , 就是它交付出来的当然就是一个大的版本更新 , 然后加了几个 icon 或者加了几个按钮 , 然后加了几个小的工具 ,但实际在背后的这些事情其实确实蛮复杂 , 确实非常考验这部分功力 。
对 , 所以你提醒我了一个思考的视角 , 就是现在 AI 来了之后, 它其实能用更好的方式把它们组合起来 , 所以这可能就是成为趋势的一个原因 。
就你这些功能你能通过就原来的搜索框 , 可能是用来搜索网页的这种搜索框 ,但现在的搜索框它其实是能用来支持搜索各种应用场景搜索 , 甚至未来搜索各种 agent 的这么一个入口 。
这种入口集中了之后, 它其实在用户体验上就比原来说啊我十六宫格里我看看它到底这个什么意思啊 , 它到底能实现什么功能啊 , 它就不一样了 。
我想这个问题的反方面就是说什么东西放在所谓的首页的几大金刚里 , 什么东西放在那个框里 , 什么东西放在二级的最后生成的地方 , 就这些东西也十分考验 。
而且你看见我们看那个 OpenAI 的这个客户端 , 就是 ChatGPT 的 Mac 的客户端跟 PC 的客户端也一样 , 看上去就是一个框 , 对吧 , 就跟当年百度提出的框计算一样 , 就看上去就是一个框 。
那就是它选择了一种你说是讨巧也好 , 还是说 all in one 的方式也好 , 放在那了 。 可是这种方式呃我觉得未必适合国内的主流的用户 , 国内主流用户还是更习惯于有些东西 , 可能还是习惯于用搜索或者用文字 , 或者用以自然语言的方式表达 ,但是更多的功能模块大家还是习惯于被封装好的方式 , 用点击的 , 用傻瓜的 , 用就是步骤尽量少的
方式去做呈现 。 那这些东西的取舍本身也是一件非常难的事情 。ChatGPT 发布之后, 你看各种各样的报告 , 这个东西能干嘛 , 那个时候就已经定好了 , 今天我们能干的很多事情在那个时候就已经写出来了 。
只是说这过去这一年多时间 , 很多的产品团队跟产品的应用的公司在做的事情是说真正意义上把这个功能变成一个多大规模用户的 , 或者说多大这个最大公约数用户能够简单使用形成交付的结果的一个东西 ,而且还要去评判那个结果是一个 90 分的结果还是一个 60 分的结果 。
那到底是大部分用户需要一个 60 分的 , 还是需要一个 90 分的 ,在每一个这个选择里面做的取舍平衡博弈 , 最后就变成了各家产品最大的不同 。
就是我再举个简单例子 , 比如说做 PPT,AI PPT 也是一个竞争非常激烈的方向 , 今天也有独立产品来可以来做 ,也有一些呃比如说夸克 , 还有哪个产品的浏览器也是支持这个相关的生成的 。
那你会发现每一家的侧重点确实还是有非常多的细微的区别的 ,有些是偏比如说从总结到整理到大纲生成的 ,有些是强调自己的模板库足够的强大 , 足够的多样 , 足足够的可以让你去选择各种各样的风格的 。
有些是强调可视化做得好的 ,有些是强调逻辑结构做得清楚的 。 然后你说这些东西之间 , 我我反正因为做 PPT 做得太多 , 所以对于一个普通用户而言 ,他去区别这些事情其实是非常难的 。
我举个场景 , 当有一个朋友问我 ,他说他想用一个 AI PPT 的工具的时候 , 我会要我要需要问他特别多的提示词 , 你要用来干嘛 , 做成什么样子 , 什么场景 , 然后你希望比如说你有没有范本 , 你希望做成什么样 , 然后你希望拿来做成什么样的表达方式 ,是偏文字比较多的还是偏图的 , 然后是严肃场景还是非严肃场景 , 对吧 , 然后我才能对
应的去选择给他介绍合适的这个工具 。 然后当然所有这些工具里面是有一个刚才我们讲的叫最大公约数的存在的 , 就是中国的大部分的白领用户的需求可能还是基于模板存在的 , 所以能够提供足够多丰富的可选择可编辑的模板的库 ,并且与内容相匹配 。
那这件事情是一个基础流程 , 上面的就变成各家的区别 。
对 , 你在说的时候我就感感受到 ,其实现在又是一个产品经理挺有用的一个时代了 。 就是你刚才说的那些 , 就是应该产品经理来抽象的 , 就我抽象一下, 我把这些其实说起来呢 , 技术上并没有那么那么复杂 , 它其实就是告诉大模型有一些提前的预处理 , 然后告诉大模型你应该给我生生成什么样的结果 , 它其实就就能分类到几个场景里
面去了 , 然后这些场景又能封装成一个一个的小的应用 。
而且就是再比如说几乎所有的产品都有 , 比如总结跟整理的功能 , 就是我上传一个文件 , 然后帮我总结一下, 那大部分用户最开始用就是帮我总结一下, 稍微进阶点 , 比如说我需要一个什么结构清晰的总结 , 我需要一个什么金字塔原则的总结 , 对吧 , 我需要一个它会加一些限定词 , 然后再复杂一些或者再高阶一些用户 , 它会有跟它的比如对结构的要求
, 对各种各样东西的要求再输出 。 那本质上讲 , 就这每一步的进阶都是一次巨大的用户流失 , 对吧 ,因为你相当于要要求用户变得更聪明 。
所以那中间过程中这些东西怎么做成 , 无论是 button 也好 , 功能也好 , 还是预设的东西放在那也好 , 就这些工作全部都是工作量 。
这就是其实互联网产品一直在解决的一个根本上人性的问题 , 就是懒 。 因为你看所有的产品形态都在往怎么让人更舒服的 、 更轻松的消费 ,不管是消费内容还是消费其他的东西上, 一直在往这个方向努力 。
我觉得就是今天确实如你所说 , 我在开始之前我也会这么讲 , 就是这个阶段可能恰恰又回到了一个对呃产品人, 尤其是好的产品人的高要求的年代 。
而且今天这个时间点的更高的要求在于呃你还同时要对技术本身的边界的理解到位 , 然后才能把这个两个东西融起来 。
对 , 如果拿夸克举例子 , 刚才说的这些应用层面的东西 , 我最近在具体打开看每一个这种场景的时候 , 才发现它真的做了好多 。
因为之前应该这一两个月在用夸克的时候 , 主要还是把它当 perplexity 去用嘛 , 就 AI 搜索它能搜到很多网页 , 包括它能整合搜到这些资料给给出一个答案来 。
这个场景其实跟豆包不一样嘛 , 呃就像刚才说的 , 看起来都是一个搜索框 , 都是一个对话框 , 夸克的结论很多是从网页来的 。
所以本来我以为它主要就是有搜索啊 , 或者说有网盘这些 ,但后来我发现它确实做了好多啊 ,而且有很多年轻人在用 。
年轻人用它干什么呢 ? 就是用它解题 。 它有那个像应该叫呃夸克扫描王 , 它这个旗下有很多场景 , 包括什么拍照翻译啊 , 试试卷错题直接能扫描出来整理 。
就我之前看到案例的时候也觉得挺神奇的 , 就是这些封装打包 , 就是刚才我们说的那种技术上想想好像确实没有那么复杂 ,但是它封装了这么一层 , 它的体验使用起来就就就很流畅了 。
不像以前 ,以前可能你要到网上搜所谓的很多攻略嘛 , 你要把一些东西输进去 , 你告诉 AI 要要怎么样怎么样 。
所以我发现它确实提供了很多 ,而且这些现在的用户规模其实很多都是在这种具体的场景里的 ,而不是说单纯在搜索里的 。
我觉得这是一个很有意思的现象 。
这个问题再往前一步 ,有那么多双引号的场景 , 哪些东西放 , 哪些东西不放 , 哪些东西现在放 , 哪些东西放在后面放 , 我觉得也是十分考验所有这些相关团队的一个非常重要的考量 。
因为你会发现今天这个时间点 , 哪怕是在任何一个细分的小的领域里面 , 可能确实已经有一些不错的产品跟不错的团队了 。
但是作为一个完整体的 , 我们叫 all in one 的这个功能的体验的团队而言 , 它选择什么样的功能放在一个很核心的位置 , 放在一个自己的主页的什么几大金刚的那样位置 , 就这个的权衡跟取舍也是十分考验这个团队能力的 。
就是之前我看过一篇文章 ,他的说法我觉得更现实一点是说你的下一个浏览器可能就不是浏览器了 ,而是真的这些 AI 工具了 。
浏览器这个概念本身在今天这个 AI 的加持下, 它变得更广义了 , 甚至这个广义不单纯是 AI 造成的 , 它在 AI 来之前就已经变得更 , 至少中国的很多浏览器团队在浏览器竞争的最后那个年代 , 那个浏览器本身已经真的非常强大了 ,有各种各样的封装好的小功能跟小工具在里面了 。
只是在那个年代确实已经大家很难调动起来这个积极性了 ,但是当 AI 来了之后, 这件事情真的被提到了一个新的高度 。
这又又想到另外一个当年 Google 的战略 ,Google 当年是想通过 Chrome 来做 OS 的嘛 , 就是你的电脑里是不需要有别的任何东西的 , 你有 Chrome 就好了 , 包括 Chrome 整个的插件生态也是这个逻辑嘛 。
那只不过当年他提出这个战略的时候可能有点早 , 做了几年的努力之后发现还是有限的 。 但是当 AI 这波来了之后, 确实可能未来某个时间点 , 真的你的 PC 跟甚至手机可能真的不需要别的东西了 。
浏览器是一个狭义的概念 , 可能是一个框 , 可能是一个什么样的东西 , 可能是一个什么样的一个入口 , 这个入口实现所有的这些我们的想实现的功能跟场景 。
那这个入口本身 , 它可能除了常规的一个通用的方式之外, 它也会提供它定制好的一些封装好的东西 , 那可能就是大家的区别所在 。
对 , 你刚才说到那个浏览器是入口 ,其实现在可能很多年轻一点的朋友就理解不了 ,因为智能手机 、 移动互联网的入口都是 APP 嘛 。
前互联网时代 ,在当年的软件时代 , 确实软件又是当年的最重要的这个各种各样的入口 ,但是在互联网时代 , 就是浏览器是最最最核心的入口 。
因为在浏览器里 , 你能看到所有的这些信息内容 , 你的功能 , 你购物 、 社交 , 你所有的场景其实基本上都在浏览器里面 。
所以 Chrome 后来虽然说它没有真的真正做成 OS,但是它的那个插件的生态 , 现在也是跟当年我们用浏览器完全不一样 。
就我们能对浏览器做的这种自定义 , 或者它的现在的这种灵活度是变化比较大了 , 只不过现在使用的场景是在被手机压缩 。
但就像你说的 , 可能 AI 有底层的这个逻辑支持之后, 有了更多应用场景之后 ,因为它们 all in one 的价值就就会变大 。
就之前其实会变成因为各个互联网产品 , 大家互相之间有有这种企业竞争之间的这种隔离也好啊 , 或者是场景之间的隔离也好 ,他们并没有要融合在一块的这种这种诉求 。
但是现在可能这种腰尾部的各种各样的场景都能集中在一个地方 , 最后去体现都用同样的一个底层的模型 , 感觉还是确实挺挺新鲜的一个生态 。
而且这个生态看上去也会对做这个 , 比如说我们 all in one 的这样一个产品团队提出更高的要求 。
你看上一波 , 就之前那一波 , 大家有一段时间在疯狂的在插件这个生态里竞争嘛 。 就之前不很多梗图 , 就一个人的浏览 , 当然我自己也是 , 浏览器里可能有六七个插件 , 然后你在浏览很多东西 , 你会发现这些插件之间也在竞争 , 对吧 ?
你你把一个一个文字高亮拉一下, 然后有 , 然后右键有一堆这个可选择的这个标签跟选项 , 然后你会发现可能也不太对 。
但是确实那个时间点 , 可能插件这个形态确实是一个比较适合呃初期跑通小规模的 PINF 一个合适的方式 。
但是插件它当然天生受限于浏览器本身的很多的事情 , 所以你但凡想往后再走一步 , 绝对不可能满足于插件这件形态 , 那你一定是要往后走的 。
你 OpenAI 也好 ,Anthropic 也好 , 国内这些初创的公司以及大厂其实都是这个逻辑 , 所有人都不会满足于是一个插件的 。
对 , 现在真正我们日常的使用体验 , 确实我我想了一下 ,是在急速的提升的 。 就跟跟之前你说一个插件它能解决的问题是比较单一的 ,但现在我想了想 , 跟一年前相比 , 一年前更多的时候是为了说哎 , 这个东西挺新鲜的 , 哎 , 我我试试 AI 能不能帮我干到这个事 。
那个时候是这种更多的这种想法 ,但现在我用这些产品的整个的状态已经发生变化了 。 它的使用频次也好 , 或者使用的深度也好 , 都是超过之前的 AI, 或者说之前用的这种各种浏览器的插件 , 它真的在日常的这种工作生活里面起到作用了 。
我觉得这是也是一个挺大的变化 。 你不管是说夸克还是豆包 , 它这里面塞的东西确实越来越多 。
你像刚才提到夸克之前提出那个 AI in all, 它自己也不讲自己是浏览器了 , 它讲自己是一个 AI 全能助手 。
然后我我看现在豆包也这么叫了 , 豆包叫超级助手 , 就它在首页上会有一句 " 你好刘飞 , 你的超级助手已上线 "。
因为刚才我们提到的 , 它有更多的资源 , 或者说它产品上也投入了很多 , 它也提供了各种各样的新的这些功能 , 包括刚才说的 PPT 啊等等这些 。
所以感觉整个行业都是在往这个方向去走的 , 比比当初的那种浏览器还要怎么说 , 感觉还要繁荣的这么一个生态 。
而且可能也是一种奢侈品 , 对吧 ? 你想你既要有基础的对话的能力 , 然后现在 24 年多模态的能力大家都上了 , 对吧 ?
图片啊 、 音乐 , 对吧 ? 然后视频 , 对吧 ? 多模态能力大家都上了 。 然后呢 , 又需要封装好的各种各样的场景的小东西 。
那最早的比如说什么翻译啊 , 然后这个智能体的构建呀 , 到开始出现更复杂的场景的 , 比如 PPT 也好 , 然后文件整理总结也好 , 脑图也好 , 这些功能项跟可留的点是无限延长的 。
那对于很多团队来讲 ,是不可能一直跟的 。 但是对于那几个比较核心的 , 我们看到的今天这个时间点 ,在这件事上比较有大决心的巨头而言 , 这件事情是一定要跟下去的 。
这最近这一个季度 , 各家头部公司对于团队的调整 , 本质上来讲也是符合这个趋势的 。 底层的技术模型 , 你们继续去技术模型的研发 , 无论是这个模型本身的幻觉问题 , 还是多模态能力的提升 、 效果的提升 、 准确性这些问题 , 模型本身由技术团队来做 。
前面的那些产品体验 、 用户设计 、 场景 、 呃边界 , 然后什么样的取舍 ,由专门来做 2C 应用跟面对这些用户有更强能力的团队来做 。
就是因为你会发现 , 把这两事情放到一起来做 ,是都不可能做好的 。
看到之前有一个新闻 , 就是你前面提到的阿里的通义正式并入阿里智能信息事业群嘛 , 说有一个新的这种战略的大大致的方向 ,是说就叫 AI2C, 还是你看它交给像刚才我们说的那个夸克来做 , 就是因为夸克之前在用户体验上, 它有比较长期的探索 , 所以这边有一个完整的 2C 的战略方向 , 能够集中更多的资源 , 单独的针对性的去在应用层
面去做竞争也好 , 或者说做更多的产品的投入 , 满足更多的用户需求 , 做这些尝试 , 这可能也确实是各个各个公司都都在做的一件事情了 。
我之前 PPT 也有一页梗图 ,是这个当年的三级火箭的这个理论 ,其实有了一次演绎 。 原来的三级火箭是搜狗王永川王总提出来 , 就是搜搜索引擎 、 呃输入法 、 浏览器嘛 , 这三者之间是有三级火箭递进的关系嘛 。
然后你会发现 , 本质上讲在 AI 的年代之后, 所有这些东西都应该是包在一起的 。 输入法 、 呃浏览器 、 搜索引擎其实是包在一起的 。
就按照我们刚才的逻辑来讲 , 它其实都是用户跟 AI 也好 , 跟技术模型本身也好 , 产生交互的方式跟入口 。
然后这些东西没准应该未来会变成统一的一个什么样的东西 。 当然现阶段 , 呃还是有很多分化的场景都在 。
有你看今天几乎所有主流的输入法都在做 AI 的问答跟搜索 , 搜浏览器就不用讲了 , 然后搜索引擎也不用讲了 。
你发现就是现阶段还是处于一个呃分开跟之前被定义好的产品边界里做尝试的 。 但如果再往后往后推演的话 , 那是不是大家可能就在一起了呢 ?
对 , 好像是条条大路通一个方向的 , 通一个入口的这种感觉 。 之前就感觉一提夸克可能很难想象跟跟豆包这种产品是一样的 ,但是现在大家都觉得这是这是一个 AI 工具 , 然后 AI 工具里有就相似的地方也变得越来越多了 , 就长得也越来越像了 。
而且你发现 , 我觉得从产品设计角 , 我们只从最最最狭义的产品设计角度来讲 , 几个头部厂商的纯 AI 助手的那个工具的应用 ,在 PC 端越来越像浏览器了 。
像是一个双引号的像 , 就是它可能从展现的那个就是 UI 层面确实非常 ,但底层逻辑上完全不是了 。
就是它就是一个你可以说 all in one 也好 , 还是一个什么样的东西 , 它就是一个交互的入口 , 加一定的取舍 , 形成那样一个东西 。
而且顺着这个方向 ,其实也涉及到一个点 ,也挺有意思的 , 就会发现以前我们认为是所谓 AI 产品的这些产品 , 它在变得越来越丰富 。
之前我们觉得啊 , 这些是所谓的 ChatGPT-like 的产品 , 像像典型的豆包这种 , 还有一些是原来好像我们认为它是所谓加 AI 的产品 , 或者说跟 AI 有关的产品 , 它现在也变得越来越 AI, 可能 AI 甚至成了它底层的最核心的这个这个组成部分 , 或者技术支持 , 比如像类似夸克这种产品 。
所以好像感觉边界也在越来越模糊 。 而且我其实以前也一直觉得像 AI Native 这种这种说法吧 , 它可能并没有那么那么严谨 , 就大家会觉得说是不是一个定义是 , 就是如果除掉 AI 就不能成立的产品 , 这种才叫 AI Native 的产品 。
但是其实会发现这个这个定义它也不一定那么准确 ,因为很多我们过去使用的一些产品 , 它用的技术它也是耦合在一块的 , 或者说它的它的概念也是耦合在一块的 。
你很难说单摘出来这个东西到底是不是纯 AI 的 ,是不是纯 AI 的产品 ,是不是 AI 原生的产品 , 它就更有价值或者意义 。
我不知道这个你怎么看 。
对 , 就是 AI Native 也是一个一直在讨论 , 一直没有结论的这个概念 , 对吧 ? 之前确实有一个说法 , 或者说确实大家有一些人会认为 , 比如说我们游戏 AI 内什么叫 AI 内游戏 , 大家会认为如果没有 AI 功能 , 这个游戏不成立 , 那叫 AI 内游戏 。
可是那个东西到底是什么 ,其实到今天依然没有绝对意义上的结论 。 那个理想状态的 Native 到底是什么 , 对吧 ?
那反过来讲 , 如果我们不知道 AI Native, 那我们看上个时代移动年代 , 对吧 ? 那移动的 Native 大家会说今天谈论最多的一个是抖音 , 对吧 ?
就一个是拼多多 , 对吧 ? 可能算是美团 。 可是你会发现 , 当移动发展到极端状态的时候 , 可能今天只有拼多多还在坚持不做 PC 跟 Web。
但是反过来讲 , 电商绝对不是一个跟移动有那么大关系的一件事情 , 只能说它是一个只做 Mobile 的 APP, 它不是一个 Mobile Native 的 APP, 比如美团 , 或者说这个滴滴 , 对吧 ?
大家用的所谓的地理位置 , 那确实可能一定程度上是符合狭义上 Native 的概念 。 可是现在如果我们把这套理论放到 AI 这个角度来讲 , 今天本身 AI 的这个区别于上一代技术能力的那个那个特性 , 本身就是一个多元化跟复杂的概念 。
然后你又希望在这个概念之上再套一层 , 变成 AI Native, 那确实这个概念就非常难化 。
而且我觉得可能这个概念出现 , 本身它也是有一个历史原因的 , 就是因为之前呃像 ChatGPT 这种产品出现之后, 像 OpenAI 这种团队出现之后, 大家都在卷这个所谓的大模型 , 都在去讲 AI 这个故事 。
那在那个泡沫当中, 可能有的团队就说哎 , 我是 AI 团队怎么样 , 那这个时候就要做一些区分 。 它它是不是就是一个幌子 , 它是不是只是在自己的功能里面稍微加了一点 AI 的成分 , 加了一个智能客服 , 那是不是就算 AI 产品 ?
所以那个时候是不是更多从技术视角去分辨 ,但现在我们已经在卷应用 ,在卷产品了 , 可能更多还是要从用户视角再再去重新看这个问题 。
对 ,是 。 你像最近两天那个 Minimax 的 CEO 不也接受了次采访吗 ? 那之前我们跟乱总聊过一次 , 就是关于 AI 跟移动的这个这个对比嘛 。
那反过来讲 , 确实就是如果进化到产品这一层 , 用户真的没有那么 care 是不是 AI, 对吧 ? 你像那个纯享就做未知书那个创始人 ,他做未知书的时候 ,其实他就在某一个节点做了一个决定 ,是说他把那个未知书的那个软件介绍的那个核心的那个二级标题里面 , 把 AI 这个描述去掉了 。
就最开始他是写的名字 , 我是一个什么 AI 分析的 , 什么食品分析的这样 。 后来他发现去掉效果更好 , 就是用户并不需要关心你是不是用 AI 实现的 ,而是你把这个场景服务好 , 告诉我这个结果 ,并且超出我的预期 , 这个事情就结束了 。
对 , 庄老师你是做 VC 行业 , 你肯定知道 , 就很多团队他 to VC,他这么讲就好听嘛 ,他可能就是比较容易能够在讲的时候把这个事显得更不一样一些 。
但是我我其实之前一直觉得 AI 是一个 , 它是个技术 , 它并不是一个场景 , 它还跟我们之前所谓的什么 LBS, 比如说基于 LBS 的这些应用 , 现在不怎么提这个词了 ,也是有有有点历史味的那个词了 。
你像之前滴滴啊 、 美团这些都是基于地理位置的这种产品 , 那这个其实稍微说的过去 , 它至少是场景 ,但是 AI 它压根不是场景 , 就你基于 AI 做什么事情 , 这件事更关键 。
所以我我几年前应该就写过一句暴论 , 就大概意思是不存在什么 AI 产品经理 ,因为 AI 是个技术啊 。
你你之前从来没有人说我是 C 语言产品经理 , 我是 Java 产品经理 , 对吧 ? 就这个很莫名其妙啊 , 就是为为什么呢 ?
就是你做的这个场景 , 你用 Java 实现和用 C 语言实现都是一样的呀 。 所以其实就就是刚才说的这个逻辑 , 比如说你做的这个产品 , 我哪怕是用规则写的 , 我最后能达到这个效果 , 那其实对也没问题 。
但是现在有了 AI, 你可以利用 AI 做这个效果 ,而不是说 AI 天然就是对的 。 你就像我们前面说的 , 这封装的应用其实并没有想象 , 大家想象那么超出现在的人工智能的范畴 , 它也不是什么强人工智能 , 这里面其实也加入了大量的规则 , 你要去人为的判断很多各种各样的情况 , 各种各样的事情 , 处理各种问题 , 包括合规的 、 安全的 , 包括各种
场景 。其实这里面人为的东西很多的 , 那它就其实不是一个那么纯 AI 的东西了 , 反而但是反而最后效果是更好的 ,并不代表着 AI 就是对的 。
对 , 我然后我我这里引发一个小的这个 , 我最近考虑一个事情 ,因为最近那个小宇宙不是上了那个 AI 总结的功能吗 ?
就在想就是比如说是一个热门的节目 , 第一个付费会员把这个内容总结之后, 第二个人再去点 AI 总结的时候 , 小宇宙内部怎么处理 ?
是把之前已经生成好的那份 copy 过来 , 还是说再来一次 ?
我感觉应该是 copy 吧 , 如果从成本考虑 。 嗯 ,但是你发现就是大部分今天这个时间点的我们常见的 , 比如 PC 端的这些工具 , 包括公众号里的很多总结的工具 , 基本上每次都应该是独立生成的 。
那为什么大家没有做这些规则上的再处理呢 ? 就可能是优先级 , 或者是时间 , 或者是现阶段可能成本也没有那么高 , 还是怎么样 , 反正就是你就去想嘛 , 就这只是一个非常非常细碎的实现上的一个点 , 它就要你去做选择 , 跟做不同阶段的动态的平衡 ,而这只是一个最最最基本的今天所有人都知道的一个总结的这样一个点 。
那其他那些点的展开呢 ? 所以 25 年可能也会更关心这些应用和场景上大家做的更具体落地的这些事情 。其实其实确实去年一年对于光围绕 AI 这个词的一些关注 , 会花的更多的时间 , 包括这些核心的团队 , 尤其技术团队 , 包括之前大家还会去看像 Transformer 这种论文 , 当年那个论文的一些作者都去创业做什么了呀等等。
那个时候大家更多的是还是看这些人员的情况 、 团队的情况 , 研究那个奥特曼的生平 , 对吧 ?
就当时有好多好多这种流派 ,但现在确实感觉 25 年可能还是最后落到说这些 , 呃不管是大厂也好 , 或者说身边有很多创业的朋友也好 ,他们利用 AI 最后真的做出来什么样的产品啊 , 这个应用到底满足了哪些需求 , 提供了什么价值 , 这个可能是更回归原始的 。其实就像你前面说的 , 现在到这个阶段了 ,并不是说之前大家不需要考虑这个 ,而是
之前可能也也没来得及考虑这个 , 还没到时候 。
而且确实可能中国的团队更擅长考虑这些事情 , 就是美国那边可能还是一个比较卷跟比较跑那个状态 , 再加上他们可能直接就去 to be 跟企业服务那个战场了 , 对吧 ?
就他是考虑那些东西去 ,而且那个东西对他们来讲更顺遂 、 更合理 、 更容易拿到钱 , 无论是 VC 的钱还是客户的钱 。
但是纯从 C 端的这个尝试来讲 , 确实我们这边天生的我们的网民基数 , 对吧 ? 我们网民的用户习惯 , 然后移动互联网加互联网这 20 年积累的很多的我们的经验跟 knowhow,在这个事情上是要有新的一些变化跟调整 , 甚至可能某种程度来说是全世界范围都通用的 。
我们真的不太能指望美国的公司来做这些的尝试 , 跟这些我们定义好的边界场景的实施跟封装的事情 , 可能确实很难指望美国那些公司来做了 。
对对 , 你说的这点感触也确实挺深的 。 你像一年多之前感慨的比较多的是 , 哎呀 , 你看人家那个硅谷的团队才能做出来像 ChatGPT 这样的产品 , 然后当然现在我们也在也在追啊 , 就是单纯从技术层面 , 或者说从尤其是硬件层面 、 芯片层面 , 确实一直在追赶 。
但是应用层面 , 从一年前用的这些国产的 AI 的产品 , 到现在我们在用的这些产品来看 , 这个体验确实已经迭代到比海外的这些要好很多了 。
就是平时使用的这种感受是确实不一样的 。 就我现在确实会用豆包夸克会多一些 , 比那个 Perplexity 和这个 ChatGPT 会多一些 。
你说的这一点还是感触挺深的 。 那现在字节 TikTok 这个事 , 现在也闹得闹得比较热闹 ,也在证明这点嘛 。
你说你说硅谷那些大厂 , 那为什么卷卷不动 ? 在应用层面 ,在体验层面 , 它可能还不仅仅它还有运营啊 , 还有配套设施 , 还有很多上下游乱七八糟一堆的事情 。
对 , 所以这件事确实又看到了一些新的希望机会 ,因为之前就会感觉啊 , 这些东西都追不上, 那我们就等等国外的东西 , 或者说其实在 24 年的时候 , 身边很多朋友已在已经在考虑说 , 哎 , 我是不是就纯做海外市场去做那些 。
但是现在会发现也也有不一样的不同的这种竞争优势嘛 。 对 , 我觉得就是某种程度来说 , 可能会让很多产品人有更多的安心的踏下新来的做自己擅长事情的这样一种状态 。
你肉眼可见要做的事情就很多 。
我记得你之前跟 Koji 聊过一期 , 应该是聊 YC 当年投的那些公司吧 , 投的 AI 公司是不是聊过一期 ?
对对对对 , 聊过 。
当时我印象挺深的 , 就是 to be 的公司的比例占绝大多数 , 做 to C 的非常少 。
是的 。
这是那边的一个风格 。 说到这个 , 呃 , 我不知道你对 AI 行业整体还有哪些让你感觉到挺兴奋的点 , 比如说像我自己 25 年可能会挺关注 AI 硬件 , 尤其像百镜大战这种 。
智能硬件48:10
因为我觉得确实我自己用 Meta 眼镜 , 呃 , 包括现在还有雷鸟 , 之前也去试用过闪击 , 这种感觉是挺不一样的 , 就又让我找到一种挺兴奋的 。
这这确实是一个消费级的场景 , 然后这个场景下有很多可能性 , 大家都可以做很多事情 , 然后因又因为用户规模的快速增长 , 它可能在这个基础上又能迭代出来很多有意思的事情来 。
我不知道你会有什么新的关注吗 ?
你像我在写那个我 PPT 里面去写方向的时候 , 中美两国其实我都提到硬件 , 硬件确实在过去这一年多也经历了比较多的变化 , 然后很多方向的实施也确实有很多产品团队跑出来 , 然后眼镜基本上已经成为一个共识中的共识 。
你看今年 CES 上那几个方向 , 无非就是眼镜 、 戒指 、 陪伴机器人, 然后人形机器人, 什么扫地 , 或者是什么美国的那种什么清理泳池 , 或者是打扫草坪的机器人, 对吧 ?
然后 CES 上全部的公司 , 几乎所有的公司全部都是做这几个方向的 , 就是已经是中美两国的绝对以上的共识 。
我觉得哪怕是硬件本身 ,也依然符合我们今天谈论的这件事 , 这些事情 , 就是硬件是一个更需要定义好产品边界的事情 ,因为硬件本身的成本是在那的 , 你有供应链 , 你有开模 , 你有最小批量的这个投产 , 你有渠道 , 你有存货 , 对吧 ?
你有硬件本身的成本 , 所有这些东西都是实打实的钱 。 就在上一代的这个所谓当年的智能硬件那一波 , 已经有无数的人踩过很多的坑 , 这一波 AI 来了之后, 有一个更大的机会 , 更大可能性 ,但是那些坑依然还都在那 。
硬件这一波确实 ,而且我们只说眼镜这一波 , 肉眼可见的现在可能会分成两个档 , 对吧 ? 一个档可能是用高通的芯片 , 大概可能均价在 2,000 到 1,500 左右 , 那一波就是完全对标着雷鹏的那条眼镜去的 。
然后另外一档 , 就可能用国产的那个紫光还是谁的芯片 , 那一档可能售价能做到对 , 甚至 1,000 以下 , 当然可能体验上会有一些一定的差距 ,但是成本会降得非常快 。
再往后可能高通会有它的分布式的这个芯片的方案在推 , 那 Meta 其实也在推 , 就 Meta 有个实验室的产品 , 就是在推那个分布式的这个方案嘛 。
因为你会发现眼镜本身又要考虑重量 , 要考虑电池散热 , 然后能耗乱七八糟的事情 。 你看 AR 也好 ,VR 也好 , 最后其实最后剩下来的公司大部分是做分体的 , 就是它一定还有个什么样的东西 。AR 的最后的大部分公司是前面有个小盒子 , 那个盒子来实现运算 , 甚至包括电池的一部分的功能 , 眼镜尽可能的不去做这些事情 。
但是 AI 眼镜这一波 , 这个结论还没有到 , 就是到底是不是要有一个别的设备 , 然后如果没有 , 那怎么去平衡刚才那些事情 ?
然后如果有 , 那这个设备跟原来那个设备之间的关系是什么 ? 然后这个又引发另外一个问题 , 比如说戒指 , 比如说手表 ,因为苹果是有手表的 ,而且你会发现苹果的很多的非常新的功能 , 尤其是在比如空间智能啊 、 体感乱七八糟这种智能上, 它最先是用在手表上的 , 它是会用先用手表去试的 。
那未来如果苹果出了一个跟今天我们看到 AI 眼镜技术路线差不多的东西的情况下, 这个眼镜的设备怎么跟苹果的手表之间做结合 , 我觉得也是一个非常可能性会看到的东西 。
那 Meta 自己就不用讲 ,Meta 自己也在做类似的事情 。 再延伸 , 戒指是不是应该也跟这件事情有关系 ? 因为戒指本身天然它就会有手部的动作的识别跟操作的东西 , 那现阶段的戒指更多还是戒指本身的问题 。
那当如果眼镜能够成为另外一个 , 我们不说像手机那么大的终端 ,但至少它成为一个比较重要的终端的话 , 眼镜跟戒指之间是不是应该也可能有交互 ?
这些都是我们大概率可能会在 25 年看到各种各样尝试的公司 , 当然很多可能会变成炮灰 ,但是这个方向就肯定会往这走 。
因为本身哪怕就单说眼镜这个场景 ,其实它因为能捕捉更多我们第一人称视角能看到的各种东西 , 能感受到的各种东西 , 所以它能积累的这些数据 , 又是在之前的这些带原模型数据里拿不到的一些信息 。
所以它对生成 , 包括你前面说的 agent, 它在很多场景下都非常非常有价值 ,因为之前这种真实的比较偏私人化的信息之前是没有的嘛 , 就公开在网上的都是一些公开的信息 。
那光基于这种有新的数据 , 它能产生的这种新的可能性 , 它其实就就有很多想象空间了 。
前两天那个火山开大会不是 , 呃 , 第一个示范视频就是讲他们那个视频模型的那个那个那个视频吗 ?
然后就是比如说他的场景是他们那个负责人今天要出差 , 然后比如说他拿手机拍一下说我在哪 , 我该坐什么车 , 然后我是几点的飞机 , 什么行程 , 然后又在哪又拿手机拍一下 。
然后你发现那个视频有点怪 , 原因在于如果把那个拿拿出来 , 手机打开相机拍摄这个动作 , 换成是一部眼镜 , 那这个所有的全部流程就非常非常的顺遂了 , 就完全不需要有掏出手机拍 , 然后再去跟手机对话的这样一个复杂的流程 , 单纯依靠眼镜 , 眼镜的拍摄跟对话的能力 , 这些事情就全部通了 。
然后就是这些场景会让我感觉都又有好多年没有过的那种觉得挺挺兴奋的这种时刻 。 你包括像你刚才提到的 CES 上出现了很多陪伴机器人嘛 , 刚开始其实我不理解 , 我后来跟有一些家长朋友 ,也包括身边有一些朋友也准备创业做大概这个方向 ,他描述了一下, 我确实又能重新理解说其实现在的刚才还是刚才我们说的那个逻辑 , 就现在的这些
AI 的底层 , 确实小朋友可以跟他聊 , 你就跟他说 , 哎 , 你现在就是一个能能教语言的老师 , 或者说你是一个家教的 , 你是提供一个心理服务的给小朋友聊天的这么一个老师 , 你确实能跟他讲这些 ,但是他依然封装的不够好 ,他没有像刚才我们说的那些交互 ,他并不能让那个小孩能直接就玩起来 , 或者比较兴奋的 , 尤其再加上多模态 , 再加上
那个你可以是不是可以拍照 ,是不是可以跟小天才手表去做更好的结合 , 软硬件的结合 , 场景的结合 , 那其实又又是一个确实挺大的一个有想象空间的方向 , 就这些都是挺有意思的 。
嗯 ,其实你我家里现在有两个是你可以理解是以 24 年的这个这个场景下的产品 , 一个是个对讲机 , 就当然它是给小孩用 ,但是你一听名字它就是个对讲机 , 它的硬件本身就是个对讲机 , 当然它里面内置了大模型的能力 , 然后你可以绑定各种各样模型 。
那为什么 ? 因为它做的早 , 它就用了一个最最最成熟 、 已经被验证的上一代的技术方案 , 把这个东西实现了 , 可以说是 0 到 1 吧 , 对吧 ?
然后我也有那个第一代的这一波所谓 AI 的对话的毛绒玩具 ,但它有个问题 , 就是刚才你说的问题 , 比如说我儿子今年 10 岁 , 呃 , 马上 11 岁 , 我女儿 5 岁 , 遇到的问题在于他们在体验完那个新鲜感之后 ,他不知道该跟那个玩具说什么 , 就跟我们面对一个一个 , 比如说如果今天我没有具体的我要干什么事情 , 你就给我一个 , 无论是 ChatGPT 也好
, 还是什么样东西 , 你放在那 , 我都不知道该说什么 , 需要你问 , 然后他给你答案 , 你问 。 可是你很多时候 , 尤其偏陪伴性的 , 它不是这样的调取的方式 , 它不应该是这样的交互方式 。
但是没办法 , 就上一代的 24 年这波我们能够看到的很多产品 ,是因为它可能在 23 年就开始做了 ,在那个时候它立项 , 然后基于当时的产品技术能力 , 然后设定好边界 , 再把东西做好 , 再设定好可实现的这个边界 , 最后出来的东西可能就是那样的 , 它没办法 。
但是当 25 年这个时候 , 大家可以期待更新的 、 更玩法更多的 , 比如它可能有眼睛的这个眼动的这个扫描 , 对吧 ?
然后根据你现 , 比如家里的成员的状态做记忆 , 对吧 ? 可以跟你打招呼 , 可以它有主动的很多东西的实现 , 那这些东西确实就是需要这个团队的更强的一些 , 无论是产品设计 、 交互 、 各种各样能力的组合 。
对对 , 你说的这个整个的发展趋势又能类比到我们看互联网产品或者移动互联网产品 , 你就想早年, 我记得 20 年前 , 甚至 20 多年前 , 那个时候要上网的时候 , 你要克服很多困难 , 你有很多门槛的 , 你要自己知道说我今天要去哪 , 你要在笔记本上把那个网址记住 , 手打进去 , 然后有很多东西你要主动的去获取 , 它不不可能推给
你 。 到后来有门户网站 , 你可以点来点去这种感受 , 再到后来你什么东西都可以往一个搜索框里输 , 再到后来我变成了很多东西都是直接推给你 , 进入这种个性化推荐的时代 ,其实它这变化都是往这个方向去的 。
就到后面 , 尤其对于小朋友来说 , 它的这种交互的场景肯定是能够变得更丰富的 ,因为因为这个技术条件上并不存在特别大的门槛嘛 ,并不存在很大的瓶颈 。
而且还有一点就是从另外一个从人的角度来讲 , 过去这两年的 AI 的相关的初创公司也培养了一波对这一代 AI 技术能力比较有感觉跟有明确认知的潜在创业者 , 无论他原来是互联网人还是比如说硬件还是做什么样的 , 然后他经历了这一波这两年的 AI 的洗礼之后 ,他对 AI 本身的这个技术能力理解可能也也够 , 然后他这个复合的能力在
这个时间点变成了一种 ready 的状态 , 让我们对 25 年可能会有比较多的优秀的创业者的期待提升了 。
是的是的 , 嗯 , 说到这个我又想到之前看的新闻 ,其实大厂也在考虑应用场景的这种更进一步的结合吧 。其实你看 24 年, 我之前写了一篇文章 , 就是那个字节收购 Ola 嘛 ,Ola Friend 那个耳机 , 它做一个 AI 耳机 ,但是其实这耳机之前做好的 , 它当然后来就可以可以再封装成一个 AI 耳机做 , 包括现在天猫精灵的硬件团队也在跟夸克他们去一起出这种软
硬件结合的产品 , 这其实也也会是一个趋势吧 , 这最后的入口又会有一些新的生态上的变化 。
对 ,而且入口背后的这个能力要求又提了一个新的 level, 对吧 ? 技术 、 产品 、 运营 、 呃 , 场景 、 边界 , 甚至交互 UI 乱七八糟 , 对吧 ?
甚至人机交互的各种各样东西都要绑合好 , 耦合好变成一个整体的交付 。
应用融合58:35
对 , 哎 , 那庄老师有没有遇到过那些挺让你下头的闲着时间 , 就是发现哦 , 好像这个跟之前想的不一样 , 还是跟这个自己的使用场景有关 。
就平时做 PPT 还是太多 , 就是现阶段的 PPT 工具都没有那么理想 , 或者说反过来讲 , 我们这些人太要求太高了 , 就如果真的某天我们这些人都可以搞定 , 那就像你那个我今天下午听你跟那个谁聊天的时候 , 就说那个代码那个比喻是一样的 。
就如果真的到了那一天 , 手抠的画 PPT 真的变成那个历史遗物的时候 , 那真的是到了 ,但现阶段还没有 。
但是反过来讲 , 代码已经快到了 , 从 Cursor 到 Devon, 就是你明显感觉这个事情控制不住了 , 真的会变成如你所说 , 就是以后手抠代码变成一种历史遗老遗少一般的成 , 对 , 变成行为艺术一般了 。
对 ,但是现在比如说在我日常用的多最多的 PPT 这个场景里 , 确实还是比较难 。 再加上比如说即便这么多产品用了这么多年, 两三年的时间 , 那么多的比如做文件整理跟总结的这个这个这个尝试的 , 可是你发现我们举例子 , 比如兰西每次跟乱整直播 , 为什么要带兰西 ?
就是兰西会有一个他自己的总结跟整理 , 兰心一言 , 就是他的总结和整理 , 你你会特别的相信他 ,他不会漏掉任何一个核心的重要的观点跟结论 。
但是你看现阶段的这些 , 哪怕是已经极度成熟的这些总结 , 哪怕你是输入了非常你认为完善的提示词的框架 , 得到的那个结果 , 你还是会担心 , 就还是会担心他漏掉了什么 , 或者是没有抓到什么 。
但是你看兰西的总结 , 你就不会担心这些问题 , 你甚至会觉得我可以不用去看原来那个视频跟那个播客了 , 对吧 ?
这个我感受也很深 , 你像之前也会比较焦虑 , 说啊 , 内容创作这件事是不是跟代码类似 , 然后后来发现确实不是 , 就内容创作 , 或者说做内容相关的 ,不管是总结 、 整理 、 分析 ,其实有太多的主观判断的这个成分 , 它不是一个确定性很强的任务 , 代码是个确定性非常强 。
然后就包括前面说的 , 为什么在那些很具体的场景下,AI 的封装它足够有意义和有价值 , 比如说像像做那个讲题 、 搜题 , 然后什么 , 甚至包括去水印啊 , 去帮你生成一套那个 Excel 表格的公式啊等等 , 这些其实会就非常明确嘛 , 你的指令也很明确 , 你想得到的东西也很明确 , 这些会迅速的能能够覆盖掉 , 这个还是确实不一样的 。
再说回来 , 还是一个整体乐观的一个感受吧 。
还是那个很朴素的道理 , 就是肉眼可见要做的事还有很多 , 就是你都不要太想太复杂跟太远的逻辑 , 单纯只是把现阶段要排在日程上该做完的东西做完 , 就已经蛮多事情要做了 。
我觉得确实得多关注一下这些具体的场景和应用 ,其实有身身边有很多朋友跟我讲说 , 哎 , 我我要学习 AI, 我说你学习 AI 这个这你要怎么学 , 都不知道该怎么怎么入手学 。
就是学习 AI 并不是说读那些论文 , 去看这种 OpenAI 的历史 , 就你不目的不是很明确 。 但现在就像我们说的 , 呃 , 进进入到这个阶段了 ,其实我是觉得对于每个朋友来说 ,不管说未未来 AI 可能这个工具 , 它是不是能影响到你的工作生活 , 比如说对于程序员来说 , 或者说对于呃 , 美术设计师来说 , 或者说对于很多老师 、 教育行业的朋友来说 ,
可能现在有一些确定性的场景 , 就还是说的比较俗的那句话 , 未来以来还不均匀嘛 , 那在有些地方已经比较明确的产生很好的效果了 , 它正在慢慢的蔓延覆盖 , 它会有涟漪 。
所以还是如果大家对 AI 感兴趣 , 我我自己个人比较强烈的建议 , 就是先去用一用 , 你你先用用夸克 , 先用用豆包 , 你先用用这些大家在用的产品 , 你大概就知道 AI 是怎么回事了 。
你如果说一年多之前你用 ChatGPT 还有一些困难 , 你用 Claude 还用不了 , 那现在有这么好的国产的产品 , 你在体验肯定会有很多不一样的感受 。
而且就是还有点很现实的 , 就是你的日常工作中有什么事是你一直都要做的 , 然后你又希望它的效率被提升或者效果被改善 , 那以这个为这个相当于你的推动力 , 那就更简单了 。
是任务驱动的 ,而不是说就泛泛的去了解一下 ,因因为哪怕同一个工具 , 你泛泛的去用 ,也只是能把它当成玩具 。
但如果说你有一个任务驱动 , 就哎 , 我我平时 PPT 是我工作当中的中心 , 我就看看现在各个 AI PPT 的功能是不是足够能覆盖我的场景了 , 那这个时候会有更明确的一些感知 。
对 , 所以就是我也过了那个最焦虑的年代了 , 就是大家今天也不太有太多人再去看什么论文啊 , 什么这些东西了 , 就是该怎么用就用起来吧 , 对吧 ?
但是那天我做完 PPT, 正好做完那一天两条新闻 , 一条新闻是那个我记得是某个初创大模型公司融了一笔钱 ,而且不是那个那个几几个所谓小龙的公司 , 还有一个是某个大厂 , 或者说定义好了下阶段的这个战略的这个重心 , 呃 ,AI 当然都是所有人重心 ,但是更重要的是 AI 怎么来做 , 就是它变成一个新的 level 的工作的时候 。
然后你会发现 , 就是说虽然你可能很在今天这个时间点比较容易下比较悲观的结论 , 比如大模型的技术能力 , 我们确实跟美国有一定的差距 , 对吧 ?
然后呃 , 纯粹的初创公司做大模型这件事情确实比较难 , 对吧 ? 但是呢 , 活还是得干 , 对吧 ?
生活还是得继续 , 总有人要负重前行的 , 对吧 ? 然后你会觉得现阶段没有所谓真正意义上绝对的标准达成共识 ,但是就是在那些细碎的细微的用户的场景也好 , 工具的实现也好 , 然后技术的边界也好 , 去找寻那种可能性 。
就我之前总有个比方是说 , 就是我用钥匙的这个比喻 , 就是实体的钥匙 , 每一把钥匙之间的那个细微的锯齿的差别 , 就是每一把钥匙跟每一把锁的能够对上的原因 。
大面上看上去每把钥匙都差不多 ,但是细微的每一个锯齿的区别 ,以及对应那个锁的那个锁芯里的那个东西的匹配 , 就是每一把锁存在跟每一把钥匙存在的价值 。
那今天这个时间点 ,AI 的应用也是类似在找寻这样的过程 , 就是初创摆在桌面上可能有 100 把钥匙 , 看上去初期都是一样的 ,但是它需要不断的打磨 ,不断的去磨它那个齿的那个锋利的程度 , 每有多少个齿 ,有多少个齿是锋利的 ,有多少个齿是缓和的 ,有多少个齿是高的 , 多少个齿是低的 , 然后磨到一定程度插进去成功 , 然后一把钥匙一把锁
配好 。AI 也在经历这样的过程 , 这个过程当然会痛苦 , 会有很多的炮灰 , 会有很多的不太成功的尝试 ,但是只有经过那个过程 , 才能实现那个匹配的最后的结果 。
而且我会觉得有一个比较乐观的点 , 除了刚才我们说的应用场景上看到了很多探索在落地的方向 , 还有就是对于很多独立开发者或者大厂 、 中厂 、 小厂的产品来说 , 确实手头有更多的事可以做了 。
可能大家有手里有的资源 , 或者说自己面临的目标是都不一样的 ,但是你能找到自己擅长的 ,其实这也是一个钥匙和锁的锁的逻辑 , 就是你的钥匙能开什么样的锁 , 你的钥匙是大的小的 ,其实有一个好的判断之后, 你再去看 AI 能帮助你做到什么程度 ,其实这又是一个挺好的时代 。
当然可能跟还是跟之前移动互联网比不太一样 ,但是它是一个挺值得去尝试的 , 就你自己熟悉的场景或者用户能把产品做呃 , 通过 AI 做出来一个挺好的时代的 , 我觉得 。
而且又因为 AI 本身的技术能力的加持 , 让这件事情的门槛其实是更低的 。 代码也好 , 交互也好 , 然后各种东西的生成跟各种各样工具的丰富程度 ,其实在 AI 时代是丰富了不止一个量级的 , 那让有想法的人更容易跟更快的实现自己的想法 。
这种标准化的组件确实也越来越多 , 门槛是在降的越来越低 。 像之前三五环也聊过小猫补光灯的那个作者花生嘛 ,他也是个典型的案例 ,他自己是一个产品运营出身 , 然后没有任何技术背景 , 然后花了几个月时间自已自学 , 就能开发出一个小而美的产品来 ,其实是一个非常好的案例 , 对未来还是充满乐观 , 哈哈 。
而而且你会发现过去呢 , 一直有一个我认为到今天依然没有改变的趋势 ,是说因为大家没有绝对意义上的标准答案跟绝对意义上的共识 , 所以但凡有谁尝试出来一点点东西 , 市场会给你比这个东西更多的正反馈 。
嗯 , 对对 , 就是因为大家都很迷茫 , 都很不知道该干嘛 , 都需要得到一些答案跟所谓的心理的位阶跟里程碑还是什么东西 ,但凡有人达到了一点点 ,他所得到的关注跟正反馈是远远大于那个事情本身的 。
是的是的 , 所以大家可以乐观起来 , 挺好的 。 行啊 , 那我们今天就先聊到这 , 我感觉是落落到这个地方挺好 , 哈哈 。
大家也有什么新的这种 AI 的观察和一些思考 , 对我们刚才聊的有哪些想法 , 都可以在评论区留言 。
感谢庄老师 , 那我们就下期再见
。






