Chatbot格局0:00
欢迎大家收听 《 三五环 》。 我是刘飞 , 今天邀请到了老朋友庄明浩老师 , 先跟大家打声招呼吧 。
哈喽哈喽 , 大家好 ! 我是屠龙之术的主播庄明浩 。
对 , 跟庄老师已经聊过好几次 《 三五环 》 了 ,也是老朋友了 。 前阵子应该我们就是在北京见了一次 , 当时是 IMA 的周年的有一个邀请媒体朋友大家一起聊一聊的有一个活动吧 。
当时就聊起来就是关于腾讯在 AI 上面的一些动作 , 感觉挺有意思这个话题 。 我们今天就拿这个单独拎出来聊一聊 , 就是腾讯现在在 AI 方面到底我们从第三方的视角观察 , 它现在是一个什么样的状况 , 我们大家是一个什么样的体感 。
首先我先说一下, 我的确也会感觉比起其他的这些产品 , 尤其身边的朋友大家交流起来 , 会觉得好像存在感会稍微弱一些 。
当然元宝本身作为腾讯的主推的产品 ,也并没有说像另外的某些厂牌一样那么弱 ,但是比起来像字节系的也好 , 或者说像海外的这些也好 , 大家会感觉存在感稍微有些弱 。
我不知道一听到腾讯系的 AI, 庄老师直观上会有什么感觉 。
我觉得顺着你刚才的话来说 , 就是因为这个时间点正好 ChatGPT 发布三年的时间 , 我们叫 Chatbot 的这个形态确实在过去三年过于强势了 。
这个双引号的强势我觉得是一种 , 尤其在产品的功能跟产品设计的定义这个事情上, 某种程度上说它占据了我们讨论 AI 这个话题的很大的空间 。
似乎很多人在讨论 AI 的时候是在讨论类似 ChatGPT 这样的偏以 Chat 为代表的 AI 产品 。 如果我们只谈论这个狭义的角度来看 , 确实我觉得跟腾讯策略有关 。
元宝今天这个十年可能在以一个类似跟随的策略在参与到这个竞争中 。 可是在纯 Chatbot 的国内战场里 ,其实去年的时候可能字节的豆包就比较强势 , 今年年初 DeepSeek 火了之后 DeepSeek 也比较强势 , 然后年底的时候阿里的两个相关的产品也做了一波比较大的推广 。
但是我觉得在 Q3 财报分析商会上, 好像是马桶马总还是马挺说 ,是说在今天这个时间点 , 从腾讯角度来看 , 纯 Chatbot 或者说纯自然语言的语言模型这个事情 , 大家之间的差距是不是特别大 。
谁也很难在这个形态上说绝对意义上的比另外一个竞争对手强非常多 。 然后又因为现存的 Chatbot 这个形态 , 可能单纯考虑到大家比如说常见的留存 、 时长 , 包括可能未来大家去期待中所谓的商业模式的拓展来看 ,也不是那么的理想 , 即便 ChatGPT 已经发布三年 。
所以从这个角度来看 , 确实如果我们单纯只谈论类似 Chatbot 这个战场而言 , 元宝的参与程度不是那么高 。
但反过来讲 ,也有另外一个个人体感上的不同是说 , 我其实推荐给身边无数多的对这个行业不那么了解的人, 如何去体验 AI 的最直接跟最方便的一个方式 , 就是把你微信里的元宝那个号置顶 。
它是一种几乎没有任何操作成本的方式 , 能够让你在这一波 AI 浪潮当中以一个普通人, 你每天要看公众号 、 看什么各种各样的东西 ,以最简单的操作步骤 、 最短的执行方式获得这波 AI 能力的展现 。
而且包括比如说公众号的评论区 , 很多用户也开始习惯用 @ 元宝的方式来获取相关的内容 。 所以这个角度来看 , 可能元宝他在打的仗跟我们今天看到那些纯 Chatbot 的 App 跟独立的 App 之间不太一样 , 或者说腾讯有这个资格 , 我相当于再开一桌 。
我不以传统意义上的古典的纯独立 App 的方式去竞争这件事情 , 似乎那件事情的战场的意义跟阶段性的成杯不是那么重要 。
所以它以另外一种可能更适合腾讯跟腾讯更擅长的方式来去做这样的一个拓展 。 所以我们只谈论类似狭义上的 Chatbot 这个事情的话来说是这样 。
但是今天我们话题绝对不会仅仅聊 Chatbot 这一个很简单的事情上 。
对 ,Chatbot 它是一个过去我们理解可能 AI 公司大家都在竞争的一个非常主流的模式 。 但是从目前来看 , 元宝它虽然看起来是个 Chatbot,但是因为腾讯系统内整个大的生态内它有各种各样的产品 , 所以它可以变成这个生态的一个连接器 。
它并不只是一个单纯的我就端到端 , 我只是在聊天 , 我在当场就能只获取信息的这么一个产品 ,而是它可能能变成一个很重要的入口 。
这个入口不光能提供信息 , 还能提供服务 。 这其实有点像比如说微信的小程序 , 它想要达成的这么一个效果 。
这个入口未来它能连接各种各样微信背后的服务 , 它可以搜公众号 , 它可以听 QQ 音乐 , 它可以读背后的腾讯系的各种各样的文章 。
这样一个连接器 , 它就能变成一个很新的再获取腾讯内部产品的一个入口 。 它其实有点像大家未来想做的那种操作系统了 。
这其实也是可能是腾讯比较独有的优势 。 而且整个 AI 行业天翻地覆之后, 会发现 Chatbot 也是快速的从之前大家感觉是万马奔腾 , 到现在变成可能大厂的确还是更有优势一些 。
背后的资源 , 背后的包括从大模型到 TuSe 的这块用户体验的支持 , 整体上来看 。 因为日常也在用 , 对比过你还是会发现 ,不管是元宝 、 通义 、 豆包这些产品 , 还是海外的这些 , 比起大家一两年前的整体的体验 ,不管是回答的质量还是说整个大家沟通的 , 包括多模态 , 包括各种各样的功能 , 都还是有特别大的一些变化的 。
这种变化我感觉也是好像感觉跟之前我们在聊 AI 的时候 , 整个的趋势是不太一样的 。 大公司慢慢的 , 尤其像腾讯这种 , 它可能比较关注产品的这种公司 , 它会慢慢的又跟上来了 。
它和之前那种 , 比如说尤其是在 ChatGPT 3.5 刚出来之后, 大家会讨论说谁大模型做的最好 。 从那个时候的腾讯的存在感比较弱 , 到现在它反而存在感会变得更强了一些 。
对 ,因为这个某种程度上说也在跟今年的 AI 战场 , 从技术到应用 , 从语言到行为 , 或者说从所谓的 R1 到 R2 到所谓 Agent 的跨越 , 可能都相关 。
因为确实纯语言模型底层技术的演进 , 虽然竞争还非常的激烈 ,但确实大家也面对了各种各样的现实的问题 , 比如说 Benchmark 开始失效了 , 大家甚至不知道该怎么去评估纯技术的好坏的区别 。
这个时候我们从盘逻辑角度来讲 , 场景跟所谓的用户体验的优先级变得更高了 。 因为纯打分跟 Benchmark 那个东西已经不足以代表模型是否好用了 。
这个逻辑无论是在中国还是美国 , 确实在最近一段时间更明显 , 越来越多有场景的公司 , 无论是大公司还是小公司 ,在把模型从技术到产品的跨的这一步上的显现出来的状态 , 会某种程度上说优于纯技术模型本身公司做的事情 。
当然你说这个事情是一个阶段性的波浪 , 还是说它是一个肉眼可见的未来就一直是这个趋势 , 现在也不好说 ,但确实在这一段时间可能以半年期为计 , 进入到 2025 年下半年, 这个事情会更明显一点 。
大家越来越强调无论是用户的体验 , 还是场景的落地 , 还是已有场景的研究比较深的公司 ,在这件事情上的 AI 的赋能的变化 , 确实趋势会更明显一点 。
对 , 像上次庄老师你来 《 三五环 》 我们聊的时候就提到过 , 今年肯定算是一个场景之年 。 大模型明显整体的质量是不能说已经完全摸到天花板了 ,但是它肯定从性能上或者从最后的效果上已经是没有之前迭代那么快 , 加速度在放缓 。
放缓的时候 , 当大家发现核心的瓶颈其实是在场景和应用上之后, 这个时候大家就开始讨论产品上有哪些可以突破的地方 。
因为 Chatbot 就像前面庄老师提到的 , 它在一开始其实就是有争议的 , 它能不能解决所有的问题 , 然后以及说大家花了大量的投放去做 Chatbot 的用户的活跃度 ,但是你就会发现它没有什么粘性 , 或者说迁移成本是非常低的 。
这条路已经被某几个小龙证明不太合理了吗 ?
对 , 所以说这种高尝鲜低留存的问题 , 它是对于 Chatbot 来说很明确存在的一个问题 。 接下来从你的视角 , 你观察到整个大的产品趋势 , 或者说大家以场景以应用为驱动的趋势 , 会变成一个什么样的 ?
之前有个说法就是要从纯语言到行为 , 语言的狭义就是这轮定义的以 Chatbot 为代表的 LUI, 行为它就会变得更复杂吗 ?
研究是行为 , 做个网页是个行为 , 做个 App 是个行为 , 甚至把 AI 的能力赋予到一个具体场景中, 实现一个什么样的功能可能也是行为 。
大家在准备这话题时我想到一个角度是说 , 你比如说今天这个时间点 , 我们现在在用腾讯会议这样一个产品 , 它因为 AI 能力带来的功能的叠加的提升 ,在产品端的改进 ,以及这些事情对最直接的 , 比如收入的提升 , 或者说付费用户转化率的提升 , 如果能够在今年看到形成所谓的正循环 , 比如对于腾讯会议这个 team 而言 , 这件事情就
是 righted, 就是 work 的 , 它就可以持续的去投入 , 持续的去让这个功能也好 , 这个模块也好 , 变得更贴近现在用户的使用体验的好的方向 , 然后它在这个过程中能够明确的得到正反馈 , 那就是一个比较良性的状态 。
然后你会发现以这个角度去看 , 比如今年可能无论是按垂直行业来看 , 还是按 Agent 来看 ,其实很多拿到阶段性成绩比较好的公司 , 或多或少都符合这个逻辑 。
当然这里面有一些是纯模型公司 ,但大部分其实是偏应用层或者偏场景层的公司拿到了这样比较好的结果 。
对 , 我其实在前两年一直会有一种感觉是 , 大家经常提所谓 AI native 去聊说 AI 到底能从底层逻辑去颠覆哪些行业哪些领域 ,但是后来会慢慢发现它很难变成一个彻底改变某个行业底层逻辑的这么一个技术 。
它更多的还是与其说是 AI 加什么东西 ,不如说是什么东西加 AI。 现在的很多行业很多领域很多场景 , 更多的是通过 AI 去改变它生产力的效率 , 让它可能在提供给用户服务或者提供给大家功能的时候变得更加方便 , 更加有效 ,而不是说整个使用的方式发生了很大的变化 。
你会发现很多交互可能在没有太多变化的同时, 已经能给大家创造很多新的价值了 。 我会有这种感觉 。
对 , 这个是我们从用户层面的感觉 。 从底下那一层其实也一样 。 你看前两天老黄 , 就是 NVDA 老黄接受采访的时候 ,他说 , 当然他在回应业界对泡沫的这轮讨论 ,他说他看到的机会可能是三个数量级的机会 。
第一个数量级是说现有的已经非常巨大跟庞大的互联网体系的 AI 化 , 就是对于已经有非常强大的业务关联性的相关的公司 , 无论是美国的 Google 也好 , 亚马逊也好 ,Meta 也好 , 微软也好 , 还是中国的腾讯也好 , 阿里也好 , 字节也好 , 所有这些公司的业务的 AI 化这件事情 , 就这个机会 , 无论是对于硬件厂商 , 对于数据中心建设方 , 对于 AI 的模型
本身的提升 ,以及这些公司本身内部的业务的 ROI 的提效这件事情 , 就这个叙事已经是一个巨大无比的叙事了 。
我们都先不要去考虑纯希望中理想的所谓 AI native 的事情 。他说这个转化本身就是第一个量级 。 然后第二量级他是说我们能够期待中的这些转化到了 AI 那个样子之后, 这些业务再延续一步的可能性又是一个量级的故事 。
然后第三个量级的故事才是我们原来理想中所谓 AI native 的叙事 。 似乎看上去中短期哪怕没有最理想的 AI native 的叙事的情况下, 现有的逻辑的发展的角度来看 , 这个增速也是非常明显 。
而且还有另外更有力的例证说 , 你看今天这个时间点 , 国内外厂商去比如说头部的云厂商的 token 的消耗的数据的提升 , 大部分其实是被自身业务吃掉的 。
它不那么 care 今天这个时间点 , 一个第三方公司用了我的什么 API, 用了我的模型 , 还是用了我什么方式产生了什么样的 token, 我收了多少钱 。在这个节点你会发现这个增速 , 就拉那个曲线 , 它那个斜率在往上 。
那个往上的大部分动力是那个公司本身自身业务带来的 , 几乎可以忽略掉所谓的第三方跟我们叫 AI native 理想中的东西 。
而且看上去这个曲线往上拉的速度没有任何放缓的状态 , 尤其在过去可能两三个季度里 。 所以似乎中短期光这个叙事就够我们撑往后走很长一段时间路 。
对 , 这种内部通过一些 AI 改造生产力去做提效 , 已经呈现在很多财报上 。 因为今天你像我们聊腾讯 , 腾讯最新的财报里边就能看到第三季度它提到说在 AI 跟微信商业生态持续提振下, 广告收入同比提升 21% 到 360 多亿 , 说这是利用了很多全新的这种 AI 的技术 , 让它更高效了 , 它的 ROI 也更高了 , 广告主整体的也更高了 。
包括说我看到腾讯还提到一个内部有 90% 的程序员在使用 codebody, 然后现在新增的 50% 的代码是由 AI 生成的 。
这些其实是在可能相对来说比较水下, 大家从元宝从豆包是感知不到的层面 ,其实在这种大厂已经先落地了 , 这种落地的效果还是挺显著的看起来 。
对 , 这种趋势似乎都已经不需要再去探讨跟去纠正 , 或者说再去讨论它的可能性跟正确与否 。 它已经策马狂奔的平趟在你的生产管线 。
而且你想吗 , 如果以腾讯为代表的 , 我们想腾讯的核心的 , 比如收入贡献来源 , 金融服务 , 然后游戏 , 对 , 然后广告 , 对吧 , 可能还有一部分 2B 的服务 。
你看那几个最大的板块里面 , 你刚才聊到过 , 比如说内部提效角度来讲 , 你看我所更熟的游戏这个板块 ,其实腾讯的 , 我们叫 IEG,IEG 就是腾讯会议 , 做游戏这个事业部的 AI 中台 ,其实可能是国内哪怕把所有互联网公司加在一起 ,在 AIGC 以及 AI 跟游戏结合这件事情上提供功能跟在做相关模块最多的厂商之一 。
因为我的上一期播客在聊这个话题 , 所以跟他们一人有过沟通 。 所以在这件事情上不需要去探讨它的必要性 , 它的 ROI 是否为正 , 这都不需要 , 它已经完完全全 totally 在推进过程中了 。
对 , 所以这个可能是首先第一个层面 , 对于这些大厂来说 , 可能当然不光是大厂 , 中小企业肯定也能在生产力上 AI 对他们有各种各样的赋能 , 只不过大厂它本身基数就大 , 它可能受 AI 的影响也会更大 。
这是从内部的视角 , 然后我们还是再说到外部的视角 ,其实之前像 AI 浪潮这么多讨论之后, 有一些人也会感觉说你看 AI 之前 ChatGPT 3.5 出现了这么久 , 到现在好像也没有感觉我们 2C 的场景上是有特别多的落地 。
这种 2C 的场景 ,2C 的应用是不是相对来说是一个伪需求 , 或者说在产品上是不是还没有出现那种大家认为是所谓 killer app, 它是一个更像泡沫的一个东西 , 这点是怎么看的 , 就是 2C 这个层面 。
纯 2C 就是 Chatbot 已经跑出来了 , 虽然它有各种各样的问题 , 虽然它有留存商业转化率 ,但是 anyway Chatbot 已经变成一种偏通用的 , 历史上最快达到很多里程碑性质的记录性质的这样的一个产品形态 , 无论它多么简单跟多么的大家不认为它是 ,但是现实存在的状态就是它已经是了 。
哪怕它不是像移动互联网出现的那些特别大的应用 ,但是它至少替代了搜索引擎 , 就像我身边的很多人已经不用搜索引擎了 。
对 , 所以这个已经是一个巨大无比的东西摆在这里了 。 如果把世界范围内所有 Chatbot 加一起的用户量级 ,其实已经可能是一个天文数字了 , 对吧 。
然后在另外一个角度来看 ,因为咱们这帮从业经验者的经历的年份 ,是我们天生习惯于以移动互联网的年份的考量方式跟思维方式去考虑今天的 AI 的相关的应用 。
但是现在的问题在于 , 这个时间点可能确实即便到今天可能还没有到像移动互联网真正意义上产生绝对爆发的时间点 ,而且还有点很现实的问题在于 ,是否一定要沿袭传统移动互联网定义的那套东西 , 我觉得也是问号 。
但这个事情就是说它是一个上面这段话特别战术化不腰疼 , 即便是我们在战场里跟天天在盯这些事情的人, 我们也不可避免的还是会用古典意义上的 , 比如留存 、 时长这种方式去衡量 。
可是你发现这个事情没办法衡量的情况下, 大家开始转移 , 比如以投资的视角来看 , 我们怎么去看意义上的这些初创的 AI 相关的应用公司 ,其实大家后来没有办法就开始 ,他也没有所谓的 PMF 看 AI2, 我们只能去看结果了 。
然后你会发现这个讨论过程中也出现了一些问题 , 比如说关于 AI2 的毛利的问题 ,AI2 计算的问题更重要 。
然后到今天大家去开始讨论 , 似乎我们应该更退一步 ,因为移动互联网发展十几年, 到最后告诉大家最终极的答案就是留存 、 时长跟转化 , 就这么几件事情 , 对吧 。
但那是一个太过终极的答案 , 所以我们往前退了一步 , 发现还不行 , 我们再往前退一步 , 就退到最原始 , 大家发现我们还是要考量那些听起来正确的废话 , 到底用户的需求是什么 , 我们以什么样的方式满足这个需求 , 什么样的指标能够去衡量它满足了 。
似乎看上去今天这个时间点大家在讨论是说 , 比如它的 token 的消耗的速度在变快 , 然后它在很短的时间内达到一个很大的狭窄人群的用户覆盖 。
大家再去看早年, 我们看移动互联网最早年那些 APP 的状态 , 我们不太那么去看所谓的 AI2, 所谓在初期的留存跟时长 ,因为那是一个终极的答案 。
所以在这个时间点来看 , 你会发现在今年可能下半年左右时间点出现了一些比较有意思的新 APP。 当然还有另外一个角度是说 , 从人的角度 ,有一批创业者是经历了过去三年的浪潮 ,他可能原来有一个非常资深的经验的同时 ,也积累了比较强这一波 AI 的经验 , 然后他在这个时间点选择再去重新出发创业的时候 ,他的切入点也好 ,他选择的他在做的
应用的功能 , 初期的执行方式运营节奏 ,他就会比较顺 , 得到更多的市场的关注跟认可 。 这一波出现了之后, 这个事情再往后推 , 它就会越来越好 。
是 , 大概能感知到庄老师说的这一点 。 我们就顺着这个话题讲一讲我们感知到的 , 像现在日常使用的产品的具体的一些场景 。
比如说我会明显感觉到现在我在用几个产品 , 之前用的这些产品的时候 , 场景是差不多的 , 这个试试那个试试 , 看哪个给的大家效果好 。
但现在我会明显有一些区分度 ,在我做内容写稿子的时候 , 我会感觉比如说需要比较基础概念的 , 我可能会用豆包 ,因为它给的速度比较快 ,但有一些我可能需要有更多搜集材料的 。
因为我发现公众号能提供相对准确的信息 ,其他的平台的幻觉就更强了 , 尤其是中文资料整个圈子里 。
所以当我想要搜集一些信息的时候 , 想要研究一个课题的时候 , 这个时候用元宝用的就会比较多 。
然后有一些特殊的场景 , 我可能需要去整理自己过去讲过的一些东西 , 或者说自己之前聊过的一些东西 , 我就会像用 IMA, 然后还有一些可能海外的一些资料等等 , 就用海外的这些产品 , 用 Gemini 可能也会多一些 。
因为我发现我使用它变多也是因为跟元宝一样的逻辑 , 它的资料和它搜集的能力的确比 ChatGPT 要全面一些 , 或者说要准确一些 。
我会有这种体感 , 我能感觉到在过去大模型技术上已经拉不开太大差距之后, 这种场景上的差距和大家手握的这种资源数据带来的这种差异正在变得越来越明显 。
我觉得数据确实越来越 , 数据算法跟算力不是大家总提的三个核心的要素吗 ?
对 。
纯从个人体验来讲 , 这一波的发展到这之后, 从算法层面跟算力层面确实用户的体感是不会有那么强的感知的 ,但数据层面的感知确实在越来越强 。
数据壁垒21:41
然后你像最近一段时间海外 Gemini 3 的口碑非常的好 , 确实也有很多人会在社交媒体上说 Google 的那么多年的积累的搜索的偏好 , 对用户的习惯的感知 , 这些东西越来越显得重要了 。
确实对于 OpenAI 而言 , 它虽然 AI 出来的第一天大家都说这部大模型 , 尤其是偏语言大模型 , 确实是奔着搜索一步会看得到的 。
可是搜索毕竟还是一个需要很长积累的事情 , 它积累那些东西 , 当彼此之间的模型能力差距没有那么大的情况下, 那个积累的编译效应就显现了 。在国内那就更明显了 , 微信在中文互联网 , 尤其公众号的这个板块 ,在中文互联网的质量的断档式的领先 , 当然就会决定结果 。
所以从这个角度来看 , 当然我们这些人都是基本天天都在用 ,而且确实有比较明确场景在用的 。
可是这种我们叫体验跟数据层展现出来的用户使用感官上的差距所带来的叫用户的感知 , 尤其对普通用户而言 , 现在可能还有点早 ,但是越来越多用户在有这种感觉 。
既然说到 Gemini 3 Pro 这个版本 , 庄老师了解到的 , 比如大家对它的评价特别好 , 主要是基于哪些方面 ?
它是两天 , 第一天发的是 Gemini 3 Pro, 然后第二天发的是 Note 2 Pro, 这两个基本上是连在一起在讨论的 。 然后首先就像我们刚才说 , 纯大语言模型本身的评判在今天无论是对于一个机构还是一个数据方 , 还是对于个人用户而言 , 确实已经很难了 。
所以哪怕 Gemini 3 Pro 的搒单放上之后 ,但搒单现在已经没有人看了 , 大家还是从体感的角度来去评判 。
所以纯从用户角度来讲 , 我觉得大家的评判 , 或者大家为什么认为它的能力在提升的原因 , 就在于刚才我们说的原因 ,Google 积累这么多年的在搜索的体验上的这些东西 , 这些 knowhow, 这些对于用户一个输入一个关键词或输入一段话 , 它的语义的理解 , 它想得到什么样的结果 , 什么样的结果是好 , 什么样的结果是不好 , 这套东西在慢慢影
响 Gemini 3 的输出的结果 。 而且 Gemini 3 现在已经融到 Google 的正常搜索的 AI 模式里了 , 所以从这个角度来看是这样 。
然后引发更大范围传播的 , 我觉得是 Nano Banana 的这一轮 。 那天我现在的工作公司的投资人组织了一场 Google 官方跟我们开的来讲 Google 这一波的模型的进展 。
我觉得从他们角度来讲 ,他们会认为语言多模态跟 Agent 这三件事情是包在一起的 。 对于 Google 而言 , 这三件事情是一件事情 , 它不是独立开 , 就像我原来写 PPT 的时候 , 自然语言是一桌 , 多模态是一桌 ,Coding 是一桌 ,他们会认为是一桌 , 就是一起的 。
所以从结果上来看 ,因为你有了更强多模态能力 , 然后你多模态能力是带着你的自然语言模型的能力的情况下, 就出现了一种从量变到质变的变化 。
我这么说是一个特别虚 , 我说一个很现实的问题 , 比如说他举个例子说 , 我让今天的 Gemini 3 生成一张刚刚结束的 F1 这一站的颁奖的照片 , 或者说颁奖的比分的比分表 。
你想这个结果 , 它不是说我让你生成一张 F1 车手的排名表那么简单 , 它包含的信息是说 , 我说的是刚刚结束的这一站的比分的情况 。
也就是说 Gemini 要先知道我最近的这一站 F1 是哪一站 , 对吧 , 这是搜索的能力 , 它不是生成图片的能力 。
然后它要知道这一站的结果 , 然后这些结果对应的车手的名字 、 他的头像 、 他的照片 、 他的车队 , 所有这些 knowhow 是要对齐之后来交给图片进行图片生成的 。
它是包含着现实世界通过搜索跟语言模型的整理归纳之后出现的一个完整的事情 。 所以为什么这一轮出现之后, 你会发现各种各样的什么信息图表特别的多 , 然后各种各样用什么哆啦 A 梦的方式解释 Transformer 的架构到底是什么 , 然后做一个什么光合作用的解释书 。
你发现这种命题出现之后, 人类为什么会出现这种命题 , 愿意信任给到一个 AI 生成图片的工具 , 原来是不可能给这种任务的 ,因为我们知道那个模型它可能大概知道你在什么任务 ,但是它不了解这底层核心的那些 knowhow 跟那些常识 。
但是今天因为模型能力的提升之后, 这件事情被抹平了 。 我今天是可以信任它帮我真的做一个什么样的东西 ,并且我知道它那个东西是符合刚才我们说的这一套东西的 。
它就从一个量变状态变成了一个质变状态 , 它就不单纯只是一个炫技的 , 我做一个特别漂亮的什么东西 , 然后你看一下好漂亮结束了 ,不是这样的 。
它变得可用 , 它变得可以被场景所使用 。 似乎这件事情可能跟我们谈论中的所谓 Agent 的概念又有关联 , 它真的可以通过搜索也好 , 通过工具调用也好 , 通过数据抓取也好 , 通过分析整理也好 , 通过推理也好 , 得到一个什么样的东西 , 同时用使用相关合适的工具给你一个什么样的结果 。
似乎这条链就跟我们理想中那个 Agent 的东西不就贴上了吗 ?
对 。
所以这一波关于 Gemini 3 到 Nano Banana 到什么多模态的 , 然后你要想 VEO 3 的最新版还没有发 , 就是视频的模型 , 你可想而知最新版的 VEO 一定非常强 。
如果视频也出来之后, 多模态文本加 Agent 的 Coding 也 OK,Google 也没有落下, 融在一起 , 它就变成一个大一统的什么东西了 。
这种感觉听起来真的很像之前大语言模型刚出来的时候大家那种震撼的感觉 , 它的技术路线当时就颠覆了很多 。
因为我之前也是学 NLP 的 , 自然语言处理在长期以来都是做各个垂类子课题 , 想要通过子课题一个一个研究 , 最后把它们并到一起能够解决一个大的问题 。
但是后来发现你不需要单独的去研究什么词性 、 分词 、 句法 , 你不需要去研究这些东西 , 你只需要大力出奇迹 , 你把所有的东西把算力堆在一块共同去解决 , 你会发现所有子课题是同步在解决的 。
听起来有点 , 当然这么类比不一定合适 ,但现在可能看起来就是我用结合的方法 , 我真的出现了 1+1 大于 2 的这种效果 ,而不是说单纯的是我大语言模型 , 我这是一个语言 , 对吧 , 我在跟多模态结合 , 我多模态在跟另一个能力结合 , 跟画图结合 , 跟视频结合 , 或者跟代码结合 ,并不是这么一个路线 ,而是证明了可能堆在一块效果的确就是很
好 。
对 , 就端到端解决这个问题 , 确实这个的趋势跟我们看到阶段性的展出来的里程碑还是挺让人兴奋的 。
所以我们觉得大模型的进展之前有一些人会担心到了所谓的极限 , 对吧 , 或者边际效应几乎已经没有了 ,但现在看上去还有的搞 。
腾讯这边它也有自己的大模型 , 可能相比来说大家会感觉存在感不如其他的一些模型强 , 庄老师怎么看 ?
首先因为现阶段的大家的媒体的关注的我们叫声音更多还是集中在 , 比如美国就那四家 , 对吧 ,OpenAI、Claude, 然后 Google 跟马斯克 , 对吧 , 中国可能大家或多或少 , 比如可能关心的这两家最头部的开源公司 DeepSeek 跟千问 , 然后后面这些厂商大家关注其实没有那么多 。
某种来说其实字节 、 百度 、 腾讯 ,他们在各个板块的模型的进展在今年也是比较快的 , 甚至再低一级的厂商 , 比如说小米 、B 站 、 小红书 、 微博 , 甚至这个体量的公司其实在模型进展上都在选取适合自身业务的模型上做拓展 。
我们只说比如说腾讯为代表的 , 你像我今天在做 Q3 总结的时候 , 我在讲多模态这个领域在经历从多模态首先语音 、 图片跟视频 , 今天这个实验被打包我们叫 Media, 这个板块里面其实图片跟视频领域腾讯的宏源一直做的都不错 。
然后再往前推演 , 我当时说了一个战场叫 3D, 国内在做 3D 这个战场里 , 宏源的 3D 一直都是最领先的那一个之一 ,而且你要知道 3D 这个场景天生跟游戏是非常近的 。
所以最头部的具厂商在 AI 3D 生成这件事情上的决心是比其他类型厂商更强的 , 所以你会发现宏源 3D 非常强 。
然后这个战场再往前推 , 多模态再往前推一步就变成了世界模型 , 就是 DeepMind 跟李飞飞做的那个东西 。在国内这个战场里 , 宏源在今年我没记错应该是 9 月份发了他们世界模型的第 1.0 版本 ,也在更新迭代 。
如果就像我们前面讲到的语言 、 多模态 、Coding、Agent, 如果最后是一件事情的话 ,在多模态这个细分领域里面的终极变成世界模型的东西 ,在这个事情上的投入跟不犹豫以及跟现有业务的结合上来说 , 腾讯绝对的甚至比世界内任何一个厂商都有超强的耐心做这件事情 。
哪怕这个事情是一个可能比自然语言模型更难在短期内达到所谓 GPT 时刻的这样一个路径的情况下 ,在这个事情上的坚持我觉得腾讯的宏源会做得更深一些 。
所以总结来看 , 我觉得纯语言模型本身的竞争已经过于激烈到它的性价比已经非常不高了 , 双引号非常不高 。
但是在多模态这个战场里 , 从语音到图片到视频到 3D 到世界模型 , 再考虑到腾讯自身的业务 ,在这个战场里宏源有绝对强的资格跟已经有的成绩证明他们一定是主牌桌上的核心的厂商之一 。
对 ,而且做这种模型 , 多模态模型据我的了解不一定特别专业 ,但是它肯定还是比语言模型怎么说 ,在财力上在资源上的支持也是要高不少的 。
这里面可能也是最后变成一个大厂之间的竞争 , 或者说真的有能力能迈过这个门槛去进到竞赛场里去竞争的这种公司并没有特别多 ,但腾讯它肯定是其中一家 ,因为它真的很赚钱 , 它手里的自由现金流也足够高 , 这也是可能很重要的一点 。
它有决心 , 你像有的公司可能也有决心 ,但是它不一定能腾挪这么多资源去做这个事 。
而且甚至某种来说 , 我当然这是猜测 , 某种来说可能腾讯的比如说几位老板们在给他们的宏源部门开会的时候 , 会给他们一个类似的倾向是说我们在多模态这个战场上是要持续保证在第一梯队里的 。在多模态这个战场里 , 我觉得没准是下过这个命令的 , 就是给过这个决心跟要求 ,并且给了足够多的支持跟资源来保证这件事情 。
所以在这个事情上我觉得这个事情还有的打 ,而且某种来说在这件事情上可能中国厂商会比相较于纯语言模型那个战场更有优势跟更有落地的可能性达到更好的位置 。
当然现在 Google 这一轮真的太强了 ,但是这一轮的领先能够持续多久也是个问号 。
对 , 所以听起来这个可能就是大家又对于像 Google 这种大厂更乐观的一个原因吧 。 因为之前的确 OpenAI 刚出来的时候大家都是看空这几个大厂 。
对 , 所以最近说当年 OpenAI 出来的时候大家会说 Google 挂掉了 ,但现在似乎 Google 在革 OpenAI 的命 。 今天 OpenAI 特意临时发了一个红色警戒的邮件 , 说我们真的要把所有的核心精力聚集在 ChatGPT,因为它按照 OpenAI 原来的战略的实施路径来看 ,在 GPT 发布之后, 包括它内部技术跟产品团队分开了 , 产品团队做了很多产品端的尝试 , 包括商业化的尝试 , 广告 , 对吧 , 很多这
些都来了 。 但现在看上去因为技术本身的迭代依然在疯狂的演进过程中, 所以 OpenAI 逼着 SAM 不得不做一个内部的亮红灯的状态 , 就是我们还是要把所有的集中的注意力放在 ChatGPT 以及背后的 GPT 的能力的提升上 。
真的你会觉得 AI 的这场竞争跟战役真的过于的难了 , 我们还是以一个第三方我们站在旁边看的角度 , 我们只看美国这些公司 ,OpenAI 已经在可能 25 年 11 月之前 , 我觉得 SAM 以及核心团队已经几乎解决到了过去几年大家一直诟病的很多的问题 , 比如说它跟微软的各种问题 , 它的组织架构的问题 , 上市的问题 , 融资的问题 , 当然有泡沫我们不讨论 ,
然后人才流动的问题 , 然后是产品公司还是技术公司的问题 , 能不能持续保持领先 。 它在 11 月之前可能已经阶段性的把很多的问题都解决差不多了 , 然后它要按照我之前我写 PPT 的观点是说它已经是既往不恋纵情向前了 , 它把原来的不恋已经搞定了 , 我要疯狂的往前走了 。
结果突然间 Google 的这一轮这个状态 , 你会觉得逼着它告诉它 No, 你原来的事情根本没有解决完 , 原来的战场还有非常大的敌人站起来非常强大 , 然后你想所谓的纵情向前根本不允许你有那个资格跟有那个韧性的资本去做那些看上去双引号正确的事情 。
你又被拉回到了这样一个纯模型竞争本身的战场里 。 所以这个状态我觉得对于当然可能从行业角度来讲是好事情 , 它会让模型的进展可能会再一次的提速跟竞争 , 然后大家有更多更强的信心做这件事情 。
但是纯从比如说从 OpenAI 这家公司自身而言 , 真的太难了 。
是 , 这可以理解 ,因为这真的不像当年移动互联网那种竞争 , 你已经跑马圈地圈好了之后, 大厂拿你也没办法 ,因为完全不是一个领域 , 你的壁垒已经建立起来了 。
对 , 所以从这个角度来讲 , 如果跨回到国内也如此 , 你会发现 AI 相当于过去三年纯我们这一轮 , 我们无论是叫生成式 AI 还是大语言模型还是什么 , 这三年的策马狂奔 , 疯狂的遐想 , 本质上来讲确实勾勒出了一副很多人内心中的蓝图也好 , 发展方式也好 , 趋势也好 。
但是我们为了理想中的山峰攀登的时候 , 你会发现这些攀登者的角色 , 它自身的比如说它的位置 , 它过往的资源的积累跟这件事情的匹配程度 , 然后以及为了攀登这一个新的高峰 , 它储备的资源确实是有差别的 ,而且这种差别看上去在越来越明显 。
有些人他就是很稳的 , 你不会担心他 。 有些人可能已经在爬了半山中掉下去了 , 对吧 ? 有些人可能在疯狂的想拉爆所有人 ,但是发现好像没有那么容易 。
这个状态感觉也出现了 。
对 , 会有一种感觉是当我们看 Gemini 3 Pro 这一波 , 包括庄老师你刚才说的趋势之后, 对应国内你就发现像腾讯这种公司 , 前面我们可能大家感觉它会做得比较慢 , 或者说做得没有大家预期的那么快 ,但是回头再看好像这些大厂依然还是最有优势的 ,而且甚至他们优势的点不光在于有足够多的资源和不管是技术资源还是说财力资源 、 算力资
源 , 还包括场景和用户的这方面的资源 。 这个就像前面我们都在聊到的 , 当 AI 它更多的解决的是你生产效率的问题 , 它不会直接颠覆 , 像前面我们说的一样 , 它不像移动互联网一样 , 你直接颠覆了 , 用户就跑到那去 ,而且不会回来了 , 它不会出现这么一个状况的话 , 那就是你原来圈好的场景下, 你显然还是以前的既有的已经圈好地
的这些供给或者提供服务的这些厂商 , 它会能做得更好 。 我们再回头来看 ,其实对于腾讯系下面的这些各种各样的产品 、 各种各样的场景 ,他们都在慢慢的接入 AI,他们都有能力把 AI 接入的很好 。
所以这个时候你就发现其他的那些创业公司 , 比如说我也做一些生产力工具 , 我也做一些嵌入工作流的这些产品 , 比如说代码也好 , 搜索也好 , 或者说跟内容相关的也好等等的 , 它就是不如直接在微信里做 , 或者在腾讯系的其他产品里做 。
这个就确实现在就是这么一个状况的感觉 。
你像这一波探讨之前 ,OpenAI 不是开了开发者大会吗 ? 然后允许 ChatGPT 的对话框里面直接调用一些第三方的应用 。
那个时候其实就有很多评论会认为 OpenAI 在那个时间点想做当年整个美国移动互联网没有做到 ,但中国移动互联网里微信做到的事情就是 All in one, 所有的东西全部都在里面 , 然后你只需要通过各种各样的方式 , 无论是小程序的方式还是对话框调用的方式去实现你相关功能就好了 。
这件事情其实在美国的互联网年代是没有人做到的 ,Meta 没有做到 ,Google 也没有做到 , 微软更没有做到 。OpenAI 的 ChatGPT 想做这件事情 ,但似乎现在挑战也比较大 ,但在国内这个事情是已经成型的结论 。
所以某种来说从这个角度来讲 , 腾讯是或者说微信 , 我们不说腾讯 , 腾讯因为业务太多 , 它的条件也太多 , 只从微信角度而言 , 可能微信是最不着急真的一步要跨那么大 , 要把那东西做出来的厂商 。
它现在通过比如说我们刚才提到的一些元宝的技术能力放到一些整个微信生态内的小场景里 , 对于比如说用户的体验的提升 、 留存的提升 , 对于 AI 的渗透力的提升可能已经够了 ,而且似乎成本也不会那么高 。
所以从这个角度来讲 , 微信是有资格去双引号韧性的以这样的方式参与这样一场竞争的 ,而且无可厚非 。
我觉得从这个角度来讲 , 从比如说二级市场的角度来看 , 今年上半年开始 , 尤其今年年初因为 DeepSeek 因为算力的投入 , 开标的投入这个事情 ,其实在可能前两个季度每一家科技巨头 , 无论是腾讯 、 阿里 、 百度 , 可能这几家有 AI 跟业务相关比较强的公司 ,他们发财报的时候 , 分析师们都会关注他们比如说资本支出的开标的投入 ,因为美国那边
已经是一个明确的准备竞赛了 。 然后中国有些厂商就选择了这样一条路径 ,但是腾讯似乎虽然在上半年的时候也在靠这个叙事 ,但是你会发现进入下半年之后, 这个叙事没有那么重要 , 或者说腾讯也再次的有资格可以任性的说我可以不靠这个叙事 。
这个叙事是一个基于美国那套体系跟现有的刚才我们说的那些竞争导致的一个现有的趋势 , 然后又因为这几家公司都是在香港和美国上市 , 所以它要让那些分析师听懂 。
可是你会发现进入到下半年之后, 随着各种各样业务的提升 , 无论是自身业务的 AI 的转化效率的提升 , 还是刚才我们聊的所有这些事情 , 你会发现腾讯是有资格跟有任性的资本说我不那么对开标的投入那么一定要说硬上跟放非常大的数字 ,因为没有必要 。
第一 , 首先我有这个钱 , 对吧 ? 我不是说我的现金流出了问题 。 第二 , 现阶段这个状态我觉得它是一个进可攻退可守的选择 ,而不是一个疯狂往前怼 , 然后每个季度拉超预期的往前弄的那个样子 。
所以从这个角度来说 , 它就会吸引一波认可这种进可攻退可守方式的风格的投资人们选择相信它 。
当然市场上总会有激进派跟保守派跟各种各样派系 ,但是腾讯的管理层在这个事情上选择这个策略也确实符合腾讯一直以来的人设 。
如果我们假设腾讯是个人, 或者说我们把 Pony 总类比成那个样子来代表腾讯的话 , 它过往在很多事情上的决策选择战略的实施确实它有这个资格跟有这个任性 , 双引号任性的资本说我在今天我不去靠你们所有人都希望看到重大的资本投入疯狂堆卡堆算力那个样子的趋势 , 我有一套自己的趋势 ,并且这个趋势在我内部体系内已经越来越
看到它是 OK 的 , 那我就没有必要去靠那个了 。
我也有这种感觉 , 整个从现在局势上看 , 真的变化还是非常大 ,因为感觉上好像之前大家会评价说这些大厂之间大家是不是用同样的这种方式在做竞争 , 然后过去的很多东西在 AI 这个领域上可能现在看起来失效了 。
但是目前再看 AI 它的确还是更像基础设施 ,在具体呈现上它会更像 , 我在想它有点像是给比如说老房子换个装修 , 或者说给老的场景重新做一些新的体验的优化 。
至少从目前阶段来看 , 就像庄老师刚才说的 , 可能后面这阶段不一定 , 可能真的会有再往后走有 AI 的操作系统或者 AI 的内特务的一些更多的变化 。
但是就目前来看的确我们看到的还是大家使用上, 你就像最近这些不管是 Chatbot 还是说很多 AI 产品都在积极的去做 PPT,在做文档的处理 ,在做代码等等这种还是很落地很直接的这种生产力方面的一些工作 。
它其实代表的还是说现在大家需要的这些东西 ,AI 能当下帮大家解决的东西还是一些老的东西 。 你很难说 AI 直接创造出来一个新的生产场景 , 大家未来就是在 AI 的工作流里生产了 , 感觉还是不太一样的 。
再反过来说腾讯的这些刚才我们提到的很多过去的数据 , 过去的从公众号到视频号到它各种各样的旗下的这些产品积累下来的这些工作和生活的用户的行为数据 ,其实都是非常怎么说 , 会让人感觉它这种像前面提到海外完全不存在的这么一个数据库 , 它的确就是从现在这个节点来看更有优势的一个地方了 。
没那么慌 , 这个事情你想经历了一波巨大的喧嚣跟探讨跟 FOMO 式的投入 , 对吧 ? 各种各样层级的投入之后,25 年马上结束 ,ChatGPT 发布三年这个时间点 , 每一家头部的这种巨头们都有一定的 , 我们叫怎么讲 , 都有一定的 。
FOMO 情绪 , 对吧 ?
对 , 肯定原来都是有的 ,但是也不会像起初那么的不知所措 ,而且又因为很多事情的融入 、 效率的提升 、ROI 的转化 、 技术的演进迭代 , 包括团队的这件事情的匹配程度乱七八糟 。
它到了一个节点之后, 大家就会有不同的策略选择 ,而且慢慢慢慢就会出现位置的区隔 。 确实很像登山 , 虽然山顶的峰可能看上去只有一个结果 , 可能出发的地方也差不多 , 看上去准备的粮草可能差 ,但是走着走着你就发现就出现区别了 。
对 , 你说起来我记得应该是大半年前 , 当时元宝推的特别猛 , 我跟有腾讯的朋友交流 ,他们还是普遍感觉那个阶段腾讯内部也是很焦虑的 ,因为他们之前包括囤卡 , 包括技术上的积累 , 技术路线会有很强的 FOMO 或者焦虑的情绪 。
我能明显感觉到最近在跟腾讯的朋友交流 , 大家觉得松弛多了 , 尤其是自上而下传递的这种松弛的感觉 , 我们还是能按照之前的方式找到之前的节奏 。
当然也并不是说完全没有焦虑 , 或者说我们这么讲了一通 , 感觉上好像腾讯已经高枕无忧了 ,但整体上会感觉现在从我们前面说的这种场景上 、 产品上, 到现在这么一个大家看到的场景元年的这么一个阶段 , 肯定是会比以前要轻松一些的 。
对 , 然后我会觉得今天这个时间点对于像比如像腾讯 、 阿里 、 中国最大的这些互联网公司而言 ,AI 当然是绝对意义上最重要跟最核心的议题 。
然后纯模型本身的事情 , 哪怕你的业务跟模型的关联性在这个时间点没有那么强的情况下, 跟还是要跟的 , 只不过跟的过程中你还是要越来越清楚你做这件事情的意义到底在短期的目标跟想达到的结果是什么 , 可见的中期是什么 。
当然远期可能没有办法想特别 ,但是中短期你要想清楚就会变成更直接能够落地的东西 。 那些东西的阶段性的正反馈跟阶段性的 ROI 的乱七八糟这些事情是否能够满足你对这件事情的预期 , 变成了今天这个时间点对于这些最头部的科技巨头们内部 , 比如从战略角度而言 ,他们去衡量他们工作能够阶段性实现的一种内心的脉络 ,他们内心
会这么想这件事情 。
从你跟身边这种投资市场的观察而言 , 会觉得未来是这种中小公司 , 这种中小的场景都完全没有机会了吗 ?
大厂与创业47:15
应该也不是 , 对吧 ?
也不是 ,而且投资也分比如是一级还是二级 , 对吧 ? 而且这中间的差异也非常大 。 一级还是很买单应用的场景的初创公司的 ,而且确实有些公司涨得已经非常大 , 哪怕它也遇到了一些挑战 ,但是一级市场依然非常 buy in AI 应用这波的爆发跟可能性 , 无论是在中国还是美国 。
这件事情其实在 25 年会变得更 , 我觉得叫双引号的坚定 。 这种坚定可能是说我们去年其实去年差不多也在说类似的话 ,但是去年说这个话的时候 , 很多投资人是没有那么坚定的 。
逻辑上来讲 , 大家是应该这么干的 , 对吧 ? 因为反正模型本身的投资几乎对于市场来讲已经不太可能是一个主战场了 ,因为能参与的人越来越少 , 门槛越来越高 , 厂商也越来越少了 。
所以我们应该去投下面 。 当然这是个纯逻辑层的推演 ,但是到 25 年之后你会发现 , 随着一些厂商在阶段性拿到一些双引号的正反馈 , 这种正反馈可能是用户层级的 , 可能是收入层级的 , 可能是细分领域的影响力层级 。Anyway, 反正你拿到了一定的正反馈结果之后, 它就会有越来越多人从纯逻辑层认为这件事情到现实世界告诉你确实应该这么干 。
过程中一直上对于 AI 应用层的初创的公司的我们叫关注跟持续的下注 , 这件事情在 25 年甚至比如明年依然会延续 。
二级会另外的变化 , 二级今年整个的二级市场经历了几轮的我们叫主题的轮换 , 对吧 ? 这个词特别大 A, 主题的轮换 , 比如芯片有一轮 , 然后能源有一轮 , 然后最近一轮是存储 。
过程中其实在美国软件那一轮也经历了那几家做偏 2G 的或者 2B 的 AI 软件公司其实也还可以 ,但是确实这个叙事不如刚才我们前面讲的能源 、 芯片跟存储的叙事那么直接 ,因为那个事情在美国太赤裸裸了 。
即便所有人都认为那个事情有过度的投资的风险 ,但是它就是一个大的叙事 , 框在那没有办法你不跟 。
中国其实有类似的情况出现了 。 所以从这个角度来看 , 二级其实对于偏软的这一层 , 尤其偏应用这一层 , 确实也认可跟买单 ,但是在二级市场里面有更大的叙事跟更大的喧嚣的东西存在 。
再说回来 , 我一直好奇 , 比如说当现在投资人, 我们就说一级市场 , 大家在看一些中小公司的时候 , 看这些比较早期的创业团队的时候 , 会再去就像移动互联网那个时候大家会问的问题一样 , 如果说大厂也做了 , 你这个怎么办 ?
大家会有这种问题吗 ? 或者说大家会在意哪些要跟大厂差异化的地方吗 ?
这个话题在现在一级市场里面 , 大厂已经不是一个简单意义上的 , 大厂这个关键词包含的备选项太多了 。
某种程度来说 , 可能 OpenAI 也是放在这里的 ,Google 也是放在这里的 。 因为这一波 AI 的 , 尤其是偏应用层的初创公司所面临的全球化的机遇是一个摆在所有人面前的事情 。
所以某种程度来说 , 这个大厂的疑问不仅仅是中国的大厂 , 它可能也包括美国的大厂 。在这件事上 ,其实今天这一波最新的 AI 的应用层的创始人们 ,其实很多人其实在创业之初就想得比较清楚了 。
有一些就选择说我就贴着做 , 我也不 care。 我觉得这一波关于 Gemini 3 跟 Nano Banana 的探讨尤其明显 , 理论上说这一波模型能力的提升这么剧烈跟这么大 , 按照之前的逻辑来讲 , 它应该吃掉一些东西 ,而且是很明确的吃掉一些东西 。
但是现在看上去来说 , 原来在做相关业务的公司 ,因为这一轮巨大的模型提升跟巨大的喧嚣的 , 比如媒体的声音曝光 , 它得到了边际更多的关注跟增长 。
当然之前有种比喻是说模型常常像海水一样 , 可能会把人吞没 。 有人会说我们在做的是船 , 随着模型海水的水位提升 , 我们在水涨船高 。
但这里面有个度是说你是贴着海绵线在弄 , 还是说真的长出来一段距离保证你安全 。 这个度每家厂商就是不一样 ,但是现实看上去 ,有一些厂商就是可以一次一次的 , 哪怕它是贴在海绵面上 ,但也是贴着随着海绵面在涨 。
当然你说它能涨到多么庞大的一个什么阶段 , 这个没人知道 。 但是问题在于 , 一级市场似乎不需要考虑那么一个终极的答案 。
你说再直白一点 , 你投一家公司几千万美金 , 然后涨到几亿美金 , 再涨到更大一个体量十亿美金以上 , 某种程度来说这个公司它大概率会有个什么样的结果 。
从投资的角度来讲 , 似乎你前面那些讨论跟探讨 , 或者说最终极的答案可能没有那么重要 。 那个答案你考虑太多 , 你就没有办法下注了 。
所以你刚才问那个问题 , 当然大家会问 ,但是这个问题本身来讲其实没有什么 , 没有标准答案 ,也没有绝对意义上的正确答案 。
大家只能走一步看一步去弄 , 谁知道它能经历 。 你很简单 , 你比如说我们认识的朋友 , 原来可能是做语音的 , 然后这一波图片来 ,他把图片功能一加上, 然后卖一个打包会员 ,他这一波哐又涨了不少 。他可能团队也不大 , 对吧 ?
然后你说他功能有多复杂 , 可能也没复杂 ,但是他就是在这种辗转腾挪之间 ,在这种用拼执行力 、 拼创意 、 拼接 、 拼信息差 、 拼乱七八糟拼在一起 , 然后他在阶段性从一个初创公司角来讲 , 我们抛开对他业务本身的评判 , 我们站在稍微离远一步的角度去看这家公司 。他几个月之前可能只有两个人, 现在有十个人, 几个月之前可能一个月只有十万美
金收入 ,他现在一个月有一百万美金收入了 , 对吧 ? 他公司当然在变好 ,他当然能够融到下一轮钱 , 那就行了呗 , 对吧 ?
听起来现在的逻辑好像跟当年的确差别还挺大的 。
对 , 你不能想那么极端 ,因为最极端的彼岸跟远方是没有标准 , 短期内是不可被证伪的 。 你没有办法通过想终极答案回推 , 指导你做投资的决策 。
你只能盯着眼前的事情跟肉眼可见的中短期的事情来去做决策 。
它跟过去 , 比如说我们说 20 年前 、30 年前去想象未来 , 感觉现在的不确定性会更强 。 当然当年也有很强的不确定性 , 你会觉得说未来电商会是什么样 ,但是电商大致是什么样是能想象出来的 。
但现在 AI 它能改造成什么样 , 它能做到什么程度 ,以及多长时间做到什么程度 , 这个可能很多时候也想象不出来 。
未来的格局 、 生态这些想象不出来 。
是啊 , 所以你只能选择相信创始人, 比如他的应变能力 , 对吧 ? 他过往的这些经验 ,以及他现在已经积累的东西 , 这些东西的堆积跟叠加 , 大家都会问护城河是什么 。
可能护城河在今天可能就不是一个一句话能说得清楚的事情了 。 听起来它就没有那么像早年, 我们真的说一个什么样的移动互联网的东西 , 它真的有某一个特别长的长版的类似护城河的东西 。
今天可能确实比较难 , 它今天所谓护城河就变成了一个执行力也好 , 对行业的理解 , 对技术能力更迭的状态的理解 , 然后对商业模式的探索的把握 , 对推广 , 它是一个复杂的 , 甚至包括他自身的品牌 , 甚至包括创始人自己的品牌 , 可能都是加在一起变成了护城河 。
所以听起来也很难把当年的那些标准再用到现在的这些大厂上 ,因为我刚才也在想这个问题 , 比如说我们说之前可能在移动互联网的时候 , 很多再上一代的大厂 , 很多公司 , 包括门户网站 , 当年有很多互联网公司没有跟上 ,但到了现在你会发现 , 刚才我们也聊到大厂它会有自己的壁垒和优势 。
你像甚至可能听起来感觉上微信的优势会比 Google 还要大很多 ,因为它是个 all in one 的产品 , 它是一个巨无霸 , 它这里面能连接用户 , 包括张小龙做的小程序 , 整个的生态感觉就是为 AI 做的准备 , 对吧 ?
未来大家可以直接连接到各种各样的服务 , 它就是一个天然的 agent 的一个入口 。 这个可能是对于微信来说 , 它有非常强大的一个优势 ,但同时也同样存在一些扑朔迷离的地方 , 就像刚才说的未来的发展的方向 , 它的生态到底会长成什么样 , 它又依赖于说微信的团队 , 包括腾讯内部他们的产品经理 ,他们的内部的决策者对 AI 的认知 。
因为 AI 说起来是个很抽象的概念 , 我该怎么用 AI? 你如果贸然的把很多 AI 的东西接入之后, 它不见得是一个好事 , 包括怎么接 , 它应该接入什么样的功能 , 到底 AI 未来是一个更开放的生态 , 还是怎么样的生态 ?
我该怎么利用我的数据 ? 感觉还是个挺复杂的事 , 想想好像真没那么简单 。
而且越拆得细的情况下越复杂 。 你就想 , 我们比如纯从现有的这些已经被定义好边界的产品里 , 再去想 AI 化的拓展的时候 , 浏览器怎么做 , 腾讯会议怎么做 , 输入法怎么做 , 然后可能更复杂的还有一些什么样的软件 , 比如 Q 音乐怎么做 。
现在对于这些腾讯内已经是一个相对成熟 , 无论它是个独立的事业部 , 还是个独立的公司 , 还是一个内部的小 team, 它现有的产品形态已经稳固的情况下的 AI 的增加跟 AI 功能的引入迭代 , 这个事情就已经是一个异常复杂且个性化的选择了 。
这件事情可能就够腾讯干 。 我说再直白一点 , 就是说内部 , 比如说今天我是一个腾讯会议的产品经理 , 我可能都不是腾讯会议的负责人, 我只是腾讯会议的某个功能产品经理 。
我可见的中短期的工作是不太需要纠结跟犹豫的 , 肯定是 AI 化 , 那就是看做什么跟怎么做的问题 ,但我不需要对大方向产生太多的犹豫跟纠结 。
然后同一时间还有新的独立的产品在出现 ,IMA 也好 , 元宝也好 ,他们承担的角色 ,他们的功能迭代 , 当然他们也会 ,他们在战场里的竞争对手们在干嘛 , 然后他们到底想拓展成什么样子 。
我觉得 IMA 是个典型 ,因为我几乎天天用 , 用我的博客的数据库 , 包括在 IMA 上面 , 然后每天跟他们对接比较多 , 然后当然同时你也在用各种各样的文件整理 , 乱七八糟这样的功能 。
然后过程中你就会时不时的你就会带入一种角色 , 如果今天我是 IMA 的产品经理 , 我这件事情做还是不做 , 对吧 ?Notebook 出的这个功能是接 , 还是说我不 care 这件事情 , 然后我现在在排期中的这些功能 , 哪些功能看上去没有那么重要 。
你就可想而知这个工作已经细化到了一种 , 它不需要再去说我们先去描绘一个巨大的大饼 , 一个什么样的故事 , 然后再去怎么样 。
它已经贴到了你的肉身的每天的要做的事情里面了 。 当然它在过程中还需要抉择 , 需要去跟进最新的技术进度 , 跟进最好的竞争对手们在那 ,但是它的状态就不是原来那个样子 。
所以从这个角度来看 , 它可做的事情就已经非常多了 。
对 ,而且说到这个 , 我就总想到我之前经常提的暴论 , 就是 AI 领域真的不存在 AI 产品经理 。 你说 AI 产品经理 , 你当然可以说有一些是需要懂一些 AI 技术 ,AI 算法可以跟程序员比较良好沟通的 , 存在这么一些角色 。
但是我觉得你到最后还是说 , 尤其在大厂里面这些产品经理 , 你最后就像刚才提到的 , 你看现在元宝在微信评论区可以被 @,他这种使用方式 , 可能是微信的产品经理他比较理解自己的场景去做的 , 包括腾讯会议他怎么接入 AI,他显然不是一个什么我对语音特别了解 , 我对语音技术特别了解 , 我特别懂多模态技术 , 多模态的这些算法的一个 AI 产品
AI产品经理58:45
经理来决策的 ,而是腾讯会议的产品经理他怎么理解会议的 。 我们会议的场景下, 我们会议的需求当中, 大家开会的人到底对整个事情有什么需求 ,AI 在这里面有哪些能帮到我 , 哪些帮不到我 ,而不是说我只是接入 AI 效果就好了 。
就像之前应该是我忘了跟谁聊过的 ,有些地方为了应接 AI,有的农村接 AI 之后说让 AI 告诉大家什么时候出门开始施肥 , 什么时候该收割什么的 , 没有农民爱听的 。
因为我是能够直观感知到的 , 凭我自己的经验解决的问题 , 你通过一个更间接的 AI 根本解决不了问题的一个功能 , 大家肯定是不乐意用的 。
所以最后还是落回到说 , 对于产品经理也好 , 对于这些产品的决策者也好 , 最终应该还是要先关注自己的场景 , 自己所面对的这些用户的需求 , 再去看说 AI 能帮我解决什么问题 。
所以最后包括我见过有一些创业者 , 你会发现他们做得很好 ,他们能够很抓用户的留存 , 能够让大家都很喜欢用这个产品 ,其实本质上还是对于这些场景的洞察 ,而不是说对于 AI 的理解有多牛 。
因为说实话 , 大家接的都是差不多的大模型 , 或者说大家使用的方式大差不差 , 技术上真不存在太大的壁垒 。
但是有一些可能对场景理解不是那么好 ,他自己压根就不是这个场景下的用户 ,他做出来的很多产品就只是为了炫技而已 。
我觉得这个感受还挺明显的 , 尤其进入了我们说的 25 年, 进入一个场景竞争的时代之后 。
比如刚才就说微信里 @ 元宝这个功能 , 没准这个功能的产品经理同时要考虑的功能是公众号的评论区要不要加图片跟表情包 。
它的工作是这个 ,AI 只是它的这一系列我们叫横向的细节中的某一项 , 它的考量变成了整体体验层 , 比如说只负责公众号的评论区的这个人 ,他要去考虑评论这件事情对用户的体验的提升 , 到底是我要不要加图 ,是允许自定义的表情包 , 还是官方的表情包 , 要不要加 @,@ 是允许 @ 用户 、@ 作者 , 还是 @AI, 它变成了一个这个层级的选择的事情 。
对 , 所以这件事就一下又变复杂了 , 对吧 ? 它就不是说 。
复杂太多了 。
我们聊腾讯 AI 的战略 , 它就是一件事 , 对吧 ? 就是上面到底是不是重视 AI, 还是怎么样 ,其实变成了落到每一个非常小的地方 , 最后怎么用 。
你可能你像 Q 浏览器这里面也接入了很多 AI,他们在做 agent, 包括刚才提到腾讯会议 , 包括微信 , 包括输入法 , 每个产品在用 AI 它都是用的不一样的 , 它可能用好了整个产品就效果特别好 , 用得不好就可能在市场上就会没有那么大的竞争力 。
它是一个具体情况具体分析 , 你很难说现在腾讯 AI 到底做得好不好 , 它就不是这么一个问题了 。
对 , 太复杂 , 这问题太大了 。
如果畅想一下的话 , 我不知道庄老师会不会去想象再过五年, 五年就可能不好想 , 再过两年, 对吧 ?
未来展望1:02:31
你觉得 AI 生态可能会是变成什么样 ?
两个月都不好想 , 现在这个环境真的是太恐怖了 。 当然了 , 我也在年底的时候很多总结的时候会想 , 人类不可避免的在整数年的结尾的时候会畅想下一个整数年 。
今天正好是 25 年的结尾年底 , 当然自然首先会想到 30 年会什么样 , 更远一点可能会想到 50 年, 因为它四分之一的世纪走完了 , 对吧 ?
但确实 AI 今天这个时间点 , 这个行业的变化确实是按真的是按月的周期在变化在调整 。 虽然之前不是有比喻是说你可以用线性外推的方式把线画出来 ,但是过程中波浪是极度的波折的 ,AI 也是如此 。
当然你可以有一个相对中长期的目标和远期的可看到 , 肉眼可见的就是主桌上这几个角色 , 对吧 ?
语言 、 多模态 、coding、agent, 这件事情肯定是往前推 , 推到一个什么节点 , 没准到了我们叫 L4 阶段 ,L4 似乎就变成了某种意义上的里程碑 。
到了 L4, 似乎很多今天这时间面临的症结跟一些很大的问题就会被彻底释放 。 那个时候当然可能会需要更大的投入跟基础设施 , 反而没有到那个时间点 , 腾讯这种厂商也会疯狂的加注 ,也是有可能的 。
但是现实可见那个事情它是一个 , 它是五年, 它是十年, 甚至永远达不到 , 我们不知道 , 对吧 ? 在过程中肉眼可见的我们叫眼前的苟且 , 就是现在看上去的双引号的苟且 。
我觉得苟且不是一个贬义词 , 苟且是个中性词 , 对现有业务的稳定的提升 , 然后跟随模型的头部的技术能力的跟随策略 , 然后尝试或者在创新业务上找寻可能的新 AI 的范式 。
这个框我觉得是一个基本上不太会出错的框 , 就框在了这里 。 对于头部厂商而言 , 似乎都是以这样的方式在面对这件事情 。
当然你的体系内因为过去几年的发展 , 可能有一些业务或者有一些板块已经长得看上去比较的茂密了 , 你就在这个已经长出来比较茂密的东西上再去加注 , 再去把它扶持 , 再去让它变得更丰满 , 再去找可能性 。
似乎它就是这样一个滚的状态里 。
总的来说 , 我们就目前的趋势来看 , 当下大家对 AI 的理解或者 AI 发展到现阶段 , 又会让大家对腾讯的看法产生了一些变化 。
但是再往后在这个不断变化 、 波谲云诡的 AI 时代到底会怎么样 , 大家还是得继续持续观察 。
而且某种程度来说 , 我觉得腾讯自己也是一个 ,不要忘了腾讯也是一家投资很强的公司 , 对吧 ? 它把该埋的点也早都埋完了 。
这倒是 。
大家在找可能性 , 它有可能有 10 个 20 个的可能 , 对吧 ? 或者种子 , 它可能已经提前 , 对吧 ? 对于这些公司而言 , 钱已经不是什么太大的问题 , 对吧 ?
这种钱无论是放在资本投入上, 还是放在投资侧 , 还是留在那杵着 , 都不是什么问题 。 它就又有一次任性的资格是说 , 我就先都不好 , 我们就都往前走着 , 哪一个阶段或者哪一个什么东西长到一个什么状态 , 我再给它弄回来 。
这个事情对于腾讯而言也太过熟悉了 , 对吧 ? 历史上也不仅仅是在技术侧 ,在游戏 ,在广告 ,在社交 , 它都出现过 , 对吧 ?
所以它是一个 , 我还是觉得今天这个时间点 , 大家去评判一家公司跟去谈业务 , 很容易把一个无论是中国还是美国巨头想象成一个样子 , 它就是一个人或者一个人棍或者一个什么样 。
但现在问题在于 , 今天这个时间点 , 世界上这些最大的这些公司 , 本身它已经极度复杂 , 它是一个异常复杂的体系系统 , 无论是在业务层 ,在架构层 ,在组织层 ,在投资侧 ,在可能性上, 它稳定或者说它这种复杂系统往前走的时候 , 就不太可能是一个纯线性跟单维度可被推演 , 它有太多的可能性跟意外情况 。
我觉得某种程度上这一轮 Google 也是如此 , 为什么今年大家说 Google 再次伟大 ,Make Google Great Again, 它 DeepMind 的这一轮在过程中到底发挥什么样的作用 , 还是说 DeepMind 内部组织结构调整在某个时间点起的作用 , 还是说创始人回来让大家 996 起的作用 , 还是说他收购了 Chaos.ai 那个核心负责人起了什么作用 , 你会发现所有可能都是原因 ,但是所有这些可能也都不是唯一的原
因 。 它就是一个复杂系统生态在某一些时间点做了尽可能双引号正确的决定之后, 堆积的某一个状态在特定时间点产现了阶段性结果 。
反而也不是说 Google 就一定策马平框 , 马上就赢 ,也不是 。 它可能这一段时间对它的正向的这种评价跟阶段性 , 我们认为所谓的巨头在这个阶段是有更强的优势的可能性的 , 这个评论本身或者这个结论本身 , 它的有效性的时长可能也是个问号 , 可能没准比如明年又因为什么样的原因 , 又出现新的挑战跟新的可能性 , 然后更多的初创公司有
了更多的优势 ,也有可能 。
对 , 所以这就是我感觉也挺有意思的一个时间阶段 ,因为好像从疫情前后大家已经觉得说互联网好像信息时代基本上就到这个阶段了 ,但现在再看 23 年、24 年之后, 就一直隔一段时间都会有一些新的这种冲击 ,也挺有意思的 。
而且它跟这种大厂的关系 , 跟我们现在日常都在使用的这些产品的关系 ,也依然很大 。 所以就很难想象 , 比如说就像刚才提到的两年之后, 我们现在在用微信的这种状态和感觉是不是还一样 , 可能还真不好说了 。
是啊 , 谁能知道 , 没人知道 。
今天我们就简单先聊在这儿 , 我相信可能中间有很多观点 , 尤其庄老师的观点可能会对大家还是有一些启发的 。
希望大家能听完之后, 如果能对手头自己关于 AI 的一些工作和生活上带来一些变化 , 那就最好了 。 好 , 我们今天就聊到这儿 , 感谢庄老师 , 我们下期再见 。
感谢 。





