屠龙屠龙之术2025年6月16日· 52:20

Vol.64 40页PPT记录2025年中AI行业共识

庄明浩在2025年中solo中,用40页PPT梳理了当前AI行业的三大共识:技术层面推理模型标配化、Agent成为2025年主题、开源生态崛起;产品层面强调“看见”交互、邀请码之乱和版本号重新定义;资本层面则呈现ARR高速增长、并购大年以及基础设施层的机会。他指出,从OpenAI到DeepSeek,从Cursor到夸克,各厂商在模型竞赛、Agent产品化和资本加速中形成新的安迪-比尔定律。

  1. 0:00开场
  2. 1:45推理模型
  3. 8:21Agent之年
  4. 28:09开源生态
  5. 30:40产品交互
  6. 35:56运营策略
  7. 39:41交付结果
  8. 43:28资本加速
  9. 45:55并购大年
  10. 49:04Infra机会
  11. 50:19总结

转录文稿

开场0:00

庄明浩0:08

好 , 感谢 , 感谢大家 。 大家看到现在的这个标题 ,其实是一个非常非常简单的标题 , 叫 " 年终的 AI 共识 "。

因为整个 AI 行业过去两年半的时间 ,其实发展非常非常的快速 。 我每年做这个整理的时候 , 现在回头去看 , 我 24 年底做的整理 , 感觉像上个时代的东西一样 , 很多东西都已经过时了 。

所以我只能截止到 , 比如说我做这个内容的前一天到两天作为这个时间点 。其实今天这个内容是我在直播之前刚刚做完的 , 直播的时候还在改这个 PPT。

所以我起了个标题 , 是一个截止到 2005 年 6 月 , 大概年终这个行业正在发生的一些共识 。 那当然这个阶段性的共识就会有个问题 , 就是如果我们有穿越的能力的话 , 我们穿越到几年之后回头来看 , 可能现在这个时间点形成的所谓的行业共识是错误的 。

但是在当下这个时间点的截面数据来讲 , 我只能说无论它对还是错 , 所有人在这个时间点似乎都已经开始接受了这些共识 。

然后我们正式开始内容 。其实今天的内容其实是比较简单的 , 或者说它的结构是非常非常清楚的 。

它跟我录制的这个 AI 的这个课程的内容的结构是一模一样的 。 我当时是录了四节课 , 一节是讲技术 , 一节讲产品 , 一节讲资本 , 然后第四节其实是讲未来可能半年左右的展望跟趋势的 。

那今天我内容其实还是这三个主题关键词 : 技术 、 产品 、 资本 。 然后每一个主题关键词可能又分了可能三个小的节 , 然后这三个小节的标题我也放在这个阿甘娜的页面上 。

我们一章一章开始 , 技术 、 产品 、 资本 , 我们先从技术开始 。 似乎今年有一个不需要去商讨的结论 , 就是关于 Agent, 就是所谓的智能体的这一年 。

推理模型1:45

庄明浩1:59

所以今年的技术的探讨 , 中间的中心肯定是 Agent。 但是 Agent 之前 , 可能我在上一期之前的课程也有讲过 ,Agent 之前是 L2, 叫推理模型 。

那推理模型的发展也很重要 。 然后可能进入到今年之后, 也是因为推理模型的发展 , 尤其是以中国的 Deepseek 为代表 , 包括阿里的通义千问 , 开源的生态也长得很丰满 。

然后所以我们今天的技术围绕推理 Agent 跟开源展开 。 我们一个个看 , 先看推理 。 左边这张图其实是我在我的课题 , 就是正式的课程当中的一页 。

它讲的是 OpenAI 定义的 L1 到 L5 的 AI 的发展趋势 。 它认为从 L1 到 L5 是类似智能驾驶的一个发展趋势 。L1 这个阶段是我们已经用得非常熟悉的 , 叫聊天机器人, 这个 Chatbot 这个形态 。

那 L2 是推理者 , 就是推理模型 。 我们大家用 Deepseek 也好 , 今天用的 Dolbo 也好 , 它会给你展现一个非常非常长的推理的过程 , 这个叫推理者 。

那 L3 可能就是 25 年之后大家业界讨论比较多的 , 叫智能体也好 ,Agent 也好 , 代理也好 。 那从时间维度来看 ,在 25 年这个时间点 , 我们似乎正在从 L2 往 L3 走 。

但是这里面出了一个问题 , 就是 L2 推理模型 , 我们今天熟悉的所有的大型厂商 , 无论是美国的 OpenAI、Anthropic、XAI 还是 Google 还是 Meta, 还是中国的 , 比如说 Kimi、 豆包 、 智谱 , 然后 Deepseek、 阿里的通义 , 这些模型本身来讲 , 推理模型也是标配 。

可是然后呢 , 我的第一个观点是说 , 标配并不代表着结束 。 因为整个的递进过程不是一个取代的过程 , 它是一个整体往上的过程 。

所以我们回头来看 25 年上半年的发展 , 整个 L2 的推理模型能力其实还在往上提升 , 甚至再往前推一步 。

因为如果听过我的之前的课程来讲 , 我们是怎么得到推理模型 , 我们是通过一个基础的模型 , 通过强化学习的方式得到了推理模型 。

那推理模型再往前之前的基础模型 ,Base Model 的能力其实在 25 年也依然还在提升 。 那似乎看上去 ,在整个的 AI 大模型 22 年底 ,XGB 发布到今天 , 这个技术持续进展 , 智能逐渐提升的这样一个主线 , 最最最核心的主线 , 似乎在 25 年依然在延续 。

那这件事情其实是所有今天这个时间点头部大模型公司在坚持最重的核心的研发的所在 , 就是智能本身依然是这个行业的最主线的东西 。

然后出现了一个小小的分支 , 或者说小小的一个场景 ,在 Agent 这个板块 , 我们叫它 Agent, 或者叫它代理 , 或者叫它智能体 , 它主要干活 。

那它能干的活当中, 似乎看上去编程 , 就是 Coding 这个事情 ,是双引号最简单的 , 对吧 ? 因为本质上来讲 ,Coding 是一个线上的虚拟的世界 , 它有严格的逻辑的标准 。

因为 Coding 本身是要符合一些逻辑的框架跟标准的 , 对于计算机而言 , 去理解 Coding, 理解代码是更容易的 。

所以 AI Coding, 就 AI 编程 , 似乎成为了今天这个时间点所有头部的 AI 模型厂商都在兵家必争之地 , 对吧 ?

所有的公司都在做 AI Coding。 所以这是第一 , 关于推理模型 。 然后刚才我们讲过 , 从我们推理模型之前是 Base Model, 就是非推理模型 , 我们当年用 GPT-3.5, 最早年的 Kimi 的模型 , 豆包的模型 , 通义的模型 ,其实都叫非推理模型 , 就是 Base Model 基础模型 。

然后我们现在在用 DeepSeek R1、Gemini 的 205 Pro、O4, 就是这个 GPT 的 O 系列 , 这些其实都叫推理模型 。 可是对于头部厂商而言 , 头部厂商而言 , 基础模型跟推理模型两边的技术研发的进展都非常的快 ,而且都抓得很紧 。

所以基本上都属于两手抓 、 两手都要硬的这个状态 。 那为什么会是这样 , 后面会讲到 。 那看美国的情况 , 基本上今天这个时间点 ,在美国的 AI 大模型这个板块 ,其实主要的厂商大概四到五家 。

最前面的是 , 当然是这个行业现在这个过去两年多引领行业发展的 OpenAI。 然后第二名可能是它最大的竞争对手之一 , 初创的 Anthropic。Anthropic 是 Claude 那个模型 , 它的核心团队其实原来也来自 OpenAI。

那在大公司里面 , 可能 Google 刚刚开完 Google 今年的 I/O 大会 , 你看 Google 的整个的 Gemini 系列的模型的这个能力提升得非常非常快 。

然后再有一家初创公司 , 就是前推特跟特斯拉的老板马斯克做的 XAI。 然后可能还有一家 , 就是 Meta 做的开源模型 Llama。

所以在整个美国市场 , 大概就是这几家公司频繁的更新自己的模型 , 提升模型的能力 , 业界往上发展 。

今天你发布最新的模型 , 你就是世界上最领先的模型 。 明天它发布这个模型 , 可能它就是世界上最领先的模型 。

不断的这样一个循环反复 ,在美国过去一段时间的 , 然后业界基本上是符合这个逻辑的 。 最开始 , 今年的话 , 最开始可能先发的是这个 Gemini, 然后发到 4, 然后前两天 OpenAI 发了 O3 Pro。

所以你看这个轮转的圈 , 大概就是这样一个位置 。 谁家发了最新的模型 , 谁就站在了那个最前面的位置上 。

所以在美国这边大概是这样一个情况 。 然后中美对抗其实是另外一个整个 AI 行业发展的主线 。其实在 22 年底 ,XGB 刚刚发的时候 , 业界会认为中国的模型厂商距离美国同盟厂商的差距可能在一年到一年半左右的时间 。

那经过了两年多发展 , 我们其实已经追得非常非常快了 。DeepSeek 跟 21,DeepSeek 21, 千问 3, 最近发豆包的 1.6,其实在任何搒单上的评分都跟世界上最优秀的美国的模型相差无几 。

所以如果看 AI 这个行业的竞争的话 , 基本还是围绕中美两国之间的核心厂商的模型能力的提升来展开的 。

那这件事情可能也会成为未来一段时间这个行业发展的一个主线 , 就是中美之间的对抗 。 然后再一个就是我们看前面讲的这几页 ,是关于第一个小标题 , 就是关于推理模型的 。

那第二个小标题叫 Agent, 对吧 ? 这个关键词应该在过去一段时间大家已经听过无数遍了 。 似乎没有争议的是 2025 年就是 Agent。

Agent之年8:21

庄明浩8:31

似乎这件事情不需要等到年底再做定义了 , 到今天已经可以这样定义了 。 虽然今年才刚刚过去五个多月 , 还没有六个月 。

你会在各种各样的地方看到 Agent 的广告 ,Agent 的公司融资 , 各种各样 Agent 的产品发布 , 各种各样的地方 。 所以会有类似这样 Agent everywhere 的梗图 。

然后左边这张图其实是这个 OpenAI 的一位核心的技术开发人员在推特上发布的这一段话 , 就是 25 年是 Agent。

这个看上去已经没有任何的悬念 , 对吧 ? 年初的时候大家可能还会有一些别的关键词跟别的探讨 ,但是到了 25 年 6 月份这个时间点 , 我觉得 25 年这个结论似乎已经可以下了 。

那 Agent,Agent 发生了什么 , 或者说出现了一些问题 。 第一个问题是 , 我们到底该如何衡量 Agent 的能力 。 就是大家都说 , 如果听过我的那个课程的话 , 我会讲 Agent 再从语言到行为 , 它要跟人类合作 , 甚至帮人类解决一些问题 。

那怎么去衡量一个 Agent 它的能力的提升 , 或者它能力的范围 。 那业界最近有一段提法是说 , 我们去衡量这个 Agent 能执行一个多长的任务 。

多长的任务 , 时间的长度是一个可衡量的标准 。 原来可能只能做一个几分钟的 , 现在可能做十几分钟 、 二十几分钟 , 甚至更长 。

极限的可能甚至做几个小时, 再往上推 , 它可以再做可能甚至几天的这样一个任务 。 那从业界的统计来看 ,2019 年到 2025 年, 这过去的可能六年左右时间 , 这个衡量的指标上,AI 模型的进展是每七个月就要翻倍的 。

每七个月就要翻倍 , 就一年将近翻两番 。 你要知道它是指数级的增长 , 所以曲线会拉得特别特别特别的快 。

对 , 然后如果我们再更细化来一点讲 , 就是我们把 24 年 9 月份 OpenAI 发布 O 系列模型定义成推理模型开始 , 那 AI 行业进入推理模型之后, 你会发现 AI 执行任务的长度在急速的增加 。

刚才我们把 2019 年那个时间点拉过来 , 到 2025 年是每七个月增大一倍 。 那如果我们只看过去的这一年半左右时间 , 就 2024 年到 2025 年这个时间点的话 , 这个数字被减少到四个月增长一倍 。

所以就是它那个曲线如果拉出来 , 它会更高更快 。 那如果再往前推的话 , 随着模型能力的提升 , 一个 Agent 它执行任务的时长 , 比如超过几个小时, 肉眼可见应该很快就看得到 。

那这个增长其实确实非常非常像传统 IT 行业 , 如果大家是 IT 从业者 , 应该非常知道一个定律 , 叫摩尔定律 , 就是每 18 个月 , 芯片的那个算力跟那个什么会提升一倍 。

那提到摩尔定律就不能不 , 就是我们就会有另外一个定律 , 叫比尔定律 , 就是安迪比尔定律 。

当时会说这个安迪比尔定律 , 就是 Andy gives Bill takes away。Bill 就是比尔盖茨嘛 , 就是安迪就是英特尔的 CEO 嘛 。

当时这个概念是这样的 , 就是说安迪就是英特尔每 18 个月会把这个芯片的能力提升一倍 ,但是比尔盖茨的微软会他的做的这种各种应用程序 , 会把这一倍的能力也吃掉 。

就是它是软硬件相辅相成 , 把这个行业拉起来了嘛 。 它是一个相辅相成的过程 , 相成的过程 。

如果你比如说你的硬件能力 18 月提升了一倍 ,但你的软件消耗方面提升一倍 , 那似乎硬件的这个更新会变慢 。

但从结果来看 , 就是基本上你硬件更新多快 , 它就会多大 , 或者多需要消耗快跟这个更强能力的硬件的软件出现了 。

就跟今天 , 就跟今天我们用手机一样 , 似乎大家会认为手机的性能的提升 , 无论怎么提升 , 用一段时间手机还是会卡 , 对吧 ?

就是你性能提升的同时, 软件的消耗的能力也在提升嘛 , 对吧 ? 它是一个叫安迪比尔定律 , 就是它在摩尔定律之上产生的定律 。

那今天来看 , 似乎 AI 行业也有类似的定律 , 就是你的算力的提升 ,Token 的消耗的提升 , 倍数的提升 , 然后成本的下降 ,但同时消耗这个算力的东西变得越来越多 。

你看这左边是我们看 GPT-4 的这个能力 , 这已经涨了 100 倍 ,但成本已经降了 10 倍了 。 然后呢 , 成本已经降了 100 倍了 , 对吧 ?

它有更小的模型出现了 ,有软件的更新的路由的方式 , 节约了效率 , 硬件本身的效率也提升了 。其实它的成本已经降了 100 倍 , 对吧 ?

但是这边呢 , 比如说我们研究的模型越来越大 , 参数量级可能是以 10 倍 、100 倍在膨胀 , 对吧 ? 然后原来的简单的模型 , 你就想你的 , 我们用模型的这个 , 或者用各种各样的这个 Chatbot 的体验 , 最早我问它一个问题 , 它叨叨叨叨 , 它就马上给我回过来了 , 对吧 ?

它的思考时间可能两秒钟 , 对吧 ? 然后它叨叨叨给你打出来字 , 用五秒钟打完了 。 打出来字也不多 , 对吧 ?

然后现在有了推理模型 , 你输一个问题 , 首先它要推理这么长 , 对吧 ? 它要用一段时间 , 可能 30 秒 , 它得思考一下这么长的内容 , 然后它再给你打出来更长一堆内容 。

你就算这些内容的长度 , 跟它思考跟打出来这个时间的长度的跨度 , 可能是比基础模型又提升了 5 到 10 倍 , 对吧 ?

然后现在又有 Agent 了 , 它要执行任务了 。 刚才说过它可能要干一天 , 对吧 ? 它要干几个小时, 那你相对于之前的这个几秒钟 , 它又是一个量级上的层级 , 对吧 ?

虽然这边 Token 的这个价格已经降了两个量级 , 那这边可能拉过来三个量级 。 所以就无论怎么降 , 这个行业还是在往上的 。

就如果反过来讲 , 如果今天比如说 25 年没有 Agent,也没有推理模型 , 我们还是用原来的那个 Base Model 的那个商业形态的话 , 那今天似乎这个 Token 的成本已经可以忽略不计了 ,因为它消耗的 Token 就是没有那么多嘛 。

但是问题就在于 ,因为软的这边在往前走 , 所以你那边无论升级多少 , 或者是降多少的成本 , 这边也会帮你吃掉 。

它跟之前的安迪比尔定律很像 , 非常非常像 。 然后那上一个问题是讲这个 Agent 的这个我们叫任务时长 , 或者说它消耗的这个 Token 的这个事情 。

那更麻烦的是这样一个问题 , 就是 OpenAI 的一个研究员今天大概上个月发了一篇文章 ,是讲 AI 行业进入这一步 ,AI 行业进入所谓的下半场 。他有一张图 , 就是左边这张黑色的图 。

这张图是什么 ? 就是各个 AI 模型去打各种各样的测试搒的得分的上升的情况 。 你明显看到就是之前的一些老搒 , 对吧 ?

比如说黄色的这个 , 或者粉色这种 , 它原来可能 2021 年就有 , 然后大家模型不断提升能力 ,不断接近 100 分的这个满分 , 对吧 ?

然后同时还会有一些新的搒单 , 可能是 2024 年才出现的 。 但是大模型也迅速会把这个搒单的 100 分打 , 或者接近 100 分 , 对 , 或者接近 100 分就马上跟上去了 。

所以那现在一个很现实的问题在于 , 现在的大模型的能力已经 , 比如说你去拿人类的什么法律考试 , 什么高考 , 对吧 ?

最近高考也有很多人拿高考题去测模型嘛 , 去拿什么一个会计师的问题去考这个模型本身 , 似乎已经考不出来什么了 。

就如果这个模型答任何题都是 100 分 , 那它现在已经 100 分了 , 那再提高我们怎么去测呢 ? 就我们怎么知道它变得更厉害了呢 ?

对吧 ? 似乎如何评价 Agent 本身的能力的提升 ,也变成一种问题了 , 对吧 ? 所以你看业界最近讨论非常多 , 叫 Benchmark 的设计 , 就是怎么来出题 , 都变难了 。

就是我没有办法去验证这个模型变得厉害了 , 那我怎么去做后面的评估 , 怎么去演绎 , 怎么去做再后一步的改进跟提升它的能力呢 ?

我都没办法知道它能力是多少 , 我怎么提升呢 ? 对吧 ? 所以似乎 Agent 的评价也出现了问题 。 就倒逼 , 这很有意思 。

我也是最近一段时间出的一个新闻 ,是在我们录制上之前的这个节目之后出的新闻 , 就是这个红杉中国是这个风险投资基金 , 我们这帮做投资的 , 对吧 ?

我们做投资的 , 逼着投资人跳下来做了一个 Benchmark, 叫 xbench, 就是红杉中国内部是有一些技术人员的 ,他们做了一套题来给 AI, 然后通过测试这套题来评判 AI 的能力 。

连投资人都要跳下来来做问卷 , 你可以研究要做考题 ,因为大家真的没有办法去这个这个这个叫什么 , 这个这个去了解模型的能力的 。

所以逼着大家自己搞一套题来去考这个这个模型的能力 。 所以你会发现关于 Agent 的问题非常非常多 , 就逼着大家去解决这些问题 。

然后这个这个再看一些更有或者更科技与狠活的一点 , 就是

我在我的课程当中去讲过 ,在技术这一章讲过 , 我们是怎么从上一代的 AI 走到了今天的这个 ChatGPT 通用大模型 , 然后又怎么从这个 ChatGPT 那个年代的基础模型走到了推理模型 , 然后我们现在正在往所谓的 Agent 走 , 对吧 ?

就是这一路走来 , 我们是用了一些科技与狠活的 , 对吧 ? 这些科技狠活包括哪些 ? 第一 , 首先是预训练 , 就是最早我们给模型本身喂非常非常多的数据 , 喂这个世界上所有的书籍信息 , 互联网上各种各样的信息 , 各种各样的预训练 , 就相当于预先被它训练一次 。

但是在 24 年 9 月 ,也就在去年 9 月份的时候 , 这个大家会说就 Skyline Law 失效 。 就什么意思 ? 就是喂再多的数据 , 看上去也没有太多意义 , 甚至出现了一个问题是说 , 世界上似乎已经没有太多的数据可以再喂给大模型了 。

今天头大模型的参数已经非常大了 , 它似乎什么都知道 , 我们能够有的现存的各种各样的知道的 , 它都知道 , 对吧 ?

那边际效应一定是递减的嘛 。 那么到了现在这个时间点 ,25 年 6 月过了大概三个季度 , 这个结论还对吗 ?

你会发现刚才我们讲过 ,其实基础模型的能力还在提升 , 那它靠的是什么呢 ? 出现了一种现在不能说是共识 , 说的是这种常识 。

那如果我们人类历史上已经存在的东西 , 没有办法给它提升效率 , 那模型本身产生的这些信息 ,是否可以让它再喂进去呢 ?

叫合成数据的意义是否有呢 ? 就跟当年我们回想 AlphaGo 一样 ,AlphaGo 是通过人类的棋谱学会的下棋 , 它把人类所有的棋谱的可能性全部学完了 。

但是 AlphaGo 后面的版本叫 AlphaGo Zero,AlphaGo Zero 是没有依靠任何人类的棋谱 , 它相当于自己在画它的棋谱 。 那它就是所谓的双引号的人类原来不存在的数据 , 对吗 ?

它是哪来的 ? 是它模型自己产生的 , 它自己习得的 , 对 , 它自己弄出来的 。 那今天大模型也一样 , 大模型会产生各种各样的数据 , 它会写文章 , 写信息 , 产生图片 、 视频 , 对很多东西的理解 , 它也有它的信息产出 。

我们把这东西统称叫合成数据 。 那如果我们把生产出来的合成数据返回再喂给大模型 ,是否会对大模型的能力产生提升呢 ?

如果能的话 , 那是不是就像我们那个金庸小说里讲的一个武功 , 叫踢云纵一样 , 就是你左脚踩右脚 , 再踩左脚就上去 , 就飞上去了 , 对吗 ?

就一直往上, 就那它不就一直往上了吗 ? 这是预训练 , 对吧 ? 然后后训练是什么 ? 就是在 24 年 9 月份的时候 , 这个大家会说数据没法弄了 , 就提前的这个训练不解决问题 。

那我们往后走嘛 , 就是把它弄出来之后, 我们再从后面它的结果来训练 , 对吧 ? 因为所以那个时候大家会说 ,在 R2 推理模型年代的时候 , 后训练变得重要了 。

那么这个时间点 , 后训练还重要吗 ? 那前面我们讲过 R2, 就是 L2 的推理模型其实还在往前走 , 那它通过了什么方式来往前走的呢 ?

就是最后一关的词叫强化学习 。 什么叫强化学习 ? 其实我在我的课程里讲过 , 本来讲你可以就给大模型做题 , 我把你弄出来 , 通过喂数据 , 然后你看上去无中能 , 然后我让你做题 , 你做对的题我就给你激励 , 你做错题我给你打叉 , 然后你不断做题 , 你不就越来越厉害了吗 ?

强化学习 , 对吧 ? 但是你一听这个逻辑 , 那似乎 。 这个正确与否的评判 , 我们叫这个激励系统 。

那听起来似乎有一些类型的题是比较容易去评判对错的 。 典型的 , 比如说数学 , 比如说编程 。

它有标准答案 。 对 , 所以为什么从推理模型出来之后, 整个大模型领域 、AI 领域的 coding 的能力 , 包括推理的物理 、 化学这种能力提升特别快 。

因为你有一套严格意义上标准的答案库 , 对吧 ? 对就是对 , 错就是错 。 一个代码写出来 , 它能运行就是能运行 , 它不能运行就是不能运行 。

所以它的激励系统是非常简单去构建的 。 可是你要想 ,有太多的问题的所谓的双引号的激励是很难贡献的 。

就是你比如你让它写一篇文章 , 什么是好 , 什么是不好 , 哪个词 , 什么样的风格 , 对吧 ? 那这种东西怎么评判呢 ?

那初期也有人, 比如说这两天后面也会讲到那个 Facebook 和 Meta,148 亿美金投了那个 skyl.ai, 那个公司就做数据标注的 。

那早年的数据标注是标那个 , 比如说自动驾驶那个返回的画面 , 这个地方是个树 , 这个地方是个车 , 这个地方是人, 原来是做这个 , 对吧 ?

那个原来是可以通过民工来做的 。 那新的数据标注是什么 ? 它得找博士来给一个 , 比如法律的博士 、 物理的博士 、 金融的博士 、 医学的博士 , 来给大模型打出的题来做判分 。

因为只有博士 , 至少是博士才能评判 , 对吧 ? 因为那个模型的能力已经到了 。 这是标注 。 可是这样还不够啊 , 你要想有太多的问题 , 可能人类连博士都没有 , 或者博士也不知道该怎么打分 。

那怎么办呢 ? 在这个领域又出现另外一种这个趋势 , 我们能不能让大模型自己来打 ? 用另外一个模型来做它的判官 , 来做它的判官 , 然后呢 , 让这种评判去再去刺激那个原来的模型的好或者不好 , 对吧 ?

那你听过这个事情 , 你发现又是一次踢云纵了 , 对吗 ? 就是你是在用一个模型的能力去评判一个模型做题的对错 。

它又左脚踩右脚了一次 , 对吗 ? 就是你要知道所有的事 , 就是像我们网上很多人让这个豆包和那个 TK, 对那个 ChatGPT 吵架 , 辩论 ,是这样的 。

辩论 , 对 ,是啊 , 就是这样的 。 所以它就是你要知道 ,但凡一些事情形成类似这种踢云纵的效果 , 它就会一直往上走了 。

所以我们看到这些科技与狠活在 25 年出现了很多变化 。 那我们再看个更现实的例子 , 刚才这一套讲法特别的空对空 , 对吧 ?

我们没有任何的案例跟任何的这个 , 都是描述 , 都是特征的描述 , 对吧 ? 那我们讲个例子 , 比如说大家知道这个 Deepseek 的故事 ,其实我的这个之前 PPT 也有讲过 , 这个 Deepseek 其实在出圈是 Deepseek R1, 就中间那个绿色的 ,是在今年春节的时候出圈的 。

那 Deepseek R1 是怎么来的呢 ? 是通过 Deepseek 原来有个基础模型叫 V3, 我刚才前面也讲过基础模型 Base Model,R1 是推理模型嘛 。

它是在 V3 的基础上, 通过刚才我们讲的强化学习 , 就是你给它做题 , 做对了我就给你激励 , 做错了我给你惩罚 ,不断做题产生出来的 。

但这个产生过程中出现一个中间态 , 就那个深绿色叫 Deepseek R1 Zero, 那个是纯靠 V3 的基础模型硬化强化学习来的 。

但是大家发现 R1 Zero 有一些瑕疵 , 然后我们再用一些手段 , 后训练的方式做出来的 R1,R1 给大家用了 。 然后呢 ,在 28 号 , 就上个月 28 号 , 这个 R1 发了一个新的版本 , 叫 R1 0528, 这个版本的能力距离之前的 R1 又有了非常大的提升 , 尤其在数学跟 coding 上 。

那一听这两个关系 , 大家知道前面讲过 , 它是通过强化学习来的 , 对吧 ? 那反过来讲 , 它在其他领域提升也有 ,但是没有那么明显 ,但是也有 。

那它这些能力的提升是靠什么的呢 ? 就是刚才我们讲 , 它是通过另外一个模型来给它打分 , 就是通过模型来做激励模型 , 就踢云纵 , 对吧 ?

然后你要知道 , 现在的这个版本的 R1 0528, 它前面是 R1, 它再前面是 R1 Zero, 再前面是 V3, 所有的起源是 V3, 对吧 ?

可是 V3 的基础模型马上要发新的版本 , 叫 V4,V4 一定比 V3 厉害 。 那 V4 再走这样一条路 , 产生的 R2 应该厉害到什么程度呢 ?

所以业界为什么在最近的时间特别期待 R2 的推出呢 ? 因为从逻辑上来讲 ,R2 应该非常厉害 。 是的 。

因为对吧 , 今天的 R1 0528 的最新版本已经很强了 , 已经几乎追上了最头部的 OpenAI 跟 Claude 的模型 。 那 R1 的基础是原来去年年底的 V3, 已经是 6 个月之前的基础模型了 。

那过了 6 个月 ,V3 要提到 V4, 能力应该有提升 。 那提升之后再通过强化学习改进后训练 , 训出来的 R2 那似乎应该更强 , 对吧 ?

就是两次踢云纵踩出来的东西当然会更强了 , 对吧 ? 说的我也很实在 。 对 , 所以这个 R2 无论是中国还是美国的业界 、 科技 、 金融 、 券商都非常期待 R2 出来之后的效果能到什么程度 。

就是很强一定是一定是结果 , 就肯定很强是肯定了 , 强到什么程度就不知道了 。 我们都可以期待一下 。

对 , 然后呢 , 我们再看这个还是 Agent 这个事情 ,但出现了一个问题是说 , 刚才我们讲这种踢云纵的能力的提升更多集中在基础模型跟 L2 上推理模型 。

那 L3 这个执行任务这件事情看上去似乎我们有可能会待的很久 。 因为就是这些前面讲的预训练 、 后训练 、 强化学习 , 本身来讲是在提升模型能力本身 。

但是今天模型要从语言的能力到行为 , 它有太多别的工作跟配套的系统需要一起让它变得更牛逼 。

那似乎这个事情就没有那么简单了 , 对吧 ? 它没有办法像前面那样两脚踢云纵就踩上去了 。 而且更现实或者说更有意思的一个对比是说 , 这 OpenAI 的 L1 到 L3 的类比是类比自动驾驶的 。

自动驾驶行业在 L3 也待了很久 ,因为 L4 就已经几乎是不需要人的了 。 所以历史似乎也是这样 。 然后所以这个我截了一个另外一个聊天的截图 , 这个叫 Flo 的这个人 ,他是 Kimi 的一位技术研发的员工 。

之前年初的时候 , 业界关于如何复现推理模型的一篇文章 , 就是他发在知乎上的 。 然后他在今年也发了一篇文章 , 那篇文章的标题就叫 《 论 Agent 的持久战 》。

就是他说要想实现 AI 达到能替代 80% 人类白领工作的 Agent,是需要非常漫长的时间的 , 可能 5 到 10 年甚至更久 , 除非有全新的颠覆性技术出现 。

当然这是他的一家之言 ,也有很多我都觉得不是很精准 。 对 ,也有很多观点会认为可能两年三年, 因为最近当然也有很多人统计那各大佬们对这个所谓时间的评判 ,有一些比较乐观的可能会比较短 ,有的悲观一点的可能比较长 , 甚至有比这个 5 到 10 年更长的 。

那具体多久我们不知道 ,因为他这个事情在不断的眼睛关注 。

开源生态28:09

庄明浩28:10

那最后一个小标题 , 刚才我们叫开源 , 对吧 ? 开源这个强势崛起的开源生态非常强势 , 尤其以中国的这两家公司为代表 ,Deepseek 跟阿里的通义 , 就是能力的提升是非常非常快的 。

这两条曲线是美国那条线是不算开源必远 , 就任何模型都可以的 。 中国那条线是只看开源模型的发展能力了 。

就是所以中国整个的这个模型发展能力是要非常感谢这两家公司在开源模型上的努力的 。 甚至我觉得 ,因为之前美国最好的开源的大模型公司是 Meta 和 Llama, 那 Meta 和 Llama 基本上已经掉队了 。Meta 最近也在疯狂的调整整个的大模型的团队跟内部的组织架构 。

所以中国的两家开源模型的发展也很快 。 然后反过来讲 , 它也刺激了你会发现一些其他的公司 , 比如最近小红书 , 然后之前的智谱 , 包括 MiniMax、Kimi 其实也在都发自己的开源模型 。

就开源的生态变得越来越兴盛 。 反正因为原来有一种观点会认为 , 大模型这个东西需要那么多的钱 , 那么多的预训练的资源 , 开源是没有办法调用那么多的所谓的资源跟钱的 。

但是现在看上去这个事情未必如此 。 然后那从开源领域来看 , 开源领域你会去说 , 那开源领域也分什么样的组件 、 什么样的功能 , 对吧 ?

然后我们刚才讲过 ,在整个行业来看有一种趋势 , 那看开源领域也有类似的趋势 , 比如说你看什么样的开源项目得到了更多的关注 , 今年得到最多关注 , 超过 70% 增长是关于 Agent 的架构跟工作流的 。

第二大类是 coding, 第三大类是 inference, 就是这个 Agent 相关的基础设施的 , 然后 API management, 然后后训练 ,AI search, 然后 Agent 的 framework。

就是从开源领域的项目的关注度 , 就是关注度其实是一个

叫第三方指标 , 对吧 ? 但是也能看出非常明显的行业趋势 , 对吧 ?Agent、coding、Infra, 对吧 ? 这些关键词其实在我的课里都疯狂的被提及 ,post training、 后训练刚才我们也提及了 。

所以从开源的角度来看 , 这个行业的发展也符合刚才我们讲的那个逻辑 。 然后这是蚂蚁做的一张开源 LM 大模型的这个表 , 这个图其实在蚂蚁开源的公众号 ,有大家有兴趣可以去翻一翻 , 看整个开源领域在过去一年多时间发展的这个态势其实也是非常非常快 。

然后技术讲完了 , 对吧 ? 第一章讲的技术我们讲产品 , 产品又分三个小标题 : 交互 、 运营跟结果 。

产品交互30:40

庄明浩30:47

就是产品设计 , 然后产品运营跟产品结果 , 对吧 ? 产品设计其实我们在我上次录咱们的课程的时候应该是上上个月 , 对吧 ?

然后在过去两个月不到的时间 , 我们在中文互联网 , 我们不算美国 , 只在中文互联网已经看到了不下 10 款新的 Agent 产品了 。

比如说字节 Code 的 Code 空间 , 百度的心想 ,Liblib 做的 LoveArt, 然后号称是第一款 AI 浏览器的 Fellow, 昆仑的天空 , 然后 Flowways, 我们看到了非常非常 , 我没有完全列全 , 还有很多 , 非常非常多的各种各样的 AI Agent 产品 , 特别特别多 。

似乎如果你关注一些公众号 , 你感觉可能每天都有一些新的产品上线 。 然后更有意思的 , 比如说最近一段时间大家发现浏览器这个形态 , 浏览器已经是一个多么多么古老的互联网产品形态了 。在互联网出现的第一天 ,也不算第一天吧 , 比较早的时候就已经有浏览器了 。

这么古老一个东西在 AI 年代似乎又变成了一个新的兵家必争之地 。 对 , 又回到这个页面了 。 对 , 又回到页面了 , 对吧 ?

你比如说在美国 Chrome 这个传说 Google 因为反垄断的问题 , 政府逼迫他要把 Chrome 拆出来 , 然后 OpenAI 也报过价 , 对吧 ?

各家公司都报过价 , 大家都想抢 。 然后 Google 也会认为 Chrome 是他在 AI 战场最核心的武器之一 , 对吧 ? 然后 Surface 就苹果的那个浏览器最近一段时间改了它 AI 那个内置的搜索引擎 ,也造成了股价的调整 , 包括他说第一次 Surface 的搜索的数量下降了 , 大家都去 AI 工具了 。

就是你看发现这个事情跟 AI 是连在一起 , 断不开的 。 然后你看那些初创公司 ,OpenAI 在做 , 传说内部在做浏览器 ,Perplexity、Jumpstart 都在做浏览器 , 都已经发布了 。

第一啊 , 就原来的 Arc 也是专门做 AI 浏览器的 。 那你看这些公司 , 大模型公司 、AI 搜索公司 、Agent 公司 , 纯的新一代 AI 浏览器公司 , 似乎都要疯狂的弄浏览器 , 对吧 ?

那国内也一样 , 对吧 ? 国内之前夸克很猛 , 非常猛 。 夸克应该是前几天发了那个高考的报志院的那个 AI 模型嘛 , 对吧 ?

然后夸克似乎也成为了整个阿里体系内 2C AI 的排头兵 , 对吧 ? 就是这个战略地位无限级别拉升 , 对吧 ?

那同样的 , 它也侧面刺激了对家呀 , 对吧 ? 这个腾讯浏览器也在最近发了这个 AI 的这个功能 。

因为你要想 , 就是腾讯浏览器在腾讯内部的 , 比如说我们从这个产品团队的资源的禀赋跟优先级来看 , 它肯定排在很多产品后面 , 对吧 ?

它肯定不会排在微信前面 , 它不会排在 QQ 前面 , 那它不会排在很多游戏产品前面 , 对吧 ? 它的优先级不会在之前不会那么高 。

但是这一波 AI 来的时候 , 大家发现这个事情还是很重要的 , 还是要弄 , 对吧 ? 所以你发现最近更新也很频繁 ,也在疯狂弄 AI, 对吧 ?

这个躺平状态的 QQ 浏览器也得直升起来 。 所以就浏览器变成兵家必争之地 。 那为什么呢 ? 你其实刚才已经讲到这个关键词了 , 摊子 , 六个摊子 , 对吧 ?

今天我们在给 AI 让它帮我们做事 ,但它做事 , 对吧 ? 它需要什么记忆 , 对吧 ? 它需要规划 , 它需要什么各种各样的工具 , 它甚至要做各种各样的动作 。

那似乎它做所有的事情的时候 , 它要有一个稳定的 ,并且可以拓展跟世界其他的工具产生连接的一个环境 。 就它要有个地儿 , 对吧 ?

它不能飘在空中就弄 ,因为那就没法弄了 。 那看上去似乎浏览器就是那个地儿 , 就是那个载体 , 就是那个环境 , 对吧 ?

那当然了 ,在交互层面来讲 ,其实这个是在我的那个课程里面我讲了无数次 , 就是看见 、 看见 、 看见 , 对吧 ?

重要的事情说三遍 。 然后我们把这个最近一段时间新发的这几个产品的产品截图一拉 , 几乎没什么区别 , 左边一个聊天框 , 右边看着他在弄 , 对吧 ?

看什么搜索啊 ,在推理 ,在这个帮你做可视化的图片展现 , 对吧 ? 基本上形态就交互层面 , 用户就基本上说完 , 然后你就开始看他在弄 , 对吧 ?

看见的意义在于 , 你要知道就这波大模型有一个很麻烦的问题叫幻觉嘛 , 就是它会产生什么 , 或者是它会出现问题 ,是常会发生的事情 。

但是如果它让你看到了它一步步怎么执行的 , 那哪怕最后的结果不是那么理想 , 你也其实能容易原谅它 , 或者说比较容易产生信任 。

感觉它努力了 。 对 , 你反过来讲 , 如果没有这些过程 , 它光给你个结果 , 那你只能评判那个结果 , 对吧 ?

就跟小孩做题一样 , 这个老师只批结果 ,但是如果你写字写得好一点 , 对吧 ? 它可能没人给你个过程分 , 对吧 ?

就是这个意思 , 就是你要用看见 , 它才会信任你 , 信任你才好 , 方便你它不断的试 ,因为它需要不断的试 。

所以在交互层面来讲 , 看见 、 看见 、 看见很重要 。 然后呢 , 从运营角度来讲 , 你发现有一些事情变成了一种原来可能是无心插柳 , 现在变成了一种通用的模式 。

运营策略35:56

庄明浩35:57

比如说我们看各种 Agent 产品的宣传的视频 , 无论中国还是美国 , 视频基本上都是创始人坐在沙发或坐在什么地方 , 然后一个介绍的样子 , 然后大家开始讲 。

就宣传视频的风格非常的统一 , 无论中国还是美国 , 对吧 ? 各种各样的宣传视频都是这个样子今天 。

然后呢 , 大家也都开始疯狂的用传统互联网产品都在用的一个功能叫邀请码 。 是的 , 对吧 ? 现在反正当然它有关闭弹窗的理由 ,因为这个东西上量太大 , 它的那个成本会提升的很快 , 所以我要控制这个人数的这个进入 , 所以我要用邀请的方式来做控制 , 同时做一定的传播嘛 。

它有所谓的病毒传播 、 社交传播的这套机制 , 对吧 ? 邀请码大家都在用 , 对吧 ? 所以一出一个什么新的产品 , 大家都会说谁有邀请码 , 分享一下, 对吧 ?

邀请码的价格都被炒高了 。 对 , 然后就很有意思 , 我有朋友做了一个 ,他是做那个也是 AI 这一波的自媒体 ,他们就几个小朋友做了一个新的产品叫马兜来 。

马兜来 , 马兜来是什么 ? 就是相当于比如你有邀请码 , 对吧 ? 你把它 , 你把邀请码上传到这个平台 , 然后这个平台自动送发给另外有需要的人, 然后你在求什么邀请码 , 你也可以在这个里面求 , 对吧 ?

就是它搞了一个这样的小东西 ,也就是它这个东西为什么会出现 ,也是因为这一波的这个推广导致的 。

然后我那朋友就说 , 这个东西似乎在这个时间点形成了一种 SOP, 就是流程 , 对吧 ? 就是当下产品的发布公式 ,在 XXX 领域 , 你要一定要限定领域 ,因为现在通用的领域已经被拿走了 , 你要限定领域 , 对吧 ?

只要定语加的足够多 , 你都能做到第一 , 对吧 ? 就在 XXX 领域 , 首个推出首个 Agent 的产品 , 然后在 XXX Benchmark 上, 刚才我们前面讲过打分的 Benchmark 上, 拿到了 SOTA, 就是最好的得分 , 然后并且使用该产品需要邀请码 , 就是看上去变成了一个通用的公式 。

然后我有另外一个朋友在底下评论说 , 史称邀请码之乱 , 就是最近一段时间这个事情确实讨论的比较多 , 特别热 , 大家吐槽的也比较多 。

然后同样的 , 我们似乎要重新定义另外一件事情 , 就是版本号 。 这个原来软件的版本号是很重要的 , 就是你一个版本 , 大的版本 , 小的版本 , 它有版本号的 。

可是这个行业发展太快 , 导致这个结果是说 , 很多东西上线的很快很早 ,但是它的功能其实并不完善的情况下, 它已经长得非常非常大 。

比如最近最火的 AI coding 工具叫 Cursor, 对吧 ? 它已经到了 5 亿美金的 ARR, 就一年赚 5 亿美金了 ,是可能是有史以来涨到这个数字最快的一家公司 。

但是它到了 5 亿美金 ARR 的时候 , 它的版本号刚刚更新到 1.0,也就是我们之前用的都是 0. 几的版本 ,0.7、0.8、0.9 的版本 , 对吧 ?

那就相当于它还很早 , 它还处于非常非常早的阶段 ,但是它已经这么大 , 对吧 ? 然后比如说前两天这个极氪上很火 ,也是前阿里的一位高管 , 就原来雨雀的负责人雨博 ,他离开阿里去了字节 ,在飞书做了一年之后自己创业 ,他也做了一个 Agent 产品 , 或者叫一个知识库产品 , 叫 UMAP,他已经做了一年的时间了 , 现在刚刚更新版本是 0.3。

就是其实纯从体验角度来讲 , 大家的很多产品的给用户的状态而言是非常早期的 ,但是这个时代就允许大家以非常早期的方式先给到用户 , 然后用户去用 , 然后不断的过程中用 , 你跟用户 , 你跟整个 AI 的磨合在提升的过程中, 慢慢慢慢变得稳定 。

所以你看 Cursor 到今天 , 它已经这么大 , 它才发到 1.0 这个版本 。 就是我们要重新定义版本号 , 就是在运营上, 对吧 ?

然后呢 , 最后一个关键词叫结果 , 这可能也是这种 AI, 尤其走到所谓 Agent 之后, 大家探讨的一个很重要的问题 , 就是原来的软件其实交付的只是软件本身 , 它像一个工具 , 对吧 ?

交付结果39:41

庄明浩39:54

所以你看这个 , 这种 AI 大家会探讨说为什么要做 Agent,Agent 相当于就是你说它是一个智能体 , 它是你的员工 , 对吧 ?

你要求员工的是要交付结果的 。 是的 , 对吧 ? 所以那理论上来说 , 结果的衡量是非常明确的 , 对吧 ?

我们从原来的技术叙事到了产品叙事也是在交付结果 , 那结果去衡量 , 无非就是收入 、 毛利跟这过程中产生的所谓的数据飞轮 , 对吧 ?

是这样一套衡量体系去评判今天这个时间点出现的各种各样的 AI 的这个工具也好 , 产品也好的结果 , 对吧 ?

应该交付的是结果 。 那交付方式上其实也很有意思 , 这张梗图我觉得也是我最近看到一个非常非常贴切的形容这轮 AI 的这个交付结果的这个过程 。

首先就是原来最古老的这个我们生产线的生产方式 , 比如我要交付一辆汽车 , 我的生产方式是说我先生产轮子 , 对吧 ?

然后把轮子架起来 , 再生产底盘 , 然后再生产车架 , 然后把所有东西组装在一起 , 把一台车卖给你 , 对吧 ?

这是传统意义上的我们叫流程或流水线生产的这个过程 。 后来到后两年呢 , 大家强调所谓的敏捷 , 敏捷开发 , 对吧 ?

什么叫敏捷开发呢 ? 如果今天我要给你一个汽车 , 我先做一个滑板车 , 先做滑板 , 然后做滑板车 , 然后再做自行车 , 然后再做个摩托车 , 一步一步最后给你一个汽车 , 对吧 ?

这是原来这个敏捷强调的这个 , 就先做一个小东西 , 先跑起来再说 , 对吧 ? 然后不断的往上加东西 ,不断的加 ,不断的加 , 加到最后给你交付一个汽车 。

那今天 AI 是什么呢 ? 因为 AI 的大模型是无所不能的 , 所以它出来的时候就是一个功能多到无以复加的状态 。

但是你要知道 , 我们要的那个东西不是这样一个东西 , 所以你要砍 , 你要限定边界 , 你要把该拿到的东西拿掉 ,并且保证它的稳定输出 , 才能给到一个稳定的结果 。

所以这可能是这一波 AI 的交付方式 。 所以你发现最近一段时间 , 很多无论是做垂直的 、 做行业的 Agent 也好 ,AI 的公司也好 ,其实在做的事情都是这样一个事情 , 就是那个大模型确实无所不能 ,但是不能拿来直接用 ,因为它不稳定 ,因为它有幻觉 ,因为它不知道一些细节的东西 , 你需要砍 , 需要限定边界 , 然后保证稳定的输出 , 最后交付一个这样的结果

。 所以它是一个这样的事情 。 然后呢 , 衡量结果最直接的方式当然就是收入了 , 对吧 ? 就是所谓的 ARR, 就一年年付的收入了 。

所以你看会翻到各种各样的关于 ARR 的搒单 , 对吧 ?ChatGPT 当然还是最最最头部的 , 可能在美国 Claude、Midjourney、Cursor 这些公司最前面的公司 , 中国这边可能头部的 , 比如美图秀秀 , 对吧 ?

美图最近的 PR 也比较多 , 美图秀秀靠这波 AI 其实起的也蛮快 , 它其实就交付结果 , 它帮你做一个什么证件照 , 对吧 ?

帮你做一个美化的效果 , 你直接能看到 。 它证件照卖的很贵的 , 我那两天我姑娘幼儿园要报名生 , 然后它证件照要生成一次 , 就生成一次可能要 15 块 9, 然后你比如你再换个装可能要加 4 块钱 , 然后你再加个尺寸可能又加 3 块钱 , 就是但你着急用啊 , 你只能付钱啊 , 对吧 ?

但它这种方式就 , 它随便拍总是方便 。 对啊 , 它肯定方便 , 你只要用一张正常的正面照的照片就可以了 , 对吧 ?

所以就是你会发现 , 交付结果确实是衡量这一波的最简单的这个标准 , 然后结果的反应就是钱嘛 , 收钱嘛 ,因为你是通过结果付费的嘛 。

资本加速43:28

庄明浩43:29

那提到既然提到了 ARR, 聊到钱 , 那我们就正式往前推到第三章 , 关于钱的这个重要的叫资本 ,也是三个关键词 : 加速 、 并购跟 Infra。其中最后一关的 Infra 其实在我的课程里面也有比较多的篇幅讲到了 , 我们今天再讲一点点 。

加速 , 疯狂的加速 , 那起因当然是这些公司 , 尤其是最最最头部 AI 公司的 ARR 的增速非常非常非常的快 。

我们看 OpenAI 2023 年只有 10 亿美金的收入 , 去年是 40 亿美金 ,2025 年年初的时候 ,OpenAI 预计今年是 100 亿美金 , 上个月刚刚调过 ,他们今年预计有 130 亿美金的收入 , 增长非常快 。

那它最大的竞争对手 Anthropic, 年初也是 , 我没记错应该是年初预计今年是 20 亿美金收入 , 然后上个月这个新闻应该是 5 月 31 号的 , 已经更新到 30 亿美金了 。

就是你要知道 ,他们自己做计划是在年初做的时候 , 就应该打了复育量 , 结果过了五个月他的预期就被上调了 ,他自己调的 。

就是你想 , 那你就看看它涨得有多快 。 那 Cursor 就更不用讲了 , 我在去年年底做这个年度总结的时候 ,Cursor 的 ARR 还是 1 亿美金的那张图 , 那现在 Cursor 已经涨到 5 亿美金了 , 一年多 , 一年不到 。

就是疯狂的加速 , 就是那你要知道 , 这一轮对于 AI 公司的估值是靠 ARR 估的 , 这个也在我课程讲过 , 这是靠估值给的 , 靠 ARR 给的估值 , 对吧 ?

你多少倍的 , 你的倍数乘以 ARR 就是你的估值 。 所以你会发现这轮的 AI 的头部公司的估值的跟它这个 ARR 或者年度收入的这个我们叫 PS, 传统意义上的股票衡量的数据指标 ,是远高于传统意义上的非 AI 公司的 , 巅峰可以做到几百倍的 ARR。

那最最头部公司可能一般 , 比如如果你是个细分垂类的公司 , 你 ARR 的这个估值的跟 ARR 这个比可以到几十 。

你像最近刚刚我们昨天还是前天 , 就刚刚我们提到 Cursor,5 亿美金 ARR, 它这轮大概 100 亿美金估值 , 然后融了 9 亿美金 , 然后刚刚确认的新闻 , 这两天也传了很多 , 那个做数据标注的 scale.ai,Meta 投了 149,148 亿美金 , 占 49, 就 300 多亿美金的估值嘛 , 就涨得非常非常快 。

因为这看上去又是一个 T 云洞了 , 就是你的收入涨得快 , 然后又因为你的估值是基于收入的 , 所以你的估值涨得也快 。

并购大年45:55

庄明浩45:55

然后那估值涨得太快 , 投不起怎么办呢 ? 或者说有很多公司可能已经非常非常牛逼了 ,在很多新的赛道 。

那我在去年写报告的时候 , 很多并购案子写的还是一种叫掏空式并购 , 就大家其实并不是认可这公司的价值 ,而是把公司团队买走 。

所以那个时候的并购不是一种真正意义上的并购 。 可是今年, 今年虽然今年也只刚刚过去了不到六个月的时间 , 已经宣布 announce 或者确认的并购交易已经非常非常非常的多了 , 甚至在这个时间点 ,其实就可以给年底下个结论是说 25 年是绝对意义上的并购大年, 尤其是 AI 这个板块 , 甚至 AI 相关领域的很多没有上市的公司 ,因为原来很多并购是发生

在上市公司并购初创公司 ,但是今天因为没有上市的那些公司估值也很高 , 比如 OpenAI 这种已经几千亿美金了 , 它也在并购私人公司 , 就是私人公司 , 私人公司的并购也很多 。

所以整个从并购角度来讲 , 今年一定是并购的大年 。 所以美国的那些 VC 们又赚得盆满钵满 。 然后那再延伸一点点 , 这个其实跟今天的话题没有那么相关 ,但我觉得可以掐在这 。

因为昨天那个腾讯音乐不是收购了喜马拉雅吗 ? 然后我昨天也做了一期自己的博客来讲这个事情 , 我说其中有个观点 , 我说中国的这个反垄断似乎已经翻篇了 。

所以你会发现 , 包括 A 股一些政策也在鼓励 A 股上市公司做并购嘛 , 那似乎似乎我们中国这边也会成为一个并购大年, 只不过我们并购的标的不太一样 , 对吧 ?

比如百度收 YY 啊 , 迅雷收虎扑啊 ,TME 收喜马拉雅啊 , 对吧 ? 都是这种 , 这是并购 。 然后那我们再看这个机会出现在哪里 , 对吧 ?

这是红杉在 5 月底的一次大会上的一个 PPT,其实逻辑上特别简单 , 跟我们刚才前面讲的是非常像的 。 就既然这一轮我们走到了从推理模型走到了 Agent, 首先推理模型本身还是接着继续在发展 , 对吧 ?

然后推理模型刚才我们讲过通过什么 T 云洞呢 ?T 云洞有个方式叫合成数据 , 对吧 ? 所以合成数据也很重要 。

然后我们走到 Agent,Agent 需要调用工具 , 它调用工具的同时它不能自己调 , 它需要脚手架来帮它调 。 所以这都是机会 , 对吧 ?

就是哪里出问题哪里就是机会 。 所以纯从投资角度来讲 , 尤其早期投资的机会大概就出现在这里 , 甚至甚至甚至在 Agent 的这个生态里面 , 连协议层的东西都没有真正意义上的行为标准 。

大家会认为今天大部分 Agent 调用工具的时候利用了 Anthropic 的 MCP 协议 , 那未来如果世界上有非常多的 Agent,Agent 之间似乎也需要一个协议 , 对吧 ?

那反过来讲人, 就我们用户跟 Agent 之间的协作 , 那看上去好像也需要一个协议 , 对吧 ? 就是就跟互联网行业一样 , 互联网行业有 HTTP 协议 、SMTP 协议 、FTP 协议 , 各种各样的协议 , 才构建了整个互联网运行的基础 。

那你会发现在 Agent 的这个时代来临之后 ,因为你要知道所有这些协议本身来讲 , 整个的互联网生态是为了人打建的 。

可是我们没有为 AI 打建这些东西 , 对吗 ? 那 AI 如果未来真的跑起来之后, 那 AI 的那张网 , 包括跟人之间 、AI 之间的这些连接 , 似乎也需要协议 。

所以这里也都有机会 , 那就更不要提真正意义上给这轮 Agent 提供所谓基础设施的公司了 。 那这张图也是最近一段时间海外读角兽发的一张图 ,是关于这个 Infra, 就我们如何给 AI Agent 做基建 , 对吧 ?

Infra机会49:04

庄明浩49:20

首先前面讲的我们需要一个环境 , 要搭一个环境 , 对吧 ? 浏览器是一个环境 , 虚拟机是一个环境 , 对吧 ?

然后如果要让它去调用浏览器 , 它要去浏览器访问 , 那似乎跟浏览器之间也需要一些什么样的功能跟服务 。

然后它要有很长的上下文的记忆的功能 , 对吧 ? 然后它要有做执行的能力 ,有搜索的能力 , 甚至是不是要做支付 , 对吧 ?

因为我们现在的支付 ,在线支付是给人做的 ,不是给 Agent 做的 。 我们是在线支付又涉及到钱 , 又很安全 , 又要考虑到权限的问题 , 对吧 ?

数据库的权限 , 人的访问的 ID 的权限 , 你会发现所有这些事情都变成了问题 。 那似乎在当下这个时间点 , 这些就全部都成为了早期投资的重要的标的方向 ,因为后期已经大家投不起了 。

刚才我们讲过已经融几亿美金了 , 你想一个基金 , 一个基金可能都没有几亿美金 , 它怎么投得起呢 ?

我们投小的时候只能往前投了 , 对吧 ? 因为现在基建不完善 。 这个观点其实在我的课程里面也有讲过 。

总结50:19

庄明浩50:19

然后写在最后最后一页 , 这个也是最近一段时间这个这个硅谷银行发的一个报告里面的一张图 ,也是我在我的课程里面在讲技术到产品那一章 ,也在用的一个观点 , 叫 Gantt 的技术曲线嘛 , 就技术发展曲线嘛 , 就是所有的技术发展都是需要经历一个从默默无闻到开始爆发 , 到迅速到愚昧之巅 , 然后迅速再跌到绝望之谷 , 然后慢慢慢慢慢慢理性化这

个生产过程 , 对吧 ? 所有的技术似乎都需要经历 。 然后还有一点是在一个时间截面数据上来看 , 某一堆技术会在某一个时间点分布在这个曲线的不同的位置上 。

那今天这个时间点 AI 似乎也有这样一个状态 。 那这张图大家可能看不太清 , 我大概可以解释讲一下, 比如说

云 , 对吧 ?Cloud 已经在这里 , 就是在最后尾期 , 就是云跟 AI 的结合已经是非常非常共识的状态了 , 已经变成理性化了 。

比如说生成式 , 纯生成式的 , 比如生成图片 AI, 确实也已经进入到一个比较理性化了 。 那 AI coding 是在最最最疯狂的这个点上的 , 就是最最最愚昧之巅了 ,是最热的这个东西 , 对吧 ?

然后还有一些可能还没有那么热 , 比如边缘的 AI, 对吧 ? 然后比如说这个这个 Console AI, 然后这些可能还在爬坡的过程中,AI Agent 在这里也快接近这个这个这个最顶点的位置了 , 对吧 ?

所以你会发现它其实跟我们今天聊的状态很相关 , 就最热的东西一定在最顶点 ,不太聊的或者已经成为成熟态已经跑到后面去了 。

所以整个从技术到产品到资本 ,其实都可以用差不多这样一张图去比较的清楚的做一个脉络 , 或做一个 map, 或做一个指向标的方式 , 给到大家去理解所有的这些内容 。

然后我今天的我的分享内容大概就是这些