开场0:00
Hello 大家好 , 我是明浩 。 现在是北京时间 1 月 11 号的凌晨 00:24, 我刚从北京飞回上海 , 到我的家 。 然后在刚刚过去的 1 月 10 号这个星期六 , 我去参加了一场在北京的活动 , 这场活动叫 AGI-next。
如果你是关注 AI 行业的话 , 应该在卡斯克 、 赛博禅新 、 机器之心 、 新智园 、 腾讯科技 、36 课 、 凤凰科技应该都看到了相关的推送 。
对 ,在北京有一场非常非常重要的关于 AI 的论坛 , 我去参与了这场论坛 。 嗯 , 这可能是少有的 , 我觉得整场活动非常的干 , 非常的紧凑 , 加上这种非常强的一场活动 ,在现场我认认真真地听完了所有内容 , 然后觉得需要跟大家分享一下这样的内容 , 然后所以有了这次准备 。其实我在极客上在我的粉丝群里也跟大家说过 , 我说我在准备这个
内容 。 所以今天下午的活动大概是在 5 点半多结束 , 然后我打车去机场 。 去机场的路上, 我把这场活动的速记 , 对 , 你们现在看到的绝大部分的公众号的推送的内容应该都来自于现场的速记 。
我也拿到了现场的速记 , 我的照片 , 我在我的日记上记录的一些纪要 , 包括一些观点 , 我全部把这些资料放给了 notebooklm, 让 notebooklm 生成了几个 PPT 的文档 。
然后我基于这三四个 PPT 的文档 , 然后又做了加工跟整合 ,有了现在这份 25 页的 PPT。 嗯 , 这可能也是我第一次真正意义上在播客里 、 在自己的主节目上, 用 AI 生成的 PPT 来作为 PPT 的展示 。
我觉得这似乎也可能是一个比较关键的节点 。 然后今天这期播客也是我在 2026 年的第一期的播客 , 虽然说新年快乐有点晚 ,但是还是说一声吧 , 祝大家新年快乐 。
呃 , 我正式开始今天的这个内容的讲述 。 嗯 ,notebooklm 起的标题 ,其实是我给它的建议 。 这个标题叫 《 日益长千里的中国 AI 全面兴赛 :AGI-next 峰会前沿观察与思考 》。
首先呢 , 我是在昨天下午大概 6 点左右接收到这份邀请的 ,是知谱的小伙伴跟我说他们有这样一场活动 , 觉得我会有兴趣 , 所以看能不能过来 。
然后本来我在今天是安排的一个很重要的事情 ,是我的儿子 , 就是小庄 ,有一个比赛 , 我要带他去比赛 。
然后呢 , 临时跟老婆商量了一下, 然后我们家还有老二 , 还好老二周六的课不是太多 , 就让老二周六请了假 。
然后他那个比赛是早上 8 点要签到 , 所以早上起来一家人 6 点多起床 , 收拾了一下, 我们 7 点多出发 , 我带着他们几个去到了我儿子比赛的现场 , 把他们送到那儿安顿好之后, 我直奔机场 , 坐早上的飞机 ,在中午落地了北京 , 参与到这场论坛里 。
然后我觉得这一切都是值得的 。 对 , 然后当然也很感谢我的太太给我这样的空间 。 然后这场活动叫 AGI-next 的前沿峰会 , 它其实是清华大学基础模型北京市重点实验室作为主办 , 知谱的首席科学家唐杰教授作为招起人, 召集的这些嘉宾 。
全明星3:32
当天的这个嘉宾包括谁呢 ? 比如说当然第一个开场的发言嘉宾是唐杰 , 呃 , 清华大学教授 , 知谱的创始人, 也是知谱的首席科学家 。
第二位 , 杨植麟 , 月之暗面 Kimi 的 CEO。 第三位 , 林俊暘 , 这个名字可能有一些不是那么了解行业的人, 对这个名字有些陌生 。
啊 ,他是千问的技术负责人, 你可以也认为是今天这个时间点 , 千问大模型的技术的一把手 。 对 , 然后当时我看到这个邀请函的时候 , 看到这三位 , 我当时就觉得 , 哇 , 这个论坛的这个阵容跟嘉宾的状态 ,不得了 。
然后我再往下看 ,在三位演讲嘉宾的这个演讲之后, 有一个论坛环节 , 论坛环节的嘉宾是杨强 , 呃 ,也是一位院士 , 研究 AI 的 。
然后唐杰 , 然后林俊暘 ,以及姚顺雨 。 对 , 就是那个刚刚接手腾讯 AI 大模型一把手的姚顺雨 , 前 OpenAI 的研究员 。
然后更更更重要的是 , 这场论坛的主持人是广幂 , 对 , 就是十项跟哈维多教授的创始人。 如果大家听张小军的播客 , 你应该知道小军跟广幂每个季度的大模型季报 , 应该是这个行业几乎所有人都会听的事情 。
所以当我看到姚顺雨跟广幂的名字出现的时候 ,其实我内心就在纠结说 , 这是一场非常值得去的活动 。
然后最后的最后, 这场活动的总结 ,是清华大学的院士 ,也是人工智能研究院的负责人张博君院士 ,他已经 91 岁的高龄了 。其实我之前上过一个清华的班 , 张院士给我们讲过课 ,他可能是中国当前人工智能这个领域最德高望重的一位院士 。
所以看到这儿的时候 , 把这个阵容称之为全明星 , 应该没什么毛病 , 对吧 ? 然后我把这个邀请发到群里 , 粉丝群有人说这就是元婴强者交换会嘛 , 这个梗可能如果你不看凡人修仙应该不太能了解 。
啊 , 凡人修仙最近的进度是主人公升到了这个元婴这个这个这个这个 level, 然后元婴的强者开了一个大的集会 , 然后他用这个梗来形容 。
所以这个 notebooklm 的总结是 " 群星璀璨 : 中国大明星领域的首发阵容 "。 呃 , 当天在现场开场的时候 , 唐杰 , 唐杰教授在介绍嘉宾的时候 , 我数了一下, 除了张院士之外, 还有另外三位院士在下面坐着 。
所以整场活动有四位院士 。 然后整整场活动的开场是清华大学的学学校的校长 , 第二个发言的嘉宾是海淀区区委的党委书记 。
嗯 , 你就知道这场活动的规格 。 然后产业产业内的核心玩家这几位 , 呃 , 唐杰 、 杨植麟 、 林俊暘 、 姚顺雨 、 广幂 , 对 , 这个阵容基本集齐了中国大模型领域的核心力量 。
除了刚上市 、 今天晚上应该在忙年会的 MiniMax, 然后几乎从来不对外露面表达的 DeepSeek,以及以闭源模型为主的字节 Seed 团队 。
因为这场活动更多的还是在讲开源 , 对 , 它是 AGI-next 的开关键路径与中国的开源影响力 。 所以字节美赞也合理 。
所以除了这几家之外, 我觉得这已经是全明是全明星首发级别的阵容了 。 对 , 然后我们一个一个看啊 , 首先看三位演讲嘉宾 , 唐杰教授 、Kimi 的杨植麟 ,以及千问的林俊暘 。
唐杰演讲7:38
唐教授的这个这个标题叫 《 让机器像人一样思考 》。 啊 ,他的逻辑是说 , 知谱或者他一直以来的学术的研究的方向 , 一直是从人的角度去让机器啊成为一个类似人的状态 。
然后他总结过去这些年 AI 大模型经历了从最开始的小模型到大模型 , 到 Transformer, 到今天这个时间点的状态 , 从语言走到 coding, 走到 agent。
然后在 25 年, 大家所有人都在强调 ROV2, 就是可验证的 、 可验证奖励的强化学习成为主流 。 也提到知谱在今年 by coding, 然后做了 auto GLM, 然后在 coding 领域的进展也很强 。
但在唐教授的这个整个的聊天过程中 ,其实有几句话让我印象蛮深的 。他说 ,他表达了一个他的观点 ,他说 " 我们的差距也许还在拉大 ", 这个 " 我们的差距 " 是相对于美国的开源模型 。他说美国大模型更多在闭源上演进 , 我们不能仅仅为开源的成果而沾沾自喜 。
从这个角度来说 , 无论是作为一个科研人, 还是作为一个产业的公司的核心的创始人, 我觉得这个认知还是很谨慎的 。
对 , 然后在整个唐教授的最后的演讲的最后 ,他放了一页叫 《2026 年的专注 + 创新 》。 我觉得这一页内容基本上代表了可能不仅仅是知谱 , 大部分今天市场上头部模型公司在 26 年的研究重点 。
比如说第一件事情是探索 , 探索智能商界仍然是 AGI 最本质的事 。 然后去 scaling out 的已知的是基座模型的关键 , 比如 coding、agent, 甚至物理世界 。
然后探索未知的是除了 O 系列之外的 ,也就是推理模型之外的新的范式是什么 。 然后第二点是技术创新 , 比如说全全新的模型架构 , 解决超长的上下文 、 更高效的直接压缩 , 然后记忆激励与持续学习 。
模型自主学习是 AI 超越人实现超级能的关键 。 呃 , 持续学习或者叫自主学习 ,是今天这场论坛被提及最多的关键词 , 没有之一 , 后面会无数次讲到 。
然后多模态融合 , 然后 agent 完成复杂任务 , 机器人 AI for Science。AI for Science 也是这场聊到比较多的话题 , 可能这是一个更偏学术的论坛 , 所以大家会聊到这些 。
然后这些关键词基本上代表了在这个时间点 , 主流的模型厂商对于 26 年的期待 。其实我还在准备一个 1 月底的超长的 PPT 的内容 , 关于模型进展跟 26 年趋势上的演化 ,其实基本上也是这些内容 。
杨植麟演讲10:20
这是唐杰教授 。 然后下一位就是 Kimi 的杨植麟 。 嗯 , 我刚才回来的时候看刘军老师他们已经推送了一篇文章 ,是讲这个这个 Kimi 的创始人杨植麟的演讲 。其实大部分科技媒体都发了杨植麟的这个演讲的全文 , 大家有兴趣可以看一下 。
然后因为这场是一个偏技术的论坛 , 然后是唐杰教授组织的 , 所以唐杰教授在跟所有嘉宾去表达这场论坛的时候 , 都会说是偏技术的 。
所以杨植麟遵守这个规则 ,他的整场演讲几乎全部围绕 Kimi 的训练的方式 、 方法 、 路径跟可能得到的结果 。他当时说法就是 " 回归第一性原理 , 推动 AGI 的边界 "。其实这件事情跟刚才唐杰教授的 26 年展望的第一条是一模一样的 。
然后 Kimi 在这件事情上其实核心只做两件事情 , 一个是 token 的效率 , 一个是长长内容 , 或者叫记忆的上下文的超长的这个事情 。
然后在杨植麟的这个这个这个整个演讲的最后, 除了讲这些技术技术之外, 如果大家有兴趣了解内容 , 可以去看腾讯科技的推送 , 应该是杨植麟的演讲的全文都在 。
我就不展开了 ,但是我只说我自己有印象的一些内容 。 比如说杨植麟最后谈到了模型是具有独特 taste 的创造 ,他会认为今天这个时间点 ,在做模型的人, 本质上来讲是在把自己的品味融入到模型的创作过程中 。他说一个好的 AI 应该追求什么样的价值 , 这种 taste 将一个模型与另一个区分开 , 它不是商品 。
然后在演讲的最后 ,他分享了一段他跟 Kimi 的对话 。 那段对话大概意思就是说 ,他想问 Kimi:AI 发展这么强 , 到底我们该怎么与它相处 , 会不会担心很多事情 。
然后杨植麟说 :" 我选择乐观 ,因为悲观意味着停滞 ,而乐观即使有风险 ,也代表着无限的可能性 。" 他的终极愿景是将 AGI 作为探索未知的终极工具 , 用于解决人类在科学
、 健康 、 能源等领域的宏大挑战 。他提及马上他们会发 K3,因为他们现在是 K2, 然后他可能还有 K4, 甚至 K100 都有 。
这是杨植麟 。 然后第三位林俊暘 ,他的演讲我觉得 , 或者说今天整场论坛下来 , 林俊暘是圈粉最多的一个 , 表达非常的犀利 、 有趣 ,而且很直接 。
林俊暘演讲12:38
啊 ,他年纪应该跟杨植麟是一样 , 哎 , 对 , 应该是 93 的 。 对 ,他跟杨植麟应该是差不多大的 , 姚顺雨应该是 98 的 。
对 , 这这一批的创始人跟核心的负责人真的非常的年轻 。 然后他演讲中提到 , 比如说像上来先提到要体验千问的各种各样模型能力 , 推荐大家用 chat.qianwen.ai,而不是那个 app。
嗯 , 这个懂 , 大家知道最近阿里的整个架构调整的话 , 应该知道他为什么会强调这一点 。 然后他会解释为什么今天这个时间点 , 千问的模型的尺寸特别的多 ,因为这是一次一次面对客户的要求 , 从最最开始的最小的 1.8B 到 7B 到 72B, 然后中间可能有三点几 B、 四 B 的这样的模型 。
然后在今天的整个陈述过程中, 林俊暘把比较多的篇幅放到了多模态上 。 对 ,在与知谱跟 Kimi 的对比上来讲 , 千问的多模态能力确实要更走得更远一点 。他也提到了一点点推理跟 code coding。
然后在这个这个这个核心的这个逻辑上来讲 , 嗯 , 林俊暘说千问在真实世界的需求中迭代核心技术 , 现在做的是高级推理上下文 , 然后业界顶尖的代码能力跟真正的原生全模态能力 。
啊 , 这个可能是林俊暘相较于杨植麟跟唐杰教授更多强调的一个观点 , 就是多模态或者全模态 。 然后在整个全模态进化当中 ,他特意强调了他们在过去一年在图像领域的进展 , 比如说在图像的推理能力上 ,他们现在他举个例子是说 ,他可以生成一张可能有 12 宫格的照片 , 然后代表一个人的一天 , 这个人的一天每天固定时间在做什么 , 然后这个对应
的时间跟做什么 , 这些文字跟当时的动作本身 , 这样一张图是一一直就是一下子生成出来的 , 那代表着图片生成有了类似今天我们看到 Nano Banana 的那样的理解能力 。
然后他讲了另另外一个更有意思的例子是说 ,他们做开源 , 把他们的图片的编辑的这个能力也开源到社区里 , 然后一些开源社区的技术贡献者们给他提到一个他们原来完全没有想到的角度 。他举这个例子说 ,有一张图是一个女性的模特 , 她举了右手 , 然后你给 AI 模型下的指令是把她的右手放下来 , 然后这样就出现了第二张结果 。
然后他们做了一个事情是说 ,是把这两张图混合在一起 , 你会发现那个图有点虚 , 虚就代表着除了被挪下来的右手之外 ,其他的这个模特的身上的 , 比如衣服 、 身体的部位 、 脸部的特征 ,其实都出现了漂移 。
那如果是逻辑上说 , 如果大家用 PS 的话 ,其实除了那个被放下来的右手之外 ,其他部分应该是可以贴在一起的 , 才是一个合理的 , 或者说合格的做了这样编辑的功能 。
所以他们在改进模型过程中, 通过这样的方式去验证他模型有没有改进 。 所以他们在最新的 251 版本里面又做了类似的实验 , 发现这个漂移的问题得到很好的改进 。
你想他为什么会把这个事情放到这么位置 、 这么重要的场合上来讲 , 我觉得大家似乎可以期待一下千问在 26 年在多模态跟全模态领域的进展 。
然后这是三位这个发言嘉宾的内容 ,其实他们内容科技媒体上应该也有一些媒体发了他们的全文 ,有兴趣可以去翻一下 。
然后我稍微再多讲一讲那场论坛 ,因为确实这场论坛可能更是我期待的 , 甚至其实大部分的我们看过去这几个小时公众号的推送里面 , 很多公众号应该都选择了把这场论坛的速记作为核心的内容推送出来 。
圆桌论坛16:19
我没错的话 , 卡斯克是 ,DC 是真是啊 , 还有哪个媒体应该也是 。 然后这场对话叫 ,他其实当天这个会议现场没有对这个对话起名字 ,但是 notebooklm 起了个名字 , 叫 AGI 的下一个篇章 。
啊 , 广幂针对这四位嘉宾的背景 , 设计了四个我觉得非常好的问题 ,而且每个人都问到 。 你要想这四位嘉宾啊 , 杨强跟杨强算特殊一点 ,他是加拿大皇家学院的院士 ,是香港科技大学的荣休教授 , 所以他是偏学术的 。
但另外三位唐杰 、 林俊暘跟姚顺雨完全是产业界的从业者 , 当然唐杰教授可能也有学术的身份 ,但是更多他作为今天知谱的首席科学家来参与这场会议 。
这四位嘉宾的角色 、 年纪 、 位置 、 行业经验完全不同 , 或者不尽相同 。 那针对这样的嘉宾构成 , 设计了四个偏通用的问题 , 我觉得广幂能力还是非常强的 。
这四个问题分别是赛道的分化 , 就是今天这个时间你会发现 , 虽然都是大模型公司 ,但是大家在 byte 的东西出现了变化 。
第二个问题叫下一个范式 , 呃 , 刚才前面提到的自主学习 , 或者叫 continual learning 这件事情似乎看上去是共识 。
第三件事情 agent, 嗯 , 大家会认为 , 或者说现场广幂的引导会说 ,agent 经历了 25 年的发展之后, 似乎 26 年是一个很重要的 , 我们期待 agent 真正能带来所谓经济价值的爆发的这样一个年份 。
那如何看待 agent? 第三个问题 。 第四个问题更宏观一点 , 或者说更强烈一点 ,是中美对抗的问题 , 就是似乎是问几位嘉宾在 3 到 5 年之后, 比如说世界上最领先的 AI 公司有没有可能是一家中国公司 , 这概率是多少 。
那如果是的话 , 为了达到这个目标 , 我们需要什么样的条件 ? 所以四个问题 , 我们一个问题一个问题看 。
首先很多媒体我看都很默契的 , 大家选择了差不多的同一张照片 , 作为今天这个新闻的推送的头图 。
啊 , 这张照片就是姚顺雨的大头照 。 为什么是她大头照呢 ? 因为今天在现场姚顺雨是没有来的 , 她是在线参与的 。
所以当时的论坛是现场有四位嘉宾 , 就是广幂加三位嘉宾 , 然后姚顺雨的那个腾讯会议的那个大头照是在屏幕上, 所以头显得特别特别的大 。
所以大家开玩笑说这个腾讯的 AI 巨头参与了这场会议 , 对吧 , 真的是非常非常巨的巨头 。 然后这应该是姚顺雨入职腾讯后的第一次公开亮相 。
对 , 这可能也是当天现场很多人期待去听到她的表达的原因 。 然后这位年仅 28 岁的中国最大互联网公司 AI 的 1 号位 , 看起来是有点紧张的 ,但随着讨论的深入 , 我觉得她答的还是不错的 。
然后先看一个个问题 , 第一个问题关于赛道分化的 , 每家巨头有自己的选择 。 然后姚顺雨被第一个问到 , 广幂第一个问的是姚顺雨 , 对 。
然后姚顺雨的解答方式是 , 或者说今天我在现场跟晚点的曼琪聊天的时候 , 曼琪也在问 , 说你听完这个论坛觉得姚顺雨怎么样 , 或者说有什么想到的点 。
我觉得想到唯一的最重要的点是 , 今天有四个问题 , 每个问题姚顺雨的回答方式跟逻辑是一模一样的 , 或者说她的切入点是一模一样 , 就是她把所有的问题分成了 to B 跟 to C。
那似乎我们可以推演是说在过去一段时间 , 她加入腾讯这段时间 , 跟腾讯管理层业务部门的同事各种各样层面聊的过程中, 可能或多或少的被很多今天这个时间点我们在中国 to C 互联网的很多东西熏陶过了 。
所以她在这件事情上有非常强烈的界限感 , 这是我最大的感受 。 然后在今天的这个广幂问的第一个问题 , 就是巨头分化怎么看 。
然后现场姚顺雨的答案是这样 , 她说从结论上来说 , 今天这个时间点 to B 跟 to C 是分化的 ,to C 领域似乎我们今天去问 ChatGPT 一个问题 , 跟我们一年前去问一个问题得到答案的差别没有那么大 。
那似乎 to C 的用户可能并不那么真正意义上需要一个那么强的模型 ,但是 to B 领域反过来 ,to B 领域在用越来越多强的模型 , 跟越来越多强的模型渲染到业务当中, 比如说 coding 是最典型的 。
然后她同时说模型跟应用层也出现了分化 , 然后在 to C 领域这种耦合性会更强 , 所以出现了类似大一统 all in one 的这样的趋势 ,但是 to B 领域的拆分会更强烈 , 这是她的观点 。
然后顺着这个问题 , 广幂又追问了姚顺雨这个问题 ,是说那你今天作为加入腾讯之后, 你作为腾讯 AI 1 号位 , 你在 byte 的是什么 ?
呃 , 她姚顺雨依然用 to B 跟 to C 的角度去拆分 , 她说 to C 领域核心还是复杂的上下文跟记忆 , 然后 to B 领域她觉得更难一些 , 没有说更多 ,但是她说今天的时间点 ,因为腾讯是一家有非常多场景跟业务的公司 , 所以自身模型能力的提升应用到自身的已有的场景跟业务当中来提升生产力这件事情已经足够大了 。
所以这是她的答案 。 然后第二个回答是千问的俊暘 , 俊暘说了一个很有意思的话 ,他说这个虽然他是千问的技术负责人 ,但是他似乎也不能代表公司 , 反过来讲他觉得姚顺雨也不能代表公司 。
对 ,他说他的表达会认为今天这个时间点 , 每一家公司的核心 , 或者说类似他在这个这个他在描形描 ,他在他的主题演讲中提供一个角度是说 , 还是更多以用户的角度去思维 , 就是如何服务好用户可能还是更重要的 。
这是俊暘的答案 。 然后这个这个
杨强的观点是说 ,因为他是学术界 ,他会认为今天学术界跟工业之间也跟业界就产业之间也出现了比较大的分化 , 然后产业界在疯跑 ,但学术界在过去一段时间开始慢慢跟上 。
然后最后是唐杰教授 , 唐杰教授说似乎 chat 的这场仗已经打完了 , 下一仗应该就是做事 , 然后就是通过 agent 来解决实际的问题 , 来实现差异化 。
这似乎也可能是为什么知谱在过去一年比较积极的在推进 , 比如说 coding 跟 agent 领域的演进 。 对 , 这是第一个问题关于啊分化 。
然后第二个问题啊 , 下一个问题是关于范式的 , 啊 , 下一代范式到底是什么 ,有没有什么苗头 。 然后依然是姚顺雨第一个回答 , 她说在硅谷自主学习基本上已经是共识了 ,但是她会认为今天这个实验大家谈论 online learning 跟 continual learning 的时候 ,其实大家的概念也是模糊的 , 就每个人都在说自己的角度 。
这可能跟 AI 行业过去几年很多的概念都一样 , 她有两个观点 。 第一就是说她说 online learning 或者 continual learning 可能不是方法论 , 它不是一个新的研究范式 , 它是数据跟任务 ,以及包括数据任务站内的奖励函数 。
就她会认为是偏数据跟机器模型的事情 。 然后呢 , 她会说比如今天这个时间点 , 大部分今天在用的各种各样的聊天工具变得越来越个性化 , 它变个性化的这个过程其实也是一种广义上的 online learning, 对吧 。
然后呢 ,AI coding 工具随着使用越来越多 , 这些 coding 工具也越来越了解每家公司代码的倾向跟不同跟习惯 , 那这算不算自主学习呢 ?
第二 , 她说可能是一种非共识 。 她说这种非共识是什么呢 ? 她说 , 呃 ,ChatGPT 用户数据拟合成聊天风格 , 沿着这个角度来说 , 她说有这种非共识是说 , 那 ChatGPT 用用户的数据拟合聊天风格算不算是自主学习 。
然后今天世界上最好的 AI coding 工具 Cloud Code, 它自己的 95% 的代码是 AI 写的 , 那它算不算呢 ? 对吧 , 所以她会觉得今天这个时间点在一些特定场景下 ,其实直觉习或者自主学习已经在发生了 , 只不过受限于场景 。
然后她会认为这件事情是一个渐变的过程 ,不会说因为突然间某一个事件或某一个产品或某个什么东西做出来之后说这个就是自主学习 。
她认为不是这样 , 她说在 25 年其实很多东西已经出现了信号 。 然后俊暘的观点是说 , 嗯 ,他从另外一个角度去解读这件事情 ,他说 RL 的算力 , 就是强化学习的算力 ,在国内的这家大模型厂商里面的分布并不太多 , 没那么激进 ,但是在海外的 , 尤其是像比如马斯克的 IGAI, 它的很多的算力都投到了比较激进的强化学习这个板块 。
然后呢 ,他会认为如果把这个角度再往前推演 ,他说大家讨论的 AI for Science 就是让模型自己去研究一件事情 , 找材料 , 确定问题 , 解决问题 , 然后实验得到结果 , 甚至产出报告 , 这个过程本身似乎也是一种学习的过程 。
然后他说这个问题就主动学习的反面 , 可能会引发更多的安全问题 ,因为你模型在利用比如说环境 ,因为今天实验大家是用用户的提示词来让模型产生答案 ,但如果未来环境本身也能给模型产生刺激的话 , 那模型会自己做一些事情的时候 , 必然会产生安全的问题 。
对 , 这是他的观点 。 然后唐杰教授是一个偏乐观派的观点 ,他会认为 2022 年会出现新的范式创新 ,因为 scaling 的效率的瓶颈已经是所有人都看到的事情啊 ,并且学术界的深入研究也跟上了 。
虽然可能学校的卡跟业界的卡相比还少了一个零 ,但至少学术界已经开始有经验 ,并且做过一些尝试了 。 所以从逻辑上来讲 , 应该会有什么新的东西出现了 。
唐杰教授是比较乐观的在这件事情上 。 然后他会认为更重要的是 , 对于一家模型公司而言 , 你每年的算力投入如果是一个固定的值的话 , 你今天的时间点是要把这个算力到底是投到预训练 , 投到后训练 , 还是投到新的数据训练 , 还是新的什么东西上, 你需要有一个整体的思维 , 要做全局的考虑去投入 , 考虑投入产出比了 。
然后是第三个问题 ,agent 创造的经济价值的关键点 2026 年, 大家会认为 2026 年 agent 执行的任务的时长会变得更长 , 会做更多部署的相关的工作 。
然后首先还是姚顺雨 , 她会认为 to B 的这件事情的曲线应该是一个肉眼可见一直会上升 。 她甚至举了个更极端的例子说 , 哪怕今天这个时间点所有的模型研发停止 , 就模型能力就是这样 ,但是就基于现在的模型能力做更多的渗透跟部署 ,在 to B 领域这件事情依然可能有 10 倍到 100 倍的空间 。
然后她会认为在新的时代 , 人类跟 agent 的合作当中, 教育变得更重要 , 就是如何发挥让人类的能力帮助 agent 变得更好 , 这个更重要 。
这件事情可能跟最近另外一位刚刚离开 Meta 的田元栋 ,也是一位技术大神 ,在智慧文化的 26 年的总趋势展望里面 , 与之相匹配的内容是他提出一个观点 。他提出一个观点是说类似费米能级 , 就是人类一个人到底能让 agent 变得更好多好 , 才决定了未来人类的价值 。在这个问题上, 俊暘的角度是说 , 今天这个时间点 agent 更多还是跑在电脑的环境下, 那肉眼
可见 26 年大家会越来越多尝试非电脑 ,也就是说物理世界的环境 , 然后自然而然的引发到了类似机器人巨神这个角度 。
然后杨昶文院士会说 , 我们如果按目标和规划 , 然后是人为的还是机器自动的这样方式来划分四个象限的话 , 今天这个时间点我们在看到的很多 agent 还处于比较早期的第一象限的一个阶段 , 未来其他几个象限的发展依然还是会非常值得期待的 。
然后唐杰教授的观点是说 , 一个 agent 的成功取决于三个要素的平衡 : 解决问题的价值 、 运行的成本以及迭代的速度 。
然后今天的最后一个问题 , 广幂问了一个更直接的问题 , 就是未来 3-5 年, 中国会是否诞生世界第一的 AI 公司 ?
如果希望达成这个目标 , 我们需要做一些什么事情 , 或者有一些什么关键要素得到补充 。 嗯 , 姚顺雨的观点是说她会认为比较乐观 , 嗯 ,因为我们在电力 , 我们在基础设施 , 我们在人才 ,在很多因素上我们都跟得很紧 ,并且跟得越来越紧 。
但是当然也会有一些客观限制因素 , 比如说观看集 , 比如说 to B 的市场的交付情况跟付费意愿 ,但是这些事情可能会有一些转机 。
然后她期待的是说越来越多有冒险性精神的 , 能够做创新的人才的出现 , 这是姚的观点 。 然后俊暘的观点会相对冷静一些 ,他会认为
我们在算力层面上肯定在美国跟美国相比可能差了一到两个量级 ,而且美国的头部供应厂商已经把更多的研发的算力跟能力投入到下一代的范式研发上了 ,但我们还不是 。
嗯 , 然后他举了个例子是说 , 之前阿里的光头哥 , 就是他们那个芯片业务的负责人找到过林俊暘说 ,他在三年前就问 , 三年之后未来是不是还是 transformer,是不是还是多模态 。
然后他说他当时回答是说三年之后我在不在阿里都不知道了 , 为什么是三年这样一个时期 ,因为当时那个光头哥的人说三年是我们流片的时间 。
对 , 所以似乎这件事情我们还有一定的差距 。 然后在这个问题上, 广幂就追问了俊暘的你觉得这个概率到底有多大 。
然后俊暘说 20% 可能都是乐观的 。 对 , 我觉得他相对会比较悲观一点 ,他甚至在担心这个 gap 中间的 gap 是在是否在变大 。在最后唐杰教授做类似层次总结的时候 ,他说他更期待的是类似刚才姚顺雨讲的那个故事 , 一群聪明的人敢冒险 , 然后更好的营商环境 , 然后希望越来越多人在一些偏笨的事情上做坚持 , 我们能够得到一些好的结果 , 这是唐
教授的一个期待 。 对 , 然后到这的话 , 就是今天整场论坛演讲加论坛基本结束了 。 然后最后一个环节本来是一个总结环节 ,但是意外的是 91 岁的张院士 , 我觉得做了一个非常非常精彩的总结 。
张钹寄语31:26
啊 ,他的这个这个这个观点叫超越语言模型通往可验可检验 AGI 之路 ,他似乎把我们上面聊到的很多事情做了一个更精炼的总结 。
当然张院士应该之前做过类似很多这样的演讲 , 可能很多观点也不是今天才有的 ,但是他把很多的东西变得更收束了 。
还有点个现实问题是张院士是最后一个发言 , 所以他的速记是最后发出来的 。 很多媒体在发稿的时候 ,他的速记还没有给到 , 所以很多媒体的文章里面并没有记录张院士到底聊了什么 。
我就稍微展开点点 , 一个观点似乎也不需要去论证 , 就是我们要从语言模型到 agent, 嗯 , 要做复杂环境下的复杂任务 。
对 ,LLM 到 agent, 从语言到行为 , 我也讲过很多次了 。 然后一个可执行可检验的 AGI 的定义到底是什么 ?
他觉得会有五大关键能力 。 第一呢 , 叫时空一致的多模态理解与落地 。他把多模态放在了第一位 ,并且加了很重要的一个形容词叫时空一致性 。
第二 , 可控的在线学习与适应 , 可控的在线学习与适应 。 第三 , 可验证的推理与长期规划执行 。
第四 , 可校准的反思语言认知 。 第五 , 跨任务的强泛化 。 这是他会认为今天这个时间点我们在未来一段时间要解决的问题 。
那如何去解决这些问题 ? 啊 , 张院士说可能有六个路径或者六个研究方向 。 第一 , 多模态 。 第二 , 具身与交互 。
第三 , 检索与证据落地 。 第四 , 结构化的知识对齐 。 第五 , 工具的执行与落地 。 第六 , 对齐与约束落地 。
然后分别这六件事情可能跟刚才说的那五件关键能力是有一定的对应关系的 。 然后这个问题再上升到一定高度 ,因为毕竟张院士是一个做学术研究 ,他会认为今天这个时间点 , 哲学层面 , 人工智能作为未来世界可能的主体存在 , 我们人类到底跟人工智能该如何相处 , 这个问题其实也是很多人探讨过问题 。他会认为有三层 , 第一层叫功能到行动
主体 , 就是 AI 有了功能 , 那其实今天我们已经达到了 ,并且在往上提升 。 第二层叫规范跟责任主体 , 就是它真的很强的时候 , 它的规范跟责任到底是什么样子 。
第三个是最最最科幻的那个想象 , 就是它真的有了意识 , 它有了所谓的体验 , 我们人类该如何与之相处 。
然后他会认为从这个角度去思考 , 从那个终局去思考来说 , 当务之急的事情还是对齐跟治理 , 最主要的治理不是治理阶级 ,而是治理人类 。
也就是今天这个时间点在做 AI 研究的跟大模型的相关的使用者 。 然后他最后提到了企业家 。 啊 , 这个其实我有点意外 ,他最后会提到企业家 。他说大模型之后我觉得最优秀的学生 ,他的学生都是搞人工智能 , 都应该去搞企业 ,因为人工智能跟企业家做了重新的定义 。AI 企业提供的不再是简单的产品跟服务 ,而是知识伦理和应用变成了可复用
的工具 , 这样造福全人类 。 目标是把人工智能变成水和电一样的通用技术 。 企业家是一个光荣而神圣的职业 , 人工智能时代的企业家必须担起新的社会责任 , 包括治理和实现普惠的可持续增长 。
这是新的使命 , 使得 AI 时代的企业家成为一个光荣跟神圣的职业 。 张院士最后把问题拔到了这个高度 , 这可能大概就是今天绝大部分现场论坛的内容 。
然后我做成 PPT, 大家有兴趣可以去下 。 然后在所做所做完所有这些整理之后, 然后我回看我今天做的记录 , 我发现我记录了一些很有意思的发言 , 这些发言都或多或少代表了这些今天这个时间点可能是世界上最优秀的 AI 相关的研究者跟创业者们在想的事情 。
散记35:22
我一个一个说 , 当然是一些偏零散的 tips。 第一个我记住了很深的一句话 ,是唐杰教授说的 ,他说今年可能是多模态的失意年, 就是 25 年 。
这个结论其实有点意外的 。 对 ,因为很多人会觉得多模态在 25 年发展很好 。 然后当时唐杰教授就是说除了 Nano 补 Nano 之外, 大家似乎并没有看到其他厂商在多模态上有非常强的进展 。他会认为这是多模态的失意年, 所以是从他的厂商的角度来看 。
那反过来讲 , 似乎如果厂商意识到这件事情 , 那 26 年多模态领域的竞争应该可想而知的会变得越来越激烈 。
第二 ,Kimi 杨植麟在他整篇演讲的最开始写 ,他说这一轮的 AI 的智能提升本质上来讲是能源到治理 , 所以他为什么会那么强调 token 的 ROI, 就是 token 的使用效率 , 就是在做的这个事情 。
然后第三句话是林俊暘说 ,他说今天大如果做大模型 , 如果不是为了全人类来做 , 就不要做了 。
我我完全没有想到一个 93 年的技术人员会以这样的方式去看待这件事情 , 十分钦佩 ,respect。 然后第四句话依然是林俊暘讲的 ,他说他们在期待千问在 2026 年可以做到三进三出 , 就是全模态模型 , 输入跟输出都是多模态的 。
嗯 , 我在去年做总结的时候 , 我说过这个这个如果以桌来去论论述 AI 的话 , 大家会说语言模型是一桌 , 多模态是一桌 , 可能 coding 是半桌 。
那似乎看上去在今天这个时间点 , 无论是 Google 的这个这个 Gemini 模型 , 还是千问今天所表达的这个状态 ,以及其他一些文档上在努力的方向 , 看上去语言多模态 coding 可能是一桌 ,而不是分开的三桌 。
对 , 然后下一句话叫吃的好了很多 。 对 , 这个是姚顺雨说的 。 现场广幂第一个问这个姚顺雨的问题其实是感觉怎么样 ,因为这是她第一次回国接受公开的这样的采访 , 然后她当时有点紧张 , 然后说了一个吃的好了很多 。
我觉得还是挺挺挺挺平和的一个人。 对 , 然后下一句话其实刚才前面提到 ,也是俊暘在回答哪个问题的时候说 ,他说那个他他们应该是在谈论巨头的分化的时候 , 林俊暘说了这样一句话 ,他说理论上我是不能评论公司的 ,但我觉得公司也不一定有那么多基因之分 , 一代一代的人可能就塑造了这些公司 , 比如今天顺雨到腾讯之后, 可能腾讯就变成了一个
有着顺雨基因的公司 。
当时现场大家都笑了 。 对 , 我觉得这一代的研究员跟这一代的这最年轻的企业家有一种特别怎么讲 , 特别云淡风轻 , 特别开玩笑 , 特别那样的状态 , 我觉得挺好的 。
对 , 然后啊 , 最后两句话是张院士说的 ,91 岁的张院士 ,他在总结陈词的时候 , 上来说的第一句话说我可能没资格来做这个总结 。
你要知道张院士是今天这个时间点整个中国人工智能行业最德高望重的那一位 ,他的学生遍布在各家头部的 AI 公司里 。
但是今天他说了这样一句话 ,他说当然他说这句话的逻辑是说可能他比如他听到前面很多嘉宾去讲很多新的问题 、 新的议题 、 很多年轻人的状态的时候 ,他会觉得他已经老了 。
但是今天这位 91 岁的院士 , 你现场看到他 , 你完全不会觉得那是一位 91 岁的老人, 特别特别有能量 , 特别特别强的状态 。
这个体现到哪 ? 就是最后一句话 ,他说我在听今天的下午的活动过程中, 还在中间的时候去修一室 , 改了他的最后的 PPT。
我当时听到这个时候我都惊了 , 就是
就是因为 91 岁的院士为了这样一场活动 ,在会议的中间听到很多人的新的内容去改他的 PPT, 你会觉得啊 , 就是特别的佩服 , 特别的 respect。
然后今天的活动整场听下来 , 你会觉得对中国的人工智能行业还是挺期待跟挺有信心的 。 呃 , 这些嘉宾其实的年纪跨度非常大
, 姚顺雨是 98 年的 , 然后林俊暘跟 Kimi 的创始人杨植麟是 93 年的 , 唐杰教授应该是 70 后吧 , 然后 MIVA 的创始人严俊杰应该是 80 后 。
然后
你会发现今天这些人可能在很多 AI 的工模型公司里面有很多 00 后, 嗯 , 这些人构成了 AI 行业的中国的群像 。
我会觉得我第一次的这么明显的感觉到这些人的群像的状态在今天的活动当中 。 然后再把问题扩扩一点是说 , 嗯 , 我本来参加活动就特别想表达与想把这些事情告诉大家 , 然后因为受限于我要去机场 , 我在机场没法录 , 我只能做内容 , 然后看到很多的在场的媒体朋友们在很快的时间就把速记发出来 , 然后你会有一些小小失落 ,
你说啊 , 我不是那个最早把这些内容跟信息传播给大家的人 ,但后来又想 , 我只是一个记录者 , 对吗 ?
我是司马迁 , 我只负责记录就好了 ,但在记录过程中我也会有我的倾向偏好跟想表达的东西 , 然后甚至包括这种方式是播客 ,是 PPT,是带着感情 , 带着一些别的东西的 。
我也似乎觉得今天这个时间点这些东西是有作用的 。 然后我刚才下飞机回来的路上, 专场上听这期四十二人精英采访 , 曲凯采访金剑 , 然后在最后结尾的时候 , 那个曲凯问张金剑未来三年有什么这个这个建议 。
金剑说随着 AI 能力的越来越提升 , 人类已经越来越难去伪装跟掩饰什么了 , 所以做真那个双引号的真可能是唯一的出路 。
对 , 这也是我今天想表达的一些东西 , 可能有些零散 ,有些临时 ,有些不成体系 ,但我觉得我很想在最短的时间把这些东西告诉大家 。
然后感谢大家收听我的播客 , 然后我的 PPT 在 shownotes 里 , 如果需要可以去下 。 当然我说了这是 notebook 做了大部分工作 , 我做了小部分工作 。
对 , 然后再预告一下,1 月底不出 AI 的话 , 应该 1 月底或 2 月初的时候我会再更新一版 , 应该超过 150 页的 PPT 吧 , 然后全部推翻去年 11 月份做的内容 。
嗯 , 对 , 感谢大家 。 我去睡觉了 , 啊不 , 我要去剪辑 , 然后写 shownotes。 大家听到的时候应该已经应该是凌晨了 。
感谢
。






