Vol.71 简单聊聊GPT5和美国电力---with 刘一鸣/101 Weekly

GPT5发布0:00

刘一鸣0:07

您、您觉得就是因、因为之前那个不是，呃，就是有那个 Aria，她之前，哎，那个 Ilya，哎，sorry，就是她之前不是发了一个东西，说这个遇到了一些撞墙嘛，然后可能是数据上的问题，就是数据训练上的问题，不够了。

然后这次其实您觉得整体发布的这个效果怎么样？就是这个撞墙这个逻辑是否依然存在？

庄明浩0:29

就是 Ilya 发其实是 24 年 9 月嘛，就是其实已经是一年之前的事情了。那过去一年，强化学习的发展是比很多人想的要快的，或者说，呃，强化学习这件事情在模型的预训练和后训练过程中的权重的提升，是比很多人想的要大得多得多得多。

那强化学习可能最开始大家会认为是只能在后训练的结果里面提升效率，但是现在发现，在预训练里面，包括可能基于已经训练好的模型的合成数据的再一次的喂给模型的预训练的，对于模型的提升这件事情，也出现了一些探讨跟可见的效果。

所以它变成了一个类似我们金庸小说里讲 " 两脚踢云纵 " 的过程，就是但凡一件事情能够形成类似踢云纵，就左脚踩右脚，就飞上去这个状态之后，很多事情发展就很快。

包括这一次 GPT5 发的时候，你会发现其实，呃，虽然它没有公开技术的实施的细节，跟它训练的过程，包括参数这些东西，但是你从它现在在推的几个重点在讲的方向，数学、编程、包括医疗，其实这几个板块都是明确的有强化学习能够提升模型效果的板块。

那它为什么会强化学习，也就是因为这些东西在这些事情上见到了效果。所以这条路径可能是某种程度上来说，缓解了 Ilya 之前说的那个最开始的那个问题。

但是确实，纯、纯粹意义上，今天这个时间点，公开、公开，呃，网络世界也好，现实世界也好，能够拿到的原始数据的这个这个事情，包括这个数据的再加工、再标注，可能这个事情确实已经边界效率非常非常差了。

可是为什么我今天上午看是谁啊，是 Scale 还是哪一个做数据标注公司的核心公司，发了一篇文章是说，为什么在这个时间点，大家都认为，呃，早期的数据标注跟数据的采集这件事情已经不重要的情况下，这几家做数据标注公司依然，呃，发展得非常非常快速。

大家会发现，就刚才我们讲，在强化学习这个板块里面，呃，数据的采集、清理加标注变得更加复杂了，然后变得更难，甚至我们要重新去创造一些世界上可能没有的数据，来去让模型在某些特定场景的能力的提升。

那这件事情的挑战确实比原来我们最开始预训练的这个这个路径，最开始直接把现成数据拿过来这件事情，要难得太多了。

所以你说 Ilya 说错，我觉得 Ilya 没有说错，呃，只不过这过去这一年时间里面，我们找到了另外一条路径去把这个事情的效果跟可能达到的里程碑列出来了，并且，呃，几乎回顾这一年所有的这些头部模型的发布，跟他们所在这个拿分拿得比较高的这个板块里面，都符合了刚才我们讲的这个逻辑。DeepSeek 也好，千问也好，呃，Llama 也好，Google 的也好

，Google 可能不太一样，Anthropic 也好，包括 AI 自己这次 GPT5，我觉得都是符合这个逻辑的。

推理主导趋势3:23

刘一鸣3:23

嗯，哎，就是最近整体还是从这个 AI 的训练，就算力啊，对于算力来说，整体是往 AI 的训练、往推理方向转嘛。

那其实，呃，这次 GPT5 的这个是不是仍然在符合这个趋势，就是在就未来会延续这个推理主导的这种模式？

庄明浩3:42

我觉得会的，因为就是从最早的纯 base model，就基础模型到推理模型这一步，然后再加上，呃，模型本身尺寸的变大，然后可能再加上数据的变复杂，包括合成数据乱七八糟，就这几个因素本身来讲，最后都推导出了你刚才那个问题，就是在训练、在推理、在，呃，应用这个这个这个 token 这件事情上的变大，而且是一种，呃，层级、级数，就指

数级的变化。就是跟那个原来那个那个那个 IT 行业不是有摩尔定律嘛，就是硬件会每以百分之、呃，18 个月提升一倍的方式去提升嘛，然后但是同样不是有那个安迪摩尔定律嘛，就是，呃，软件的消耗也会把这个硬件的能力消耗掉。

那今天这个时间点，你会发现在大模型的这个训练这个板块跟推理这个板块也符合这个逻辑，就是 token 的，呃，单位成本的降低确实是按每差不多 12 个月再降一个量级，可是 token 的消耗跟所需要的这些算力的提升，也差不多是按每 12 个月提升一个指数的方式在提升，所以它就它就配上了嘛。

刘一鸣4:49

对，哎，那就是，呃，推、推理的这个 token 的增长跟算力的需求是线性吗？还是说就比如说 token 的这个推理的 token 增长 10 倍，那对算力的这个需求也是 10 倍吗？

还是说会更高于 10 倍？

庄明浩5:03

这个具体我我没有那么强的这个这个感觉，但是我觉得就是这个可能不仅仅是算力，还包括时间，就是这这里面衡量的这个这个这个，我们叫这个坐标轴，变得复杂了。

就是算力也好，时间也好，然后，呃，单次单次的这个这个所消耗的成本也好，它变成一个可能不是一个单、叫叫叫单元方程的能够解的一个一个一个数据了，它变成它它可能就没办法是用线性的方式来做了。

企业级应用5:34

刘一鸣5:34

明白，对，哎，其实就是这一次这个 GPT5 整体发布，其实有点不及预期。那就是，以及就是它这次好像我我我感觉 OpenAI 是非常强调企业级的应用，就是这些其实是不是，嗯，但但就是，呃，是不是因为比如 2C 的这个可能大家的这种付费不够，就它的利润不够高，以至于就其实支撑不了他们现在这么大规模的这个 AI 的 CapEx，然后所以它要更多的

往企业级方向去强调？

庄明浩6:03

这个我没记错应该是 Q2 的时候，OpenAI 还是 Info、呃，Information 发过一个 OpenAI 未来可能到 25，呃，不，到 28 年左右的那个收入预期的增长嘛。其实确实它会增加几块，就是如果我们都算 2B、2C 来算，那确实增加比较多的，就边缘效应增加多的肯定还是 2B 这个嘛。

因为 2C 基本上你是可以衡量出来用户的增长曲线，虽然这个用户增长曲线，呃，还很快，对吧，就是年初可能周活是我没记错 3 亿还是 4 亿，前两天 OpenAI 的 Sam 说已经到了 7 亿，对吧，然后那 GPT5 发的时候它这个数字还会涨，但是你毕竟这个数字是有一个，比如你要乘转化率，然后转化率再乘以 20 还是 200 美金一个月的这个这个数字，它那

个数字是一个，呃，你很难从，呃，指数级增长去要求这个数据了，因为它已经很大量了，对吧，周活已经 7 个亿了，你说能周活能跑到，就大家之前不是说这个这个问 Sam 到底是要一个 11 月、11 日活的东西，还是要 AGI，他说都要，但是更倾向于要 11 日活。

那哪怕到了 11 日活，你去乘以转化率，再乘以单位的 up，其实这个数字也是算得出来的，但是这个数字跟我们上一期聊到的，无论是 CapEx 的投入、算力的投入，还是它其他成本的这个投入来讲，这个数字确实不够，所以它只能从 2B 这个战场找可能的增量跟边际效应，就是增长更快的这个趋势。

所以从这个角度来，从这个角度来说，呃，它确实需要，包括它它去年还是今年年初成立那个专门的做 2B 的实施的企业内部实施的那个类似咨询的 team，然后包括最近跟政府签很大的单，当然头部的几家模型公司都跟美国政府签了很大的单子，然后做这些事情，就是确实如此。

但是我还是会觉得，呃，这一届的 GPT5 在很在纯从，呃，产品功能跟这个体验层面还是做了一些事情的，就是减少幻觉也好，路由也好，然后去掉那个谄媚的那个东西也好，包括一些更细化的工程上的实现，它还是在，我觉得主对于 OpenAI 或者对于 Sam 来讲，主线还是这个 2C 的这个战场，但是确实它为了要把收入拉起来，它它别的战场也需要比

较，就是边界上它要付出更多的努力。

刘一鸣8:10

嗯。

庄明浩8:10

而且又因为 2B 的战场里竞争对手太强了，对吧，或者说这个这个打得太过激烈，Anthropic 就是你可以理解就是在 2B，尤其是企业服务跟编程这个板块，就把 OpenAI 打得很痛，对吧，然后那云厂商本来就在这个战场里面，在 2B 的战场占据了一个很重要的位置，所以那就倒逼着 OpenAI 跟 Sam 在这个战场就需要付出更多的努力，才可能达到一个不错的效果。

规模法则延续8:36

刘一鸣8:36

嗯，目前来看，那 GPT5 这个 Scaling Law 还能继续延续吗？

庄明浩8:43

就是我觉得今天 Scaling Law 也变成一个宽泛意义上的 Scaling Law 了，对吧，就是这不单纯只是最早的预训练的数据的投喂的 Scaling Law，对吧，包括后训练，包括强化学习，很多这些事情都会。

那我觉得这条路径至少在截止到 24 年可能 Q3 这个时间点，依然还是奏效的，或者说头部模型几家厂商在肉眼可见的中短期的研发路径跟阶段性里程碑，跟想达到的那个效果，以及为这个效果的实施路径是比较清楚的，就是还是沿着这条路在走的，只不过下一个节点会是什么，那就不知道。

然后我们再去回头看，你看当年这个 OpenAI 提出从这个这个 ChatBot 到推理到 Agent，那大家在在 Agent，那 Agent 再往后一步是组织者吧，我没记错的话，就是它要把各种各样能力组织起来，变成一个组织的方式，最后一步是创新嘛。

那如果这个路径还是，就这个行业还是延续 OpenAI 之前定义的方式往前走的话，那似乎我们在这个节点还是在保证 Agent 这件事情的能力的提升。

所以你看其实这这次 GPT5 的发布，呃，从底层角度来讲，呃，GPT5 在越来越强调比如说工具的应用，然后满足任务的提升的能力，包括任务能够完成多长的任务，任务的成功率，它在做这些努力，那确实就符合我们讲 L3 这个板块的要求。

那再往后到 L4 是因为什么走到一个 L4，我们现在也不知道呀，对吧，或者说可能最最最头部的公司可能内部在试，但是试什么，试的方向跟努力的东西是什么，对于我们这些外人来讲可能没有办法知道。

刘一鸣10:21

嗯，明白，对，然后我们聊聊对电力的需求，就是其实最近这个 GEV 啊，还有就是好多这种电力股，最近我感觉涨得甚至比英伟达的这个幅度都要高，然后当然它背后的逻辑就是像 GEV 它特别强，强于就是那个蒸汽燃机嘛，然后这个东西，这个东西它的那个需求量好像它的订单已经排到 29 年了，然后并且它的它那个算好像

美国电力需求10:21

刘一鸣10:44

是很容易算出来它的这个利润什么的，因为美国的电价又是一个浮动的市场化的，就是其实您怎么看，就是嗯，就是这一波对电力的需求，因因为其实你看像 4 月份，其实当时很多这些股票是大跌了一次，然后就我感觉当时应该是还没有形成共识，但是到后面很快这个共识就立刻建起来，然后立刻暴涨，然后这个逻辑你觉得能可以可以可以可以

，我们可以先复盘，比如说就是今年可能整体的这个对电力需求的这个状态是一个怎么怎么样的。

庄明浩11:14

就是我觉得跟那个就是跟那个 NVIDIA 的那个走势有点像，包括这一波的就是科技股的，其实三四月还是四五月的时候，大家对整个的，呃，市场是非常非常悲观的嘛，其实有一波非常跌得非常厉害，包括那一波电力其实，但反过来讲其实，呃，我没记错的话，去年 24 年的 Q3 截止到 Q3，24 年截止到 Q3，我们看整个标普 500 所有细分品类的股票增长

，基础设施能源类应该是排第一的，它甚至比 IT 跟科技还要排在前面，在 Q3 的时候，那 Q4 又跌下去了，然后又因为 1 月跟 2 月有了 DeepSeek 事件之后，这个事情就持续的有一些探讨跟争论，然后拐点出现在可能就是大家认为 Agent 也好，强化学习也好，呃，业界对于，呃，包括整个 Q2 这几家头部公司的财报表现非常好，尤其在应用层，在用户拓展层

，在收入利润层，包括在云的收入增长这个角度来讲都非常好，所以直接把那个就相当于它从一个，呃，不是特别好到悲观，然后瞬间扭转到一个正向的状态里，所以就拉回来了。

然后又因为我觉得可能到了某种程度上的临界点，当然我们不是专业研究这个能源的，就是美国的电力的这个系统，包括这个美国电力的供电的这个稳定程度，然后它电能的电量，包括各种类型电力的提供的这个占比这件事情，呃，配着今天这个时间点可能已经延续了两到三年的数据中心的 CapEx 的投入，可能到了临界点变成了就是它真的开始影响电力整

个系统的稳定性也好，容量也好，甚至包括影响民用的这个东西，又因为它是市场化，它它跟价格又相关，所有这些事情它可能到了一个临界点之后，它就被拉成一个新的状态，就是原来这些东西真的是要，甚至你看今天有很多新闻，原来过去几年谈论大家很多很多什么锈带，就是那几家那几个已经已经腐朽的传统工业城市，又因为建核

电厂也好，建各种各样的电力设施也好，又重新被拉到视野当中，当然你说这个事情对于那些当地的居民来讲是好是坏是没人知道，但是纯从一个我们从一个上帝视角，或者说纯行业的分析角度来讲，为什么那些不被关注的，已经大家消失在大家讨论过程中的城市又被拉起来，就是因为确实可能到了一个临界点之后，它需要更新的更多的来维

持这个重大的 CapEx 投入，因为本身来讲这个 CapEx 的投入的预期已经变成了可能真的会拉到 29 甚至 30 年的预期，然后从现在可能一个季度这几家头部公司是 1000 亿美金体量，拉到可能我那天看大摩讲到 29 年还是哪一年，每年是要 3 万亿美金的投入，就变成一个季度可能要大几千万美金，就距离今天可能还要再翻几番，那你想嘛，今天这个时间点已经

到了逼着电力系统做出改变的这个情况，那如果这个事情再翻几番，那可能甚至今天这个时间点，美国整个的电力生态要被重新写一遍，那那如果是这样一个趋势的话，那当然这几家头部公司的价值就要重新去算了，所以我觉得逻辑上应该是这样，当然我们不是这个能源专家，我们只是纯盘逻辑，对吧，我们不不知道具体的这些数

据是否真到了临界点，是否到了百分之多少，要去做什么样改变，但是我们知道那个 CapEx 的那个事情，然后我们也知道你像前两天有张图转的很多，就是 ChatGPT 发布之后，美国的 Cap 就是数据中心的那个建设的那个曲线，对应美国的那个办公室的那个建设曲线的那两条曲线，就非常明显，就一个跌得差不多，一个是疯狂拉，两个曲线已经交交得差不

多了，那甚至再过一段时间就超过去了，那就是建设中心已经超过大家去建办公室了，那对吧，那那如果这个趋势依然再延续下去个三年，那对吧，那很多事情真的就就很可怕了。

刘一鸣14:58

嗯，对，我特别是川普好像他，我我感觉现在美国版的这个就电力的这个整体应该算是美国版的大基建的这个感觉，对吧，因为他电力好像不，因为他不只是数据中心，就是只要建个电厂就结束了，他其实对于整个电网的这个就是电网能力啊，然后包括很多变压器，包括很多辅助的这些东西，其实现在好像都有很大的瓶颈。

庄明浩15:17

所以所以其实生产电，呃，传输电，配电，其实都会变成非常非常大的变化，就建电厂只是生产电这个环节嘛，那还有传输跟配电呢，那传输跟配电涉及的很多上市公司就变成刚才你说那些公司了嘛。

刘一鸣15:36

嗯，对，没错，对，然后反反反正我我我觉得这一轮这个这个我我昨天还跟几个经营经理聊，他们他们在中国也在看相关的电力股，只不过中国的这个电力可能就不够美国那么弹性，就是所以它肯定涨幅是有限的，但是就是本身这个电力现在大家都是在疯狂的干这个，然后就是从美国角度来说，就是电力它还有一个很大的影响，就是就是美国

原来电网是不是比较弱，就它整体是很脆弱的，对不对，就是因因为它。

庄明浩16:06

有些地方应该是很脆弱的，嗯，就有一些因为因为美国各个州之间的这个经济跟这个相对应的这个电网的这个状态是不太一样的，所以有些州可能会重新需要去设计，那反过来讲，你原来可能弱，没准今天可能变成一个好处，就是你底子薄，那你可能改善的这个这个这个空间变得更大了嘛，对吧。

刘一鸣16:29

嗯，嗯，对，对，好呀，哎，那个对，您觉得对电力这一块还有没有什么补充可以聊的，就是反正我我我看了 GEV 的那些就是首次复盘报告啊什么的，然后我我可能会介绍介绍这个公司，然后对这个公司的业务做一些介绍，然后它真的什么都做，它它有蒸汽燃机，呃，蒸汽轮机，然后还有那个就是这个就是天然气发电嘛，然后还有就是

SMR 它它也有有投资做，然后所以它基本上把电力的相关概念全部都占了，然后它它也有水力发电，也有什么，就基本上所有的发电形式它全有。

庄明浩17:06

我我可能没有，因为还是问题是咱不是那个能源方面，我觉得咱们还今天这点从逻辑跟我们已知的这个 AI 的需求角度来讲去往前推嘛。

结束17:15

刘一鸣17:15

嗯，嗯，嗯，嗯，好呀，那我们今天先就聊这么多，然后下回那个对，再有什么新新选题我再找明浩明浩老师，今天主要 GPT5 这个结论太不太给力，对。

庄明浩17:28

哈哈哈，不太值得单说，哈哈哈。

刘一鸣17:31

对，是，对，我们可能也会，他们也会做一个就是呈现，可能会聊一些人，然后做一个那个就是对这个 GPT5 整体的一个复盘，但感觉就是它，我感觉它对算力啊，对什么其他的领域其实嗯，感觉没有那么大的影响，然后昨天那个其实你看什么英伟达这些也没有出现太多的变化，反而那些算力，就是有些算力租赁公司倒是暴涨了一下，但那个好像是跟某几家

公司的财报有关，倒跟这个 GPT5 也没有太大关系。

庄明浩17:56

嗯，是。

刘一鸣17:58

对，好呀，好，谢谢明明浩老师，嗯。

庄明浩18:02

好，感谢感谢。

刘一鸣18:03

好，好，拜拜。

庄明浩18:06

拜

。