引言0:00
今天我演讲的标题叫 《 说好的艺术家呢 》。 呃 , 这句话不是我说的 ,是我一位非常喜欢的播客的作者 , 重轻 ,他在一期播客里 —— 他那期播客是聊这个 , 呃 , 唐汉潇这个歌手 , 就是唱 《 哪吒 》 那个电影主题曲的那位歌手 。
这位歌手此前一直 ,其实很多年一直在做电影的 BGM, 然后他们在聊的过程中经常聊到这个作 - 作为乙方 , 这个这个 , 给甲方做歌的时候的一些问题 。
然后重轻吐槽了一句说 :" 说好的艺术家呢 "。 然后我把这句话也放在今天我们讲 AI 的事情上 。
呃 ,AI 今天这个实验点对内容行业影响 , 我不需要多说什么 , 大家已经看到了非常多的变化 。 然后我起了一个副的小标题 , 叫 《AI 时代内容工业的三次死亡与创作者的重生 》。
呃 , 每个关键词可能都值得展开 : 什么是内容工业 , 为什么是三次 , 创作者又是什么 , 那为什么我要讲重生 。
我们正式开始今天的内容 。 呃 , 首先我先说一个时间点 , 这个时间点可能很多人很多人没有意识到 。 先看这个 , 这有一篇文章是我们我做 VC 行业 , 呃 , 美国最好的 VC 叫红杉 ,他在 2022 年的 9 月 19 号发布了一篇文章 , 叫 《 生成式 AI 创造一个新的世界 》。
呃 , 我们这个业界的人会认为 , 这篇文章开始定义了这一轮 AI 的发展 。 可是大家我为什么会记这个时间啊 , 这篇文章它是他们所有人跟 GPT-3 一起写的 。
如果了解行业的话 , 你会知道 , 大家所熟知的 ChatGPT 是基于 GPT-3.5 的 。 也就是说 , 这篇文章发布的时候 ,ChatGPT 还没有发布 ,22 年的 9 月 19 号 , 对吧 , 所以才在那个时候就定义了 , 说生成式 AI 其实是这一轮的开始 ,而不是我们现在聊的大模型 。
所以他会在那个时候开始聊未来的预期 , 比如说从 2020 年到 22 年到 23 年、24 年、25 年、2027 年, 这些年, 每年的比如说文本会经历什么样的变化 ,Code 会经历什么样的变化 , 图片会经历什么样的变化 ,Video 3D 跟 Gaming 会经历什么样的变化 。
我们不需要去看那些细节啊 , 这个分类本身 , 你回想过去几年整个行业的发展 , 基本上是沿着这个模态的发展来发展的 。
所以这个时间点为什么是重要的呢 ?2022 年的 11 月 30 号 , 真正意义上定义这一轮 AI 发展的 ChatGPT 才发布 。
可是如果大家了解 , 比如 AI 生成图片的话 ,AI 生成图片真正进入到大家讨论 ,是因为一个开源的图片模型达到了可用的效果 。
当时那个模型叫 Stable Diffusion, 它的 1.5 这个版本 , 真正意义上让大家认为潘多拉魔盒被打开了 。 而 Stable Diffusion 的发布时间 ,其实也早于 ChatGPT。
所以在那个时候 , 你会发现红杉就开始写报告 ,他会定义我们刚才说的 text、code、image、speech, 就是语音 、Video 3D 跟其他这个板块 , 可能我们已经看到了什么 , 跟未来会出现什么 。
甚至在那个时候去画行业地图的时候 , 我们已经开始用这种方式来对 AI 行业的发展进行定义了 。 所以 AI 跟内容的结合 ,是在那个时候就开始在这一轮显现出非常非常不一样的状态 。
然后我在做的过程中又加了一页 , 然后我说为什么我们的小标题写 , 我说是内容行业的三次死亡 。
我回想了一下 ,因为我的工作习惯 , 我每隔一段时间会做很多行业的总结 , 然后关于 AI 行业这个总结 , 过去可能我可能过去一年多做了六七次吧 。
然后我回看我的 PPT,其实大部分 PPT, 我的章节结构基本都是三章加一个 plus。 当时我在去年 9 月份讲的时候 ,是讲推理场景投资 , 去年年终讲的是技术产品资本 , 然后去年年终总结 , 美国跟中国也是按技术产品资本来去划分的 。
所以我会突然间意识到 , 哦 , 我来今天讲 AI 内容的时候 ,其实也可以按照这个结构来做 。 所以我的三次死亡分别对应技术层面的死亡 、 产品跟产业层面的死亡 、 跟资本层面的死亡 。
这页是我在做完整个 PPT 之后回头去加的 , 我开始意识到这可能是我的一种工作习惯 。 好 , 我们正式开始 。
呃 , 内容工业的三次死亡 : 素材 , 呃 , 素材之死 , 流程之死 , 版权之死 , 分别对应刚才我们三个讲了技术 、 产品跟产业 ,以及资本层面的考量 。
我们一个一个来看 。 技术层面的素材之死 , 这可能是我们肉眼可见在这个时间点最容易理解的一个层面 , 所以它是技术层面的 。
素材之死4:28
呃 , 这是我截的两张知名的影视 , 那个 UP 主影视飓风在去年, 啊 , 今年的一个视频 。他为了这个视频讲的更多 , 还是他为一个 , 呃 , 云南那边的可能脑子有点急 ,有患了一个比较严重疾病的乐队的鼓手跟主唱做的一个视频 。
但是他在那个视频过程中用了一个镜头 ,是讲这个赛博空间的火车穿越的 。 然后他在用这个镜头去对比的时候 , 就是对比过去几年 AI 的影视行业的内容发展到现在的状态 。他当时这一帧我印象特别深刻 ,他先其实只放了其中一个屏幕 ,他说 :" 这是我今天用很短的时间 , 一个很简单的提示词就可以做出来的效果 。"
大家可能会发现他又会有一些瑕疵 ,但是视频如果是这样的呢 ? 他的屏幕大概出现了几十个这样的画面 , 然后大家的评论就变成了那个样子 , 细思恐极 , 对吧 。
甚至今天这个时间点 ,他们最近做了一个视频 , 已经去让他们特效师很难去分辨到底什么样的视频是 AI 做而真人来做的 。
所以似乎看上去 , 一句话生成某某某的东西 ,在今天看起来已经不是什么门槛了 , 甚至很容易实现了 。
行业里刚才我们说过 ,他们叫这个事情叫多模态 ,也就是说我们常规可划分的文本 、 图片 、 视频 、 语音 、3D, 这个按模态来划分 , 叫多模态 。
大家提到提到这个 , 然后你看 , 这是我截图一个做 AI 的这个视频模 , 啊 , 各种各样模型打分的网站 , 它的分栏里就分了刚才我们说的图片 、Video、 语音 、music, 然后我我截了一张应该是图片模型的搒单 。
你会发现我们看到了非常多我们非常熟悉的公司 : 字节 、 阿里 、 昆仑 、 可灵就是快手 , 对吧 , 然后 Google、OpenAI。
我可以再往下截 , 你会看到更多各样的公司 。 这些公司在过去这一段时间 , 从你看发布时间 , 最后一栏是发布时间 ,在疯狂的更新他们在模型能力上的进展 。
而且可能今天这个时间点 , 多模态领域是目前整个 AI 模型里竞争最激烈的板块之一 。 然后这是一个我去截的时间段 , 这个我经常说 , 这个面对一次一次的模型进展 , 我会深深的感受到人类真的一直一败涂地 。
我们先看图片模型啊 , 图片模型在 20, 我刚才说过 ,在 2022 年的时候 ,其实它就已经兴起了 。 然后在那个时候 ,有一张非常有名的照片 , 是一个 , 呃 , 一个一个人去参加了一个照片的那个选拔比赛 , 夺得冠军的照片 ,但那张照片后来证明是 AI 生成的 。
那是第一次引发关于这些的讨论 , 那是 22 年 。 然后你会发现 , 进入到近两年之后, 这个事情发展的更快了 。
比如上面这张 , 第二张图是 25 年 3 月份 GPT-4o 发布的时候 , 大家有印象的话应该会记得 , 那一波关于所谓这个吉卜力风格的照片风靡整个全网 , 我后面会讲到 。
然后到 25 年 8 月份 ,Google 发了 Nano Banana, 然后这是我朋友 ,也是大内蕴涵的主播 , 象征自己做的测试 ,他让 Nano Banana 一句话生成宫门武藏在白板上的样子 。
这是模仿著名的漫画家的漫画作品 , 然后他把这张图发在小红书上 ,因为象征本身是学画画的 , 没有任何人怀疑到这是 AI 画的 。
然后到今年 4 月份 Image 2 出现的时候 , 这是我的一位朋友蓝心老师做的一个 , 用这个 EVA 的照片做了一个游戏的截图 ,也是一句话生成的 。
就是在图片这个板块 , 我觉得人类几乎已经一败涂地了 。 这是目前这个时间点 ,其实已经被市场淘汰的模型 Grok, 就是马斯克的那个模型 ,在视频领域能够做到的效果 。
对 , 这个模型已经被淘汰了 ,但是它现在可以做到这个效果 。 那我还没有列今天这个时间点 , 刚才我们在搒单上, 你要知道 Grok 并没有出现在刚才前面那张搒单上, 对吗 ?
所以那我们再看今天这个时间点 , 呃 , 可能我们国人最熟悉的两家最头部的视频模型厂商 ,他们到底在做什么 。
我去他们的官网跟各种各样的公众号找了一下 ,他们在最新这个版本上在干什么 。 比如说可灵在推多模态的统一输入跟输出 , 什么意思 ?
输入的内容原来是你只能从文本到视频 , 或者文本到图片 , 或者是图片到视频 , 或者图片到图片 , 它是单对单的 ,但它现在在做的是多模态进 、 多模态出 、 分镜 、 画面的同音化同步 。
刚才那个也是音化同步的哦 , 主题的一致性 , 如果有一个主人公 ,他要在每个画面都一样 , 原生 4K, 团队协作 。
我不要红了 , 会不会讲到 。 然后 seedance 2.0,也就是字节的视频模型在做什么 ? 物理世界的真实感 、 长视频的稳定性 、 文本的渲染 , 它都开始盯文本了 。
也就是说你说一段话 , 或者图片上有一些文字 , 它要做文字的准确性 。 多语言文化的适配 , 多语言只是翻译 , 文化就复杂了 。
提示词的精确度 、 动态生成 , 我同样不要红 , 后面会讲到 。 你你看到这些关键词 , 你就知道他们在干嘛 ,他们已经在研究这些事情了 , 对吧 ?
如果这些事情真的被他们研究到很深 , 那会变成什么样子呢 ? 这个市场非常的大 , 所以就出现了一个情况 。
又因为可能中国在过去几年, 短视频行业的发展非常的迅速 , 所以在这个战场里 , 更多的是中国厂商在做 。
美国就主要两家厂商 , 刚才我说 Grok 已经不太做了 , 现在只有 Google、Demand 还在做 ,但中国百花齐放 。 除了刚才我们提到的字节 、 可灵 、 呃 ,Pixverse、Skyreels、 昆仑的 、Hydream、Sun AI、Vidu、 海螺是那个 Mini Max, 快乐小马莎里的 , 这里有巨头 ,有初创公司 。
我这只列了一部分啊 ,不完全 , 可能还有 。在这个板块里 , 可能这个领域的前 20 名公司都非常强 。 然后再往下眼镜 , 刚才我们说 seedance 的最后一项叫什么 ?
叫动态生成 。 我们看那个视频啊 , 那个视频是生成的 , 什么意思呢 ? 他原来这个人是站在一个菜市场前面 , 底下给你设置了按钮 ,其实这个按钮是可以用提示词生成的 。
你让他走到马铃薯那个地方 , 输入提示词 ,他就走过去了 , 懂吗 ? 动态生成 。 这个事情再往前眼镜 , 可能就引发了过去这可能大半年时间 , 整个业界更热门的一个话题 , 这个名词叫世界模型 world model。
你可能在很多新闻里 , 尤其最近一段时间 , 听到非常多的关于这个这个这个词的描写 , 然后非常多的公司在最近拿了非常多的钱 。
然后这个图就是 Google Demand 在在在在做的样子 ,也就是说动态生成 。 所以你会发现 , 今天这个时间点 , 做自动驾驶的公司在讲世界模型 , 做车的公司在讲世界模型 , 做视频模型的公司在讲世界模型 ,也有纯做世界模型的厂商也在讲世界模型 。
然后讲这里面 ,在这里面比较有名的有几位 ,其实有一有一名非常有名 , 就是李飞飞老师 ,他其实他的创业公司也在做世界模型 。他前两天写了一篇文章 , 把今天这个时间点已经被滥用的世界模型分类 。
我觉得做学问的人真的非常厉害 , 就特别擅长做分类跟总结 , 写得非常的清楚 。他会认为今天这个时间点 ,有三类模型公司都叫世界模型 ,但是三类公司做的事情不太一样 。
第一类公司做的叫渲染器 , 就第一排 ,他更多在做的是视频的事情 ,也就是让大家看到一个东西在运转 , 渲染 , 它主要是针对眼睛的 。
第二个模拟 , 模拟所谓世界的物理规则 。 我推一个东西 , 它会往前滚 ; 我推一个圆形 , 它会滚得很远 ; 推一个方形 , 它只能动一下, 这个叫模拟 。
最后计划 , 你听到这的时候 , 你会明显感觉 , 为什么今天这个时间点的具身智能公司跟自动驾驶公司也要做世界模型 ,因为是为他们做的 。
所以今天这个时间点 , 可能业界相对比较显眼的一个关键词是世界模型 。 那这个事情再往前想 , 如果啊 , 如果世界模型真的做到了某种程度的话 , 我们到底将面对什么 ?
我第一章的标题叫素材之死 。 我举个很简单的例子 , 比如说我今天我要做一个 3D 的游戏 , 我这个游戏里有这样一个这一杯咖啡 , 我是需要在我的 3D 软件里把这杯咖啡做出来的 。
我需要抠很多很多个小时, 这个素材才能被做出来 , 然后它可以放在这里 , 可以放在这里 , 它可以转起来 , 它可以被推动 , 对吗 ?
这个叫素材 。 但是如果这个世界模型真的到了刚才我们说的比较成熟的阶段的话 , 这个唯物的事情不需要了 , 唯心就可以了 , 对吧 ?
素材之死 。 我们进入第二 , 应该是第二章了吧 。 产业层面我们再看第二个字词 , 流程之死 。 我不知道大家是否看短剧啊 , 我在做这些 PPT 的时候差点笑出来 。
流程之死13:26
就今天这个时间 , 短剧行业可能 80% 甚至 90% 的饭盒被字节的红果拿走了 。 我去拿红果的 APP 的截图 , 这些截图就是红果在 APP store 上的截图 。
你发现特点了吗 ? 全部都是数字 , 播放量 、 点击量 ,是吧 ? 这个热度值 , 这真的字节不会是一家这个做数据导向的公司 , 对吧 ?
它的 APP 的界面 、 推荐图 , 全部都是数字 。 然后你发现今天这个时间点 , 可以被放在红果首页推荐图上的短剧的播放量要到 20 亿次 , 中国才多少人呢 , 对吗 ?
但是呢 ,其实短剧也不是今天才火的 , 短剧经历了很多很多年的发展 , 大概已经有五四五年的发展 。
那最开始的时候 , 可能是以真人付费 , 这一波短剧是以真人付费短剧为主的 ,22 年左右 , 当时的代表叫无双 , 当时还是以付费为主的 。
后来开始进入真人的免费短剧 , 大概在 24 年左右 , 然后在 25 年开始有一波中间态的形成 , 叫 AI 慢剧 ,因为那个时候视频模型的能力不够 ,不能做真人, 或者不太能够做真人。
所以那个时候开始做漫画 , 或者动态漫 。 然后到今年,seedance 2.0 以及可灵 3 出现之后, 这个行业突然间开始做真人剧了 , 就是过去几个月发生的事情 。
但即便是这样 ,在从所谓的动态慢到真人剧 , 这大概大大概 9 到 10 个月的时间里面 , 这个行业也经历了好几轮的变化 。
最开始因为还是那个问题 , 视频能力不够 , 所以那个时候可我们看到了很多表情包跟沙雕漫 , 就是可能是一个静态的 , 对吧 ?
然后开始有动态漫 , 像翻 PPT 一样 , 比 PPT 加一点动画 , 到开始有动画漫 , 它动起来了 。 到现在我们看到的叫仿真人漫 , 甚至是 AI 跟真人一起拍的内容 , 这个行业在过去的大概 10 个月时间经历了这样的发展过程 , 才让这个事情走到现在 。
但是我还说刚才红果是一个数据导向 ,但数据是不会骗人的 。 比如说 , 呃 ,Tom 我的一个好友 , 然后他说这个这个 ,他举了一个数字啊 , 就是中国去年的电影票房是 500 多亿 , 一天大概 1.4 个亿 , 然后短剧现在是每天 3.5 亿 , 这个数字今天可能已经 4 个亿了 。
真人短剧 2 个亿 ,AI 短剧 1.5 个亿
, 现在的短剧市场已经是电影市场的快 3 倍了 。 然后你要知道 , 小红就是 Manus 创始人曾经说过 , 直播是个好生意 , 直播的收入据说已经大于游戏了 。
这是在 24 年底发生的事情 ,24 年底的时候 , 回看整个 24 年, 我再说 24 年啊 , 今天已经 26 年,24 年短剧行业就已经超过了电影 。在那一年, 其实发生另外一件事情 , 小游戏投放超过了手游 APP 的投放 , 直播超过了游戏 , 都在这一年 。
我们当时还做了一场直播来讲这个事情 。 然后更更更甚的数据是什么 ? 就是大家会说 , 今天进入移动互联网的晚期之后, 大家在彼此争夺的是用户的时间 。
我们假设中国有 10 亿的每天活跃的移动互联网用户 ,他每天打开手机的时间 , 我们算极限算 10 个小时 ,也就是说每天中国有 100 亿小时被消耗掉 。
这 100 亿小时分给了谁 ? 抖音拿走将近 20%, 微信拿走将近 20%。 我觉得这两个数字大家不太意外 ,但是红果已经拿走了将近 5%。
到这个程度 , 数字是不会骗人的 。
所以流程怎么 , 我们这章不是叫流程吗 ? 对吧 ? 流程出现了什么变化呢 ? 比如说看一个新闻啊 , 说这个九州 , 可能是现在短剧行业比较大的一家厂商 , 从 25 年 10 月 1,500 人,25 年 10 月到今天 ,不过才 8 个月时间 , 对吧 ?
就过去在发生的事情 , 从 1,500 人涨到了 4,000 人。 他把真人剧的产能砍掉一半 , 剩下的投入到 AI 创作跟算力成本 , 这些 75% 以上的员工都是 6 个月新入职的 ,他们在干嘛呢 ?
中间是一个招聘的广告 , 是一个媒体做的统计 ,他们在做抽卡师 ,在做各种各样的新的职位 , 对吧 ?
但是同时也出现了一些问题 。 右边那张图呢 ,是我一个好友写的一篇文章 ,其实他是去九州做了一些调研 。
今天这个时间点 , 类似这样的最头部的短剧公司的工作流程大概是什么样的 ? 做出一个素材 , 投手扔到抖音的时间熔炉里去试他的转化率 , 试的好继续投 , 试不好就改 , 每天如此 , 每天如此 。
所以你会听起来 , 跟我们传统意义上的影视制作节奏完全不一样 , 整个流程全部推倒 。 所以流程怎么了 ?
对吧 ? 流程死掉了 , 或者说旧有的流程死掉了 。 但是呢 , 这件事情其实不仅仅只发生在影视行业 。
前两天 , 呃 , 微软的 CEO 纳德拉开微软每年一度最重要大会微软 build,他就提到一个观点 ,他会认为今天这个时间 , 我们原来所有的 2B 的行业都会受到类似的颠覆 , 未来可能只有三类人。
第一类就是全站的通才 , 什么都会 , 什么都懂 ; 第二类就是只做基础设施跟 infra 的 , 只做调教的 ; 第三就是前端部署工程师 , 就是帮你做实施的 , 仅此而已 , 没有中间态了 。
所以这个事情不仅仅发生在影视行业 , 只是影视行业一个相对比较极致的状态 , 让我们看到而已 。
但是呢 , 听到这个故事 , 大家会觉得哇 , 应该我们讲 , 今天会有非常多短剧行业的嘉宾 , 讲很多的内容 , 对吧 ?
但是我也想泼一点凉水 , 比如说先说一个问题啊 , 呃 , 第一 , 第一张图是这个月光 , 张月光讲了 , 我觉得这段话讲的很好 。他说很多人很多人没有意识到 ,AI 短剧是一个从来没有出现过的神奇的商业模式 。
首先 , 视频 AI 认证公司从字节高价买 seedance 的模型 , 然后投流投 KOL, 获取 B 端客户 , 这客户其实也是自己的广告客户 。B 端短剧公司买了工具 , 做成了剧 , 发回到字节系平台 , 抖音跟那个红果上, 再在字节投流 , 投流是要花钱的 , 这个钱也是给抖音的 。
整个产业链的回收 , 全看字节的分账给多少 。 你发现了吗 ? 从生产到投入到广告到后面的所有循环 , 全部流程都在字节体系上 。
平均来看 , 这个分成比例可能只有 3% 到 8%,3% 到 8%, 这个数字也发生在很多行业 , 小游戏也是 , 短剧也是 , 直播互动游戏也是 。
所以但从另外一个角度来讲 , 你想这个不断的循环过程 , 这么多人, 每天可能几百万的人在用这个模型生成各种内容 , 去投入到效果里 , 看转化率怎么样 ,不断的循环这个过程 , 你可想而知 ,在这件事情上有了这个循环 ,seedance 在视频模型领域这个战场里和其他竞争对手根本就不是一个位面的存在 。
你别的人有那么多人每天在用 , 每天在试效果 ,以秒来计算转化率吗 ? 不可能 , 对吗 ?
但即便是这样 , 我们刚才说后面有可灵 ,有海螺 ,有快乐小马 ,有好多好多的初创公司 ,因为这个行业足够大 , 所以喝汤也够 。
但是这个行业因为可能发展的太快 , 快到瞬间走到了人的极限里 , 人类这个造物主造的很有意思的东西 , 会出现一些变化 。
你会发现在过去的这两个月时间里面 , 关于
这个行业不太行 , 或者竞争太过激烈的讨论特别的多 。 就他直接把一个事情在很短时间里推到了极限 , 短剧是非常典型的 。
说好的艺术家呢 , 对吧 ? 所以最近有个新闻 , 是一位哥们说他做了 11 部短剧 , 对吧 ? 上传到平台最后赚了多少钱呢 ?9 块 6 毛钱 , 对 。
那你可想而知 , 这个这个事情不如想象中那么疯狂 , 对吧 ? 其实在赚钱人是非常少的 。 所以你看 , 我们不自不觉地谈到了钱的问题 。
版权之死21:31
那我们当然就进入到第三章 , 资本层面的版权之死 , 第一章技术层面的素材之死 , 第二章产业层面的流程之死 , 第三章资本层面的版权之死 。
刚才我们说过 ,GPT-4O 出现的时候 , 吉卜力风格的照片应该风靡你所有的社交媒体 , 对吧 ? 很多这种照片 , 当时还有奥运会 , 对吧 ?
那个那个枪手 , 然后这个着火的那个表情包 , 各种各样的图 , 然后那些图是 GPT-4O 生成的 。 我找了几张龚锡俊老先生的原版的画作 , 大家可以感受一下中间的区别 。
当然龚锡俊老先生没有针对这一轮 GPT-4O 做过评判跟意见 ,但是他在之前大概是 2021 年一次纪录片里 ,在那个时候 ,2021 年哦 , 我们刚才讲的所有事情都是在 2022 年之后发生的 。
可是 2021 年就有很多人在尝试 AI 生成图片喽 。在那个时候 , 龚锡俊老先生在一次纪录片里说过 , 这句话是一句日语 ,但是我不用翻译 , 大家应该也能看懂是什么意思 , 对吧 ?
他的意思就是 , 那些人根本不知道人类的疾苦到底是什么 , 就是用 AI 生成的那些东西 , 这些生成的东西 , 可是没有给龚锡俊老先生付版权费的哦 。
所以我会觉得今天这个时间点 , 书籍 、 电视剧 、 电影 、 甚至三游戏 , 这些我们最最最熟知的 ,以版权作为核心商业模式的产业 , 遇到的问题都是一样 。
甚至这个问题在上一代 AI 出现的时候 , 就是算法年代的时候就已经出现了 ,而不是因为今天 AI 生成视频导致的 。
所以就出现了一些变化 。 这些今天这个时间点上, 世界上最头部的模型厂商已经足够大了 ,OpenAI、Anthropic 已经过万亿美金了 ,他们可以用钱解决事情 ,因为这个事情是钱产生的问题 , 那我就用钱去解决 , 对吧 ?
所以他们开始购买版权 。 这是一个国外的独立媒体 , 专门研究 media,他做了一个统计 , 我觉得这个这份报告做得非常好 。
大家如果大家有兴趣可以去找我 , 我后面播客会发出来这份报告 。他说首先这个版权购买的趋势 ,在购买的权益上也出现了变化 。
最开始只是买用来做训练的 ,在 23 年的时候 ,24 年的时候开始做发表 , 就是除了我买来做训练之外, 我还要买做传播 。
后来开始做直播跟 real time 的传播 ,也就是说该是生成的时候产生的版权内容 , 我也要去买这个权利 , 甚至今天那时间要更延展这个权利的更外延的所有事情 。
所以模型厂商也知道这个问题 , 然后我们看最头部模型厂商 ,其实都在过去几年买了很多的厂商的版权 。
然后我们看这些版权的分类 , 当然最大的肯定是新闻 , 对吧 ? 因为是文字的 。 第二就是多模态 ,music、audio、voice, 第二第三 , 呃 , 第三是图片 、 视频 , 然后 viki, 然后书 , 然后 reddit 的论坛的这个这个版权 。
然后在这个这个我们卖出版权的厂商里面 ,其实你也会发现很多出版社 、viki 啊 , 包括一些传媒公司都出现了 。
那这些公司今天面临了很多挑战 ,有人来买他的版权 ,并且高价来买他的版权 ,他卖不卖呢 ? 如果是你 , 你卖吗 ?
我再举一个我更更懂得 、 更更熟悉的例子 , 音乐 。 今天这个时间 ,AI 生成音乐已经非常强了 , 你想做任何的歌 , 几乎没有什么太大的门槛了 。
就出现一些问题 , 比如说上面那个新闻是 Spotify 上发了几首 AI 的英文歌 , 用的是一个已经去世的歌手的声音 。
大家想一想 , 那这个版权归谁呢 ? 首先那位歌手已经去世了 ,他所在的公司拥有的版权 ,是他原来的作品版权 。
那他声音的权利归谁呢 ? 应该归他的家人吗 ? 那怎么定价呢 ? 所以这个事情闹得非常的不愉快 。
而且你发现在各种各样的媒体平台上, 用所谓的已故的
歌手去做歌的事情越来越多 。 然后今天这个时间点去统计 , 今天 AI 生成的歌曲占整个平台的播放 , 呃 , 整个平台上传量已经越来越高了 , 这个数字应该很快会超过 50%。
但是那里有个数字啊 , 只有 1% 到 3% 的播放量 , 就是 AI 生成的音乐 , 只有 1% 到 3% 的播放量 。 所以大家还是听老歌的 。
然后最右边那张图是 AI 生成语音 ,ElevenLab 最好的一家公司 , 它的估值的上涨的状态 。 你发现这家公司在过去几年, 它现在已经是一家 110 亿美金公司了 ,是 AI 语音这个板块绝对的龙头 。
所以面对这些数据 , 我们能说什么呢 ? 对吧 ? 更赤裸裸的
, 今年 6 月 , 就是这个月 ,AI 音乐的代表公司 Suno 融了 54 亿美金啊 , 融了 4 亿美金 , 估值 54 亿美金 。
它在 2 月份公布它的 AR, 就是年化收入已经到了 3 亿美金
。 这是 AI 音乐的最头部的公司现在的状态
。 然后这位今天因为有爱奇艺的同事在 , 对吧 ? 这个事情可能之前大家也看到了 , 我会觉得这件事情挡不住了 。
今天不是爱奇艺做 ,也会有另外一家公司来做
自我进化27:14
。 然后我们三个知识已经讲完了 , 对吧 ? 我的时间控制差不多 , 我们讲最后一章创作者重生 。
我最近经常做 , 就是大家如果熟悉我的播客的知道 , 就是我的播客是以这个 PPT 建场的 , 尤其是相对比较硬核的行业分析 。
但是呢 , 可能这种方式不太适合播客 , 所以我的所有做 PPT 的播客 , 没有一次上过小宇宙的推荐 。 然后我就回头去看 , 我所有上小宇宙推荐的播客内容到底什么内容 , 我一看全都是鸡汤 。
好 , 那我们就聊一聊鸡汤的问题 。 所以这一章我叫创作者的重生 。
先看这张图啊 , 我们来点更吓人的 。 这张图如果观众行业的话 , 大家看那个动画啊 , 先看那个动画
, 看懂了吗 ? 再看这篇文章的标题 , 这篇文章是 Anthropic, 就是国现在世界上最好的模型公司 ,在这个月月初发表一篇文章 , 叫 《When AI Builds Itself》。他画了一张更有寓意的示意图 ,也就是说 , 我们原来做跟模型的合作关系 ,是我们用我们的电脑训练出一个模型 , 然后我们把模型加到我们的训练过程中, 再训新的模型 , 再加模型 , 再加流程 , 再加再加再加 , 加
到最后你发现底下的时候 , 我们人类不见了 。
就跟这个这篇文章 ,其实很多人转发 , 很多人应该看过 ,但是没几乎没有太多人去官网看过这个动画 。
我当时看到这个动画的时候 , 毛骨悚然 。《When AI Builds Itself》,他可以自己自我进化了 。
然后就是 Claude 最近发的 Fable 5, 能力强到一塌糊涂 ,他只上线了三天 , 就被美国政府禁掉了 ,因为太危险 。
这是我们人类历史上第一次有比较强烈的感性 。 我再举一个例子 , 呃 , 卡斯克可能是今天这个事件 AI 自媒体最大的一家 ,他在评测 Fable 5 所有的内容之后 ,在他文章的最后写了这样一段 , 我觉得可以跟大家读一下 。他说 :" 我忽然觉得 , 我好像自己并不是一个那么有趣的人, 我没有那么有创意 , 我也没有那么多的想法 。
以前 AI 的能力还能有 , 还能没有那么强的时候 , 我还可以拼尽全力去榨干 AI 的每一分能力 , 去摸清楚他们的边界在哪里 。
那时候平静在 AI 那边 , 我是那个推着往前 ,他往前走的人。 我的价值感很清晰 , 我也知道我在这个链条里的位置 。
但是现在 AI 的进步速度 , 开始把我甩在后面了 。 我即使已经拼尽了全力 , 坦诚的讲 , 我也有点跟不上了 。
那些模型的能力边界开始离我越来越远 , 我不再是那个可以推着 AI 往前走的人了 , 我变成了那个在后面追着跑 , 气喘吁吁 , 越追越远的人。
而当你被越来越远甩在身后, 你能感觉到一件 , 只有一件事 , 原来我好像确实也没有那么有趣
。他是一位 AI 的资深博主 , 每天疯狂用 AI。 所以上
面那段英文 ,是刚才那篇 Anthropic 文章里的一段话 , 讲的是一样的意思 。 今天这个时间点 , 对 AI 边界认识最清楚的一帮人, 开始出现了类似葛优躺的状态 。
但是所以它危险吗 ? 它太危险 , 太强大了 。 所以出现了一次调整 , 就是美国政府把它禁掉了 。 所以我们第一次看到了 ,AI 模型发展的曲线上出现了一次倒退 , 发出来太强了 , 我们把它拉回来 。
但是这个拉回来 , 我们我们也不知道多久 , 可能没准过两天又放出来了 。 我们出现了第一次所谓的倒退
。 然后呢 , 前两天那个原来百姓网 CEO 写过一篇文章 , 里面有这样一句话 ,他说 :" 我们回不去了 ,AI 也挡不住了 。
历史告诉我们 , 技术总会碾压一切情怀 。" 你当然可以说情怀有这样那样的好 ,但是每一次技术革命都告诉我们 , 技术总会碾压一切的情怀 。
神之一手31:27
那就再讲一个故事 , 听我播客的人应该听我讲过故事很多遍了 ,但我觉得应该值得再讲一次 。 十年前 ,2016 年的 3 月 ,AlphaGo 跟李世石进行了一次人类历史上最重要的围棋的人机大战 。
十年前
, 结果是 4:1, 大家知道的 , 五局三胜 。 第一局 , 李世石说他自己因为一个小的失误失败了比赛 , 所以他不觉得 AlphaGo 很厉害 。
第一局是鄙视 、 蔑视 、 瞧不起 、 轻视 。 第二局 ,AlphaGo 下出了一个他的神之一手 , 下出了人类理解范围内不可能被理解的一步棋 , 直接把李世石杀掉 。2:0 之后, 大家认为 AI 好强 , 好强 。在那个时候 , 李世石开始对自己的态度变成了纠结 、 怀疑 、 猜忌 。他开始去怀疑自己是否真的理解围棋 ,AI 是不是看透了一切 。
第三局 , 迅速溃败 , 李世石带着哭腔走向新闻发布会 。在那个时间点 , 人类的感觉是道心破碎 。
也是三局哦 , 我们今天已经出现无数次三这个数字了 ,1:0、2:0、3:0,3:0 打完就结束了应该 ,因为五局三胜 ,AI 已经赢了 , 对吧 ?
但故事有意思的就发生在第四局 。 第四局的第 78 手 , 李世石下出了人类历史上被称为神之一手的一步棋 。
那步棋可能也是在那个时间点让 AI 出现了错乱 ,他扳回来了 。 你要想象一下, 李世石在第四局经历了什么 。他经历了从看不起 、 猜忌 、 怀疑 、 道心破碎 , 到突然间意识到自己可能在领先 , 然后坚持下来了 。
你要想那局如果他再输了 , 那人类真的是一败涂地 。 但是他坚持下来 , 所以他赢了 。 然后他在赛后采访时说 ,他下的那个叫第 78 手的神之一手 ,不是他算出来的 ,是完全的在绝望里的一种直觉跟冲动 。
后来计算过 , 那步棋的概率大概可能是万分之一 , 就是人类所谓的奇迹 , 我们才有了这一手 , 叫神之一手 。
第四局 , 当然第五局他又输掉了 。 然后他在十年之后的今年 4 月份 , 上了一次韩国的综艺节目 , 坐在他旁边的 , 我看有没有这张图 , 可能在这张图能看到 , 坐在旁边的是一位年轻人, 这位年轻人是 T1 的 faker,是英雄联盟这个领域的绝对的 GOAT。
之前如果没有马斯克调整 Grok 的话 ,T1 会跟今天世界上最好的模型一起去打英雄联盟 。 也就是说 , 人类历史上过了十年, 又推出来一个人类的代表去跟 AI 战斗 。他在这期节目里面 , 李世石说了很多的话 , 我觉得这个节目非常有意思 , 大家如果有兴趣可以回家去看一下,B 站就有 。其中两段话截出来 ,他说 :" 如果 AI 能够像老师一样提供指引 , 降低围棋的
入门门槛 , 那确实算是一件一面积极的一面 。" 很多人都会这么讲 , 对吧 ?AI 有了围棋之后, 那门槛降低了 。
但李世石说事实并非如此 , 现在连顶尖职业棋手都在模仿 AI 落子 。 当人类沦为 AI 逻辑的追随者跟模仿者时, 我们还能称之为人类的进步吗 ?
如果说以前是我们人类主导了围棋的发展 , 那现在是通过 AI 程序在学习 。 然后后面还有这段话 , 我觉得更重要 ,他说 :" 原本围棋并不是一种简单的体育或智力的竞技 , 它是更多的代表文化跟艺术 。"
我李世石大概是把艺术围棋当做艺术来学习的最后一代人。 如果从艺术的视角出发 , 胜负围棋的胜负 ,不过是在创作一部完美的作品的过程中产生的副产品而已 。
胜负的比重其实并不大 , 归根到底 , 那些全神贯注于创作优秀作品的人, 往往最终在胜负结果上也赢得非常漂亮 。
艺术创作 , 我们回到了今天的主题
。 然后再举一个话题 , 又是我引用仲卿的观点 ,他在一期很有意思的播客里讲现代艺术的理解 。他说 :" 从杜尚把那个小便池放进博物馆的那天开始 , 艺术就是关于叙事 、 观念和颠覆的东西了 。"
第四支柱35:53
然后我在想 , 刚才来的时候有我的我的听众问今天的 PPT 还是手搓的吗 ? 我说对 , 当然我在做的时候 ,在做这些准备的时候 ,也做了另外的准备 , 比如说我用 AI 做了这样的内容 , 对吧 ?
也可以讲啊 , 对吧 ?AI 内容行业的综述 ,AI 内容创作的全景报告 , 对吧 ? 今天这个视频 ,AI 能力已经可以做成这个样子 , 对吧 ?
几句提示词就可以搞定 。 我当然可以跟你们侃侃而谈 , 讲没有任何问题 。
如果再认真一点 , 对吧 ? 我用一些素材 , 用一些比较好的模型 , 比如说用 NotebookLM,也可以做成这个样子 , 讲起来也没有问题 , 大家也应该能听得津津有味 , 对吧 ?
但是我觉得这样不太好 , 对吧 ? 所以我还在坚持用手搓 。 所以但是你会越发的觉得 , 这种坚持越来越没有太多的意义了 ,因为它的能力在越来越提升 , 越来越好 , 越来越逼近人类的极限 , 甚至超过人类 。
更更更悲惨的是什么呢 ? 这个故事还有后半部分 。AlphaGo 在打李世石之前 ,有一位中国的选手叫樊辉跟他做测试 , 当时是 5:0,AlphaGo 4:1 战胜了李世石之后,
人类就再也没有在 AI 上战胜过 , 就只在围棋上战胜过 AI 了 。 技术会碾压一切情怀 , 对吗 ? 当年的 master 是 60:0, 没有输任何一局
。 所以那然后呢 , 还是围棋这故事 , 输赢之后, 输赢已经确定了 , 那为什么还要下棋呢 ? 对吧 ?
为什么还要去下呢 ?
再举一篇文章 ,是我最近看到一篇文章 , 叫 《 第四次呃第四支柱 :AI 时代的文艺复兴 》。 它是一篇推特的文章 , 这个创始人是一位 VC fund 的 GP,他原来在斯坦福的教授 ,而且是生物学教授 。他回看了过去这么多年所谓人类的文艺复兴 ,他会认为每一次人类的所谓的文艺复兴 , 都需要四个支柱 。
这四个支柱是什么呢 ?
大家看到我们这 PPT 是 NotebookLM 做的 ,不是我做的 , 大家发现风格不太一样 , 对吧 ? 他说四个支柱 , 前三个支柱是必然会发生的 。
首先分发方式的颠覆 , 就是渠道会变 , 然后尘封的知识的复苏 , 大家会往回去找古典的东西 , 流动且集中的赞助资本 , 钱很重要 。其实这三个支柱基本上跟我讲的三三个知识跟技术产品资本是一一对应的 。
但是有第四个支柱 , 叫全新的人类愿景
, 这个是难的 。
分发 、 复苏 、 资本都是必然会发生的 。 但是但是就这三件事情 , 它们已经在今天这个 AI 的时代发生了 。
分发渠道的变化 , 我们去找所谓的古典的理论 , 密集到已经到人类极限的资本的集中, 这三件事情是必然会发生的 。
但第四件事情不是 , 第四件事情不会自动生成 , 它需要人类去构建
。 所以当今最顶尖的建设者 ,并不缺乏智力 、 野心 、 工具或资本 ,他们能够在 10 分钟之内 , 清晰的阐述刚才我们聊的所有事情 ,但他们难以描绘另一端那个人。
人类将变得更强大 、 更明智 、 更有能力 、 更有尊严的具体表现到底是什么 。 这不是建设者的失职 ,是因为我们在向他们提供人类新图景之前 , 就先提供了工具 、 资本 。
第四支柱 , 这一柱只能由特定的人坐下来亲手打造 ,也就是所谓的创作者的重生 。 然后我们再举个更现实的例子 , 比如说我们所熟悉的媒体领域 ,其实已经出现这样的趋势 。
呃这篇文章是一个呃我很喜欢的在美国的专栏记者 ,他最近一次演讲讲 ,他说在媒体出现了一些变化 , 这个变化他我一讲大家就明白 。
比如说你会发现 , 所谓的总结摘要的权重在降低 ,但是人与人之间的秘密变得越来越重要 , 越来越有趣 。
比如说古版的那种经典的东西 , 然后古版的 , 或者说比较严苛有规划边界的东西 , 变得不太重要 ,但是鲜活的 live 的东西 , 就跟今天我们在讲一样 , 变得更为重要 。
传统的媒体的专业的机构 , 变得越来越不重要 ,但是 founder 就个人变得越来越重要 。 大家为什么打到所谓的个人 IP, 然后华丽的那些被标装包装的特别好的东西 , 越来越不重要 ,但是那些乖张的 、 个性的 、 鲜活的东西 , 我们在表扬那些东西 。
昨天我看一个朋友说 , 这个世界在奖励抽象 , 就是这个逻辑 。 那是似乎就是刚才我们讲的第四支柱的问题 。
尾声41:19
那人类到底还剩什么 ?
品味
、 信任 、 决定 , 可能都是 。
这是最后一页 。 我当时在 Claude 5 发布之后, 我转发了刚才我们说的那段卡茨克的内容 , 转发到朋友圈 。
我的一位朋友给我在底下评论这样一句话 ,他说 :"AI 哪有你有趣啊 。" 然后那张漫画是非常有名的 , 国内的漫画大师 Tango 老师画的 ,也是最近刚刚画的 。他就是他把 AI 两个你你你像成了两只狗的鼻子 ,但那个牵笔牵着两只狗的手 , 还是由人类来做的 。
好 , 感谢大家 , 时间正好 , 谢谢
。






