开场0:00
大家好 , 我是明浩 。 呃 , 最近几天拿到了字节刚刚发布的 Ola friend AI 耳机 , 使用了几天之后觉得耳机这个话题 , 尤其是 AI 耳机这个话题 , 可以简单聊一聊 。
所以我本来做了一个脑图 , 然后想聊一些话题 , 后来做着做着发现想聊的东西有点多 , 所以索性依然用 PPT 的方式来做呈现了 。
然后今天的内容叫做 "AI 与耳机的碰撞 : 消费之路有多远 "。 这个话题 , 或者这个主题的标题是元宝给我的 , 对 , 腾讯的元宝 。
我把我想表达的内容输入给各家大模型 , 然后让它们帮我起些标题 , 最后调到这样一个标题 。
呃 , 那为什么会聊这个话题呢 ? 既然聊到消费 , 我觉得作为消费电子的一种吧 , 耳机也好 ,3C 产品也好 ,其实最近几年我用得比较多 。
只说耳机这个品类 , 我经手的 、 作为主力耳机用过的耳机 , 我数了一下, 之前最早用 ROG 的那一款 TWS 耳机 , 用了很长的时间 。
然后后来 , 呃 ,因为一些原因 , 拿到了一款韶音的骨传导的耳机 ,也用了一段时间 。 然后这个现在这款耳机是我老婆在用 。
然后后来也是因为一个活动 , 得到了一个讯飞的那个会议纪要做会议记录的耳机 , 我也用了一段时间 。
然后最近一段时间 ,因为我一直在用 vivo 旗下的 iQOO 的手机 , 所以我又买了一个 iQOO 的同款的 WTS 的 , 呃 ,TWS 的耳机 ,也在用 。
然后最近就是字节的这款耳机 。 所以作为一个每个月 —— 我那天看小宇宙的统计 , 上个月我在小宇宙上就听了 200 个小时 ,也就是平天有 , 平均一天有 6 到 7 个小时的时间我的耳朵上是挂着耳机的 。
所以作为一个重度的耳机用户 , 然后一个内容行业的观察者 , 一个对算字节跟大模型有些研究的行业观察者 , 我觉得我可以聊一聊这个话题 。
但是在准备话题的时候 , 刚才我说我在做脑图 , 然后脑图上我就列了非常多的要素 , 比如说我想到一些角度 , 比如说消费者购买耳机的决策因素 、 当下 TWS 耳机行业的状态 、 竞争的格局 、 厂商之间的竞争的维度 、 应用场景的探索 、AI 这个功能加到耳机上的意义 、 硬件软件的产品边界的定义 , 甚至再扩大到 AIPC、AI 手机 、AI 眼镜这些话题 ,
然后再扩大到比如大平台级公司的眼望 。 你会发现 , 真的能特别的多 。 然后那怎么把这些内容以一个相对有逻辑的方式组织起来呢 ?
我后来想到了一个方式 , 我今天的内容分三个部分 。 第一个部分是我叫 " 从耳机看 AI",也就是说我从耳机行业这个角度 , 或者说限定在 TWS 耳机这个角度 , 来看这个行业当下的发展状态以及趋势 , 看能不能连到 AI 那儿 。
然后第二个阶段就是 , 如果连到了 , 那我们就看这个时间点在已经出现 、 已经出现在消费者面前的这些所谓的 AI 耳机到底做的什么样子 , 它们的实力是什么样的 , 做了什么功能 。
然后最后一块我叫 " 从 AI 看耳机 ",也就是说从 AI 厂商的角度再去回看耳机或者硬件品类的意义 。
所以是这三个大块 : 从耳机看 AI、AI 耳机的实践 、 以及从 AI 看耳机 。 我们进入第一部分 " 从耳机看 AI"。 先看行业规模 。
行业格局3:43
我找到了数据报告 ,是 2024 年 Q2 的数据 。Q2 全球的 TWS 耳机的出货量是 7700 万台 ,7700 万台 ,而且这个数字就六七千万的一个季度的出货量已经稳定了好几年了 。
所以要感谢苹果定义了这个品类之后, 这个品类在过去的几年全世界发展得非常的快 。 然后看厂商的统计来说 , 第一名是苹果 ,1800 万台 , 占比 17.1%。
第二名是三星 ,810 万台 。 第三名是主要在印度在做的一个耳机品牌 , 叫 BOAT,是 670 万台 。 第四名是国产手机厂商小米 ,520 万台 。
第五名是索尼 ,400 万台 。 前五名的厂商的市场份额加在一起仅占 39.6%,也就是说不到 40%。 所以整个市场是一个相对比较分散的市场 , 哪怕是行业第一 ,其实只占市场规模的 17%, 对吧 。
然后我们再看细一级的数据 , 比如说在整个的这个 TWS 耳机这个品类里面 , 这个增量过去几年比较快的一个品类 , 一个小的新品类就是开放式耳机 。
也就是说字节这次的发布的这个厂商 , 叫 Ola dance, 它收购了一家耳机厂商 。Ola 的团队之前是 BOSE 的中国区的比较核心的团队 ,他们在做的品类就是开放式耳机 。
那之前可能做骨传导比较有名的韶音也在 ,其实也是属于开放式耳机 。 那开放式耳机 , 就 OWS 这个品类 ,其实在 Q2 有 116% 的环比的上涨 , 涨得非常的快 。
然后整个 Q2 开放式耳机大概是 700 万台的出货量 , 就是占整体的不到 10%, 对吧 。 刚才整个季度是 7700 万 。
然后我们再看细分的中国厂商的 ,在中国区的这个份额的排名。 第一名是小米 ,16%。 第二名是华为 ,15%。 两家相差无几 。
第三名是苹果 ,11%。 这可能跟中国的手机厂商的出货量跟手机现存用户的比例相关 ,是密切相关的 。 第四名就不是手机厂商 , 第四名是漫步者 ,是国产的比较有名的做音频的设备厂商 。
第五名有些意外, 倍思 , 占比 7%。 我其实也是倍思的核心用户 , 买过他们家的充电头 、 充电宝 , 然后各种各样的数据线 。
这公司其实做这个品类做了也很多年, 然后他们应该是在去年开始做耳机 , 涨得很快 , 大概在中国区占比 7%。
然后我们看中国区 TWS 耳机的市场份额 , 前五名其实占比已经 60% 了 , 将近 。 所以相对会集中一点 。
但是我们看头部的厂商的这个事情 , 可能大家会想到 , 哦 , 小米有它的耳机 , 华为有它的耳机 , 苹果就不用讲了 , 漫步者 、 倍思可能也常见 。
然后但是因为最近在双 11 嘛 , 我又去电商平台看了一眼 ,其实中国的市场还是非常复杂的 。 我拉了一下拼多多跟天猫的 TOP10 的 TWS 耳机的这个销量 , 然后
低价实况6:40
我觉得这个销量本身的绝对数字不是太大的意义 。 有意义的是什么呢 ? 我们看一下, 首先看拼多多 。
拼多多排名第一的耳机叫柏林之声 , 当然是个山寨的牌子 ,12 块 4 毛 。 第二名是联想的一款蓝牙耳机 ,38 块 8。
第三名又是比柏林之音 ,23 块 5。 第四名是华强北四代 ,23 块 8。 第五名是联想 ,39 块 9。 这是拼多多的数字 。
然后呢 , 京东的数字是这样的 , 第一名是金韵运动耳机 ,69, 耳压式的 。 第二名是品存 H1 蓝牙耳机 ,79。 第三名是倍思的 S01,94 块钱 。
第四名是倍思的 M2,229。 第五名又是金韵 ,108。 你会发现特别多我们没听过的牌子 。 第二点你会发现 , 耳机的售价非常的低 , 尤其以拼多多 , 可能平均均价只有 20 块到 30 块 。
然后这个数字其实是剔除了异常数字的 ,因为你搜 TWS 耳机 , 然后你按销量跟价格排序之后, 最低的价格不会低于 15 或者 12。
我觉得这是官方跟平台做了一些干预 ,因为你会发现 , 你去刷这个动态里面 , 你会经常看到 9 块 9 的耳机 , 看到 6 块 8 毛的耳机 。
然后我又去细看了一下, 比如说京东卖的有一款很好的 , 京东自己京喜下面在卖的一个模仿苹果 AirPods 一代的耳机 , 只卖 9 块 9。
然后我也看到了卖的量比较大的 ,有一款卖 198 的 , 完全山寨苹果最新的那款耳机的 , 只卖 200 块不到 。
然后它就是在所有的详情页非常明显的写着 , 就是一比一 , 绝对意义上还原所有的体验 。 你包括你打开那个盖子 , 会在苹果的手机上弹窗 , 那音效 、 降噪 , 所有的这些东西就是一比一还原的 。
那大家知道这都感谢华强北 。 然后同样是前面我提到的那份关于耳机的行业报告 , 它提及其实在整个全球市场来看 ,TWS 耳机超过 50% 的这个出货量是 50 美金以下的耳机产品贡献 ,也就是低价的耳机 。
那 50 美金算上过来 300 多 ,其实在中国已经不算是低价 。 那中国你会发现这个坎应该是多少呢 ? 如果按京东看 , 可能是 100 块 ,但如果按拼多多看 , 可能是 50 甚至 20。
然后如果我们再把华强北算上, 公模的 AirPods 的一代已经 9 块 9, 甚至 6 块 9 就能买得到 。 然后 OWS 就是开放式耳机 , 可能 20 块钱你就能买到 。
所以这个行业到今天在中国 , 你会发现是个人都能做 。 你听过无数的公司在做 ,Q 音乐有它的耳机 , 网音乐有它的耳机 , 你没听过名字的一些小的厂牌都有它的耳机 , 对吧 。
然后那那些大牌子怎么办呢 ? 我又列了一些我们能够想到的比较有名的 ,有这个商品或者这个品类的大品牌 , 比如说苹果 、 三星 、 华为 、 小米 、vivo、OPPO, 甚至 Nothing, 就是一家那个团队出去做的那个手机品牌 。
几乎所有的头部的手机厂商都有自己的耳机销线 。 那传统的耳机厂商或传统的音频厂商 , 索尼 、BOSE、 塞内塞尔 、JBL、Beats、 漫步者 , 当然也有 。
那做充电宝的 , 刚才说的倍思 、Anker 也有 。 然后做新品类的 , 韶音 、Ola 做开放式耳机的 , 包括 Clear 都是做开放式耳机的 。
甚至我用的比较多的游戏这个品类的 ,Razer、 雷蛇跟 ROG 也有 。 那这些品牌做这些耳机的时候 , 当然不会卖 9 块 9 甚至 19 块 9, 它会要卖高价 。
可是那对于用户而言 , 这些耳机到底该怎么选呢 ? 对吧 。 所以我们从一个 , 比如说我们从评测的角度来看 , 消费者购买耳机的因素 , 首先考量的是佩戴方式 , 对吧 。TWS 耳机可能最早是入耳的 , 后来有了半入耳 , 然后有了骨传导 ,有了耳挂 ,有了耳夹 , 各种各样的佩戴方式各有优劣 , 对吧 , 萝卜青菜各有所爱 。
消费决策10:46
然后再从功能特性上, 比如说耳机最重要的音质 , 对吧 , 那无线耳机的续航 、 连接稳定性 , 然后再到功能化的降噪 、 防水 , 各个品类各有所长 。
但今天这个时间点 ,在这个行业的竞争 , 基本上对于想做品牌的公司而言 ,是不能有短板的 。 然后再细化的 , 比如说可能有些用户会比较着重的会在某些场景里使用耳机 , 比如说在运动的时候 ,在听播客的时候 , 对吧 ,在游戏的时候 。
那但是这些场景可能现在看上去 , 看上去是区别 ,但越来越重要的场景成为了用户去购买耳机的很重要的理由 。
那就来了 , 我们第一章的标题刚才我们讲过 , 叫 " 从耳机看 AI"。 那 AI 来了之后,AI 加到哪呢 ? 是加到功能特性上吗 ?
还是加到场景上 ? 或者说 AI 能加上吗 ? 因为但凡能加上, 似乎 AI 就可以成为用户购买耳机的理由
。 所以你会发现今天这个时间点 ,在我们去细看这些有牌子的 , 或者是做的比较 , 发展比较好的 , 这两年被频繁提及的这些公司的这些产品 , 要么就是长板绝对的潮 , 比如说你变成了某个品类的代名词 , 比如说韶音在骨传导领域基本上开始等于品类的代名词 , 比如说 BOSE 在某一段时间可能等于降噪的代名词 , 要么就是场景再做切
分 , 比如说我所熟悉的游戏这个板块 , 比如 Razer 专门给 PS 游戏机做过无线蓝牙耳机 , 然后比如说你南总他们的弄喵专门做过 PC 场景的 TWS 耳机 , 专门给游戏用户的 , 强调低延迟 , 强调桌面的充电系统 , 强调炫酷 , 对吧 。
它不单纯 , 它几乎放弃掉了你把耳机带出去这样的场景 , 就是它相当于把场景再做了细分 。
要么很多厂商选择就是多标签的策略 , 比如说索尼的降噪豆 , 主打的就是索尼的音质加降噪 , 对吧 。
比如说主打设计的 , 比如 Nothing 他们出的 CMF 系列的耳机 , 就设计感非常强 。 那他们同时又是手机厂商 , 对吧 。
然后比如说甚至国内有公司之前做过主打播客场景的耳机 , 虽然我不太会觉得这个场景真的有那么痛 ,但是你发现这些产品也在这些场景上做了一些小心思 , 对吧 。
所以就是这个行业竞争非常激烈 , 逼着大家就卷起来了 。 然后那从结论上来说 , 就是我们回过头再去看我买的那几款耳机 ,其实每一款耳机都有一个绝对强的理由让我下单 。
比如说 ROG 那款耳机为什么让我下单 ? 因为我可能宅男们对 ROG 这个品牌本身有太多的崇拜了 。 大家叫它那个 logo 叫败家之眼 , 对吧 。ROG 那款 TWS 耳机的败家之眼是可以闪光的 , 就可以亮 。
那但是这个理由就让我下单了 。 然后韶音那款是因为那个时候骨传导传的特别的厉害 , 对吧 。
而且我的耳朵确实不太适合戴入耳式的 ,因为我会不舒服 。 然后我就试了骨传导这个方式 。 那讯飞就不用讲了 , 这个在我身边做分析师的朋友们 , 做律师的朋友们 , 就常年开各种各样电话会议的朋友们 , 几乎人手一台 。
因为他在会议机要翻译 、 整理 、 语音转文字这些事情上的能力确实非常强 ,因为人讯飞原来就干这个 , 对吧 。
然后呢 , 我最近为什么买 Echo 呢 ? 就是我在用 Echo 的手机 , 对吧 。 这个连接性 、 稳定性跟可配置的这个丰富程度 , 我甚至不需要去下一个独立的耳机 APP, 只要耳机打开 , 对吧 , 弹窗弹出来连接上, 你在蓝牙设置页面就可以看到这个耳机更丰富的设置 。
这是同品牌手机跟同品牌耳机之间连接的这个先天的优势 , 就跟苹果一样 , 对吧 。 那最后的最近我们提到这个 Ola, 就是字节这款耳机 , 那到底我买的是一个设计更好 、 音质不错 、 佩戴也不错的开放式耳机 , 还是买了个 AI 功能的 , 对吧 。
这是个问号 。 所以呢 , 就引发到我们的第二个命题 , 就是那我们就看一看今天这个时间点 , 真正意义上以 AI 概念再去做推广 , 再去做品牌建设跟心智建设的这些耳机到底在做什么 。
AI耳机实践15:17
第一个不得不提的当然就是讯飞的会议耳机 , 对吧 。 这个我理解为就是场景加技术加功能 , 对吧 。
场景就是会议这个 , 或者说办公这个场景 。 技术就是讯飞一直以来的翻译 、 语音相关的技术能力 , 功能就细化到了比如说录音转文字 、 实时的翻译 、 同声传译 , 然后会议助理 、 会议总结这些内容 。
然后你会发现 , 整个讯飞的耳机条件的产品也非常丰富了 。在官网上现在已经有 6 款了 , 那还有什么会议狗啊 , 还有翻译机啊 , 各种各样的东西 。
所以本身来讲 , 讯飞的这套所谓的 AI 耳机 , 你可以理解就是 AI 加持的录音笔加翻译机 。 如果你是一个频繁需要开电话会议 , 频繁需要这种翻译的东西的话 , 那用这个就不会出错 。
所以我身边为什么那么多律师朋友们 , 为什么那么多二级市场分析师朋友们用这个耳机 , 就是因为这个场景对他们来讲太痛 , 又每天都要用到 , 时间很长 , 所以就买了 , 就没有任何的疑虑 。
这是讯飞 , 对吧 。 然后那我们回头再去看讯飞耳机这个实现的这个逻辑啊 , 从技术实现的角度来讲难吗 ?
尤其考虑到当前这一波 AI 大模型的能力 , 对吧 。 对他们对于文字的处理 、 总结 、 摘要 、 翻译 , 本来就是这一波 AI 大模型目前最为被广泛应用的功能 , 对吧 。
那语音转文字 , 对于很多手机跟互联网平台进公司而言 ,也不是什么特别高的技术门槛 , 对吧 。
虽然可能录音笔这个具体的场景 , 对于很多大平台经营公司而言 , 是一个看不太上的小东西 ,但是如果把这个功能加到他们原有已经有的产品线上的话 ,是不是就合理呢 ?
所以我们看到了 , 比如说小米最近发的这个 Buds 5, 它的最新一代的蓝牙耳机 ,其实就有了这个独立的录音跟智能助理的功能 , 就是可以上传到小米耳机的 APP, 录音转文字 , 然后帮你在做精要整理这些事情 。
然后同样的小度 , 就是百度旗下的这个业务 ,也在他们最新的 S108 跟 S200,其实也有了小度 AI 的能力 。
那但凡这个东西跟你已有的这个大模型的产品连接上 ,其实那些技术能力也就加持了 。 所以大概率这几个被证明已经是一个广泛应用的功能 , 会成为各家耳机厂商的标配功能 。
就这个趋势应该已经看得到了 ,因为技术上确实不难实现 。 然后呢 , 另外一个角度是什么呢 ? 就是这个再讲一个去年还是前年, 应该是去年, 知名的做这个音频的厂 , 就是这个声音的这个相关设备的厂商 JBL, 出了一款蓝牙耳机 , 它的特点是它的充电仓上带了个屏幕 。
大家想象一下, 充电仓上带了个屏幕 , 如果大家看收到的我图上放了 。 那个屏幕的功能非常简单 , 切歌 、 快进 、 电量显示 , 仅此而已 。
它是一个
很小的触摸屏 ,但是你要想 , 当一个设备带上屏幕 , 这个设备就变了 , 对吧 。 所以这里面引发另外一个选题 , 耳机是否需要端侧的能力 。
这个呢 , 讯飞的这个耳机的这个产品的负责人, 之前在某次发布会上也讲过 ,他说 AI 耳机应该在没有手机能力的价值上 ,也具备 AI 功能 。
那其实就要求 AI 耳机本身具备端侧的能力 , 无论是计算还是存储 。 那耳机那个挂在耳上那部分 , 可能受限于硬件本身的大小尺寸 , 耗电各种原因 , 没有办法加太多东西的话 , 那是不是就往充电仓上加呢 ?
对 , 这个逻辑特别的顺 , 对吧 。 所以有厂商就做了 。 我在淘宝上也发现两款 , 你可以理解为就是带屏幕的 AI 耳机 ,他们的屏幕都在充电仓上 。
那但凡你带了屏幕 , 屏幕背后放一个安卓系统 , 就可以加应用 , 你就后面就可以跑 Open、 跑 ChatGPT、 跑任何东西 , 对吧 。
然后你甚至可以把耳机里插上 SIM 卡
。 那这个时候你会发现 , 耳机这个东西的边界被一次再一次的拓展了 , 对吧 。 然后大家会想 , 那为什么我需要一个这样的东西 ?
我不有手机吗 ? 那你就要想什么功能跟什么样的产品边界适合这么小的屏幕 ,而不需要掏出来手机 , 对吧 。
一款叫 WSHEE, 它支持 , 它甚至专门为这个它的这个小的显示屏做了一个 OS, 然后可以加各种各样的应用 , 当然有各种各样 AI 的功能 。
你甚至可以在那个小屏幕上跟它有 emoji 层面的互动 , 你摸一摸它 , 你在它旁边走过去 , 它有个眼睛会动 , 对吧 。
这功能设计的挺巧妙的 , 对吧 。 然后另外一个叫 IKKO, 它里面直接内置了 ChatGPT、 同声传译 、 智能笔记 , 各种各样的 APP。
然后它的这个设计的这个充电仓 , 是一个滑盖的充电仓 。 哇 , 我想到了当年我用的滑盖手机一模一样 , 对吧 。
似乎已经不单纯是个耳机了 。 那个第一款 WSHEE 的耳机 , 甚至支持插 SIM 卡 , 它其实是个独立的设备 。
然后最近的就是最热的这个字节豆包的这个 Ola friend, 我用了几天啊 。 首先 , 蓝牙连接上之后下载豆包的 APP, 然后会在豆包 APP 的右上角多出来一个选择 , 就是 Ola 耳机的设置页面 。
打开设置页面就是常见的左耳 、 右耳跟充电仓的电量 , 然后会送你一个月的汽水音乐的 VIP,因为这个耳机支持播放一些音乐 , 背后连接的就是汽水音乐的技术能力 。
那这个其实就是同一家平台级公司不同业务条件在一个硬件上的联动 , 对吧 。 这个后面我们详细讲 。
然后你可以做各种各样的手势跟设置 。 然后重要的一点是 ,因为这个耳机发布之后, 很多人会说 , 很多人期待的是说在吸屏的条件下, 通过语音跟触摸的方式 , 让耳机调起手机内的一个 APP, 对吧 。
因为 Ola friend 耳机本身并不具备任何的计算跟存储的能力 , 它的 AI 功能是通过豆包 APP 实现的 。 那这就相当于我需要让耳机调起那个 APP。
那自然而然在第一次使用的时候 , 会有一个非常重要的页面 , 就是防止系统把豆包 APP 杀掉 , 要常驻通知栏 , 要关闭电源优化 。
因为很多手机 , 尤其是安卓手机的电源优化 , 会在后台把后台运营的很多 APP, 尤其是不活跃的 APP 杀掉 , 然后要允许一些 APP 自己动 。
所以它的这个设置页面非常多的选项要去选 。 那很多人就会说 , 万一某一天手机厂商不允许这件事情了 , 怎么办 ?
或者说肉眼可见的 ,因为今天这个时间点 , 所有的手机厂商都在强调 AI 手机 。 那刚才我也讲过 , 手机厂商都会做耳机 ,AI 功能也都会成为这些耳机的标配 。他们自己现在各个手机里面也内置了大模型产品 。
那未来这个链路是不是只属于同品牌耳机跟手机厂商自己呢 ? 问号 。 然后在场景的选择上 ,因为这个耳机发布之前 , 我以为豆包会选择类似讯飞或者是小米或者百度他们那样的方式 , 把翻译 、 总结 、 文字转述作为核心的功能 。
但是发布之后你发现 , 哎 ,不是这样 。 它没有把任何刚才我讲过的这几个功能作为主打的卖点 , 甚至这个耳机都不支持 , 比如说同声传译 , 然后刚才我们讲的那些细化被切割好的功能 。
它在广告片跟官网上推荐的几个场景是 , 比如说随身的百事通 , 你可以问它随时获取豆包 , 豆包问它 , 比如今天天气怎么样啊 , 我眼前看到了什么什么东西 , 或者我到了哪哪哪应该怎么样啊 , 就是这个事情是什么 , 这个建筑是什么 , 这个景点是什么 , 百事通 , 对吧 。
搜索的这个这个 。 然后第二场景英语陪练 , 对吧 。 因为这些大模型这个这个这个技术能力很强 。
然后旅行的导游 , 就刚才我们讲 , 你到了一个景点或到了一个什么地方 , 问他 。 然后音乐的 DJ, 你可以让他帮你推荐播放一些音乐 。
刚才我们讲过 , 这个背后的能力是汽水音乐提供的 。 然后情绪的加油站 , 就陪伴嘛 , 闲聊嘛 , 对吧 。
然后你细化来看 ,其实这几个场景本身就是豆包在推的场景 , 就豆包这个 APP 在推的场景 , 对吧 。
搜索 、 陪练 、 这个这个音乐 , 甚至包括音乐生成 。 当然现在它不应该是 , 它的技术能力是汽水音乐提供 , 它没有加音乐生成的能力在耳机上 。
然后陪伴 、 闲聊 , 对吧 。其实这就是今天这个时间点 , 豆包甚至几乎所有主流的 2C 的大模型 Chat 类产品在做的事情 。
当然耳机也 , 这个耳机因为来自于 Ola 这家公司 ,Ola dance 这家公司之前做 OWS 耳机 , 做的硬件本身也很好 , 所以它会说有超清 、 有音质的提升 、 有降噪 、 外观设计 、 各种各样佩戴方式 , 那当然也是特点 , 对吧 。
那这个时候你会发现 , 刚才我们列的这个这几个已经我们能够买得到的所谓 AI 耳机的东西 , 那就会出现一个问题 , 就是
从AI看耳机25:14
这个这个 , 为什么这些厂商要做这件事情 , 尤其是互联网公司 。 所以我们进入今天的第三个话题 , 从 AI 看耳机 ,也就是从 AI 厂商的角度看 AI 硬件的可能性 。
那第一个问题啊 , 就是我们抛开硬件本身 , 我们只说今天这个时间点 ,2024 年接近年底 ,ChatGPT 发布 O1, 头部的中国的创业大模型公司遇到阶段性瓶颈的这个时间点 , 对于所有的大模型公司 , 无论是创业公司还是大公司 , 接下来什么是重要的 , 或者说他们的 OKR 是什么 ?
我觉得三块 。 第一块 , 大模型本身技术能力的提升 , 细化到比如说之前可能在 2022 年到 2024 年上半年, 大家追寻 Sky and Cloud, 无限的去堆算力资源数据 , 无限的军备竞赛 , 然后多模态 , 对吧 。
然后 O1 发布之后, 大家开始卷后训练跟强化学习 , 就是大模型本身的能力提升 , 这是一块 。 第二块 , 名牌方向的产品打磨 。
什么是名牌方向 ?Chat 是 ,Agent 是 ,C 点 AI 曾经是 , 现在是不是不知道 ? 搜索 。 就这几个细分的产品形态 , 基本上就是名牌 , 所有人都会干的 。
那就是产品的打磨 、 推广 、 运营 、 功能的提升 、 用户体验的提升 , 对吧 。 第三块 , 更多的应用场景的探索
, 把生态扶持起来 ,以 token 量作为衡量的标准 , 对吧 。 最开始做生产力工具 , 或者做垂直行业 , 金融 、 法律 、 教育 , 对吧 。
然后 2C 端的娱乐 、 社交 、 游戏 , 再然后硬件 , 硬件在这里 。 所以你会发现 , 大模型本身的能力提升 , 名牌方向的产品的打磨 ,以及更多应用场景的探索 , 大概率就是这几家公司跟这些大厂们 、 大模型团队在做的事情 , 或者想做的事情 。
豆包当然也一样 , 对吧 。 大模型的提升就不用讲了 , 最应该上个月还是这个月 , 豆包发了他们的视频模型 , 对吧 。
多模态的最后一块版本补齐 , 然后模型本身技术能力在提升 , 然后 Chat,也就是说陪伴 、Agent、 搜索 , 然后我们去看 Coze 跟豆包的用户量 , 对吧 。在中国区的这些 2C 应用里面已经一举成了 , 对吧 。
然后第三块 , 更多应用场景探索 , 我们看到了今天的字节的这个耳机 , 对吧 。 逻辑上是一模一样的 。
但是呢 , 我们再回头来看这件事情啊 , 我们从一个执行的角度来看这件事情啊 , 字节大概是五六个月之前收购了 Ola, 当然收购之前应该双方就已经开始合作了 。
那这么短的时间 , 你寄希望于 Ola 在这款新的 AI 耳机上有什么特别创新性的想法 , 从执行难度上来看就不太可能 ,因为只有很短的时间 。
那如果今天 , 比如说我们想做 , 任何一个人想做一个所谓的 AI 耳机 , 你要面临很多的问题 , 你要做很多的选择题跟判断题 , 比如说造型上首先怎么选 , 对吧 。
选入耳 、 半入耳 、 开放式 、 骨传导 、 耳夹 , 对吧 。 没有对错 ,但是你要考虑当前的市场趋势 , 对吧 。OWS 就开放式耳机一定是风口浪尖的 , 对吧 。
那第二个问题 , 刚才我们聊过 , 要不要有端侧能力
? 没有 , 那就完全依赖手机的 APP。 那你手机 APP 就要做适配 , 对吧 。 如果有 , 屏幕 、 耗电 、 限定功能的考量都是问题 。
第三个问题 , 要不要设置特定的场景 ? 已经被证明成功 , 或者阶段性得到结果的场景 , 转文字 、 翻译 、 总结基本是标配了 。
那不做限定的话 , 你就要给用户去买你耳机的一个什么理由
。 然后同时, 无论是是否有端侧的能力 , 耳机这个形态挂在耳朵上, 你去跟它对话 , 大模型给出的结果是要做重新调整的 。
因为你会发现 , 今天这个时间点 , 大家在 PC 上或者在手机上用大模型产品的时候 , 你问它一个问题 , 或者做一个什么事情 , 它给的答案是比较长的 ,因为大家会越来越理解你的问题 。
可是耳机上越长就代表它要说越多 。 所以我们看 Ola 的这个这个实例的话 , 我去问豆包一个问题 , 用 PC 去问跟用耳机的语音去问 , 得出的答案的长度是完全不同的 。
耳机的那个长度是相对比较短的 , 那相当于你就是在做调整 。 也就是说 , 你要针对这个耳机在大模型端做所谓内容的围栏跟边界 , 这个怎么做 , 做成什么样子 , 标准是什么 , 要去想 。
第五个问题 , 软件功能是否需要订阅 ? 现在我们看到的 ,有的有 ,有的没有 。Ola 是没有的 , 讯飞的基础功能是没有 ,但是一些 VIP 功能是有的 。
那这个事情怎么定 ? 年费 、 月费 、VIP 还是什么 ? 什么样的功能需要付费 , 什么样功能不需要付费 ?
最后一个问题 , 怎么和体系内的 APP 联动 ? 我觉得大模型本身的产品 , 通过小程序跟 Agent 的方式去调用是相对容易的 ,但是跨 APP 之间的调用怎么来弄 ?
比如说 Ola 用了汽水音乐的能力 , 很多人会提能不能用飞书妙记的能力 , 这个跟第三个问题 , 要不要做特定场景的设置又相关 。
所有这些问题本质上没有标准答案 。 那你做这些选择的时候 , 这些无数的命题的选择 , 最后就变成你的产品
硬件延伸31:11
。 然后我们再把这个问题扩大到其他的 AI 硬件 , 比如说最近很热的雷朋跟 Meta 做的 AI 眼镜 。 我去查了一下,Google Glass 是 2011 年有新闻出来 ,2012 年 4 月份正式上线的 , 已经过去 12 年了 。
我们抛开 VR 跟 AR 眼镜 , 只说这个品类 , 就戴摄像头的这个耳机这个品类 , 这 12 年经历了什么 ?
看起来 Google Glass 就是先烈了 , 那雷朋的这个 Meta 的眼镜是先驱吗 ?
我们看回头看眼镜这个品类啊 , 智能眼镜 , 智能眼镜 , 你会发现现在主流 , 我们去京东 、 去淘宝能够看到的所谓智能眼镜 ,其实更合理的定义叫音频眼镜 。
也就是说在耳机的架上, 耳机腿上加了一个音箱 , 蓝牙音箱 , 然后你可以通过这个耳机打电话 , 简单的对话 , 问一个天气什么的 。
那这就是智能了 ,是吗 ? 做了这么多年, 即便是最近新发的一些所谓的智能眼镜 ,也还就只是一个音频眼镜 。
那你把大语言模型的机器人加上去 , 就是 AI 眼镜了 。 那我们再看 AR、VR 这个品类 , 最后是不是就变成了大号的显示器呢 ?150 寸 , 然后帮你把显示器换掉 , 换成一个更大的尺寸 。
那那些年我们对这个事情期待的元宇宙的叙事都去哪了 ?Apple 发的 Vision Pro 最大的意义是不是把这个新闻方向的终结给出了 ?
然后即便是雷朋这个眼镜卖了所谓 200 万台 , 那它到底是真的就是先驱吗 ? 因为现在几乎我们所了解的 , 做 AI 硬件的很多的公司 , 无论是创业公司还是大公司 , 可能都在做眼镜 。
那最后是真的做成了 , 还是说一地鸡毛呢 ? 不知道 。 然后再扩 , 比如说昨天还是今天 , 那个联想在美国开了发布会 , 对吧 , 请了 Nvidia、AMD、Facebook、 微软 、 高通 、Intel 的 CEO 来讲 。他几乎把今天这个事情 ,AI 这个领域最牛逼的核心的参与方全部拉过来了 。
为什么 ? 因为联想在推所谓的 AIPC, 对吧 。 那 AIPC 是什么呢 ? 因为微软也在推 AI 啊 , 对吧 。 那硬件 、 操作系统 、 浏览器 、APP, 似乎都在增 AI 的这个能力 , 对吧 。
我看了一下这个现在在卖的所谓的联想 AIPC, 对吧 ,有你的个人助理叫联想小天 , 可以聊天 、 总结 、 问答 、 小程序 、 回执 、 分身 、 声音克隆 、 识图 、 作画 、 做 APPT, 对吧 。
这就是 AIPC 了 ,是吗 ? 然后也很巧的是 , 前几天 ,因为我一直用 vivo 的手机 , 前几天 vivo 新发了他们的这个系统的最新的版本 ,也强调了 AI 的功能 。他们加了一个 AI 功能叫小圈搜 , 就是在手机上随时会呼出一个圈 , 你就用手一画就可以搜索 , 然后背后是 AI 的能力 。
那之前也有过 AI 的记录 、 写作 、 文案生成 、 图片生成 , 那这个就是 AI 手机了吗 ?
然后我们回头再去看啊 ,其实啊 , 中国有很多的互联网公司 , 都曾在某些时间点对硬件产生过妄念 , 比如说早年的手机年代 , 对吧 , 盒子的年代 , 音箱的年代 , 我们近期更熟悉的 VR 眼镜的年代 。
那下一个是什么 ? 然后呢 , 今天我想讲的大部分的内容 , 正式的内容可能就这些 。 然后最后我想讲一个小故事 , 跟一个一些暴论吧 。
跨越鸿沟35:24
这个小故事是这样 , 就是呃 , 我最近一年其实在上一个清华的这个班 , 然后我们班上有这个韶音的 CEO, 我们叫他浩哥 。
然后呢 , 我们班上一次游学是在今年的 5 月份还是 6 月份 , 去了科大讯飞去拜访 。 然后我们当然是这个科大讯飞接待了我们 , 然后科大讯飞有一个非常大的这个这个总部的这个类似展厅 , 然后最开始展示的是讯飞的公司历史 , 然后马上开始展示的就是大模型这套 , 对吧 。
那第一个当然站在 C 位的 , 就是讯飞的这个 AI 耳机跟 AI 翻译机 。 然后那个讲解员就开始讲 ,他们这个讯飞的这个耳机最近几年卖的挺好 , 为什么我们做这些技术积累是强在哪 , 对吧 , 包括声音的收集 、 转文字 、 翻译这些能力 , 对吧 。
然后呢 , 浩哥也在 , 然后呢 , 我就在那个当场问了浩哥这个问题 , 我说你们就是韶音 , 会把未来的技术发展路线上很重要的能力放在这些事情上 ?
浩哥摇了摇头说不会 。
也就是说 , 韶音这家公司 ,他之前是做骨传导这个品类 , 现在做开放式耳机的所有的品类啊 ,他们的优先级 , 或者说从他们的这个公司角度的战略角度的发展角度而言 ,他们要做的事情 , 或者他们在技术上需要克服的难处 , 可能跟 AI 短期内看不到什么关联 。
所以我问那个问题 , 我说你们会把技术能力或者技术的资源倾向在这个身上吗 ? 他说不会 。
当然这个问题我今天再去问 , 可能问题会有变化 ,但是在那个时间点 , 你明确感知到他说不会 。 所以这个引发了另外一个我之前用过的一张图 ,在我今年上半年讲 AI 英文那张 PPT 里有用过这张图 ,其实也是一个快被说烂的理论 , 就是跨越鸿沟这个理论 。
那昨天曾明教授讲 AI 应用的时候 ,也用了这个理论 。 我们只看 AI 硬件或者 AI 耳机这个品类 , 从所谓的早期接受者到早期大众 , 就是那个鸿沟 , 看起来可能还没有跨过去 , 对吧 。
所以呢 , 就变成因为很多朋友会知道 , 比如我用耳机比较多 , 包括最近也用了很多这样的 ,他会找我推荐 , 对吧 。
那怎么去推呢 ? 遇到不同的人, 当然有不同的推荐方式 。 我是这样想 , 我说第一 , 预算内首先要找一个好耳机 , 首先它得是一台好的耳机 , 当然好的标准有很多
, 我们前面提到的功能也好 , 场景也好 , 都是 ,但至少它要是一台好的耳机 。 第二 , 我会问是否有特殊的要求 , 无论是造型还是场景 , 这个可能会成为区别各个产品的很重要的因素 。
最后有很多朋友点名会问某某某 AI 耳机怎么样 。 当问到这个问题的时候 , 我会问他 , 你是所谓的早期接受者吗 ?
或者说你真的能够为一个今天这个时间点 ,其实有些模糊的 , 没有那么确定的 AI 功能去付出更多的溢价吗 ?
如果不是 , 那一个保险的选择一定是你用什么手机 , 就在预算内买你那个手机差不多的耳机 , 这是一个不出错的选择 。
所以呃 , 这就是我今天想跟大家分享的内容 。其实呃 , 我觉得没有什么答案跟结论 , 就是我所看到的状态 , 当下时间点 , 各家厂商的尝试 ,以及未来我们可能需要面临去解决的问题啊 。
消费电子还是一个非常非常复杂的行业啊 , 无数的人曾经想过自己是乔布斯 ,但无数人被埋在了不知道什么地方 , 对吧 。
希望未来有更好的 AI 耳机能够让我们用到 。 感谢大家收听我的节目 , 欢迎关注屠龙之术 , 谢谢 。






