声音，是 AI 创业的隐藏入口？和 ListenHub 创始人聊语音产品的下一波机会

文稿列表
文稿详情

使用同款在线工具，轻松提取B站小红书小宇宙视频播客文案。

内容要点:

1. 图拉斯推出的指点壳令创作者在工作中更自由和轻松，支持多种使用场景及个性化表达。
2. 指点壳背后的支架功能极大提升了办公环境的整洁性，替代了传统复杂设备。
3. AI语音领域具有巨大的发展潜力，用户对AI生成内容的接受度逐渐增强，但对于人性化的真实交流需求依然存在。
4. 未来音频市场的发展空间会逐渐增大，尤其是融合AI与创作者参与的新模式。
5. 创作者的需求正在向更深层次的人性化体验转变，简单、个性化的工具将更易于获得用户青睐。

在AI时代，工具让生活和创造变得更加简单。手机已经成为工作的中心，而手机壳也随之迭代升级。图拉斯推出的指点壳，让创作变得更加自由与轻松，支撑起工作的节奏，记录每一个热爱的瞬间。接下来的三分钟，请大家一起探索图拉斯指点壳所带来的新生活方式。

我们每天都在使用手机，而与手机息息相关的手机壳，其主要作用是什么呢？很多人的初始定义是防震，因为手机常常摔落。最早对我而言，它只是一层保护，类似于手机的衣服，使手机看起来更美观，为其提供基础保护。而个性表达则是大多数人对手机壳的认知，但图拉斯发现，这个小小的辅助工具其实还有更多的可能性。

自从使用图拉斯指点壳后，大家对手机壳的看法逐渐发生了变化。指点壳在提升工具属性方面表现得更加出色。预建品牌创始人Lily认为，在商务场景中，指点壳更加适配。例如，指点壳背后的支架，已经替代了她办公桌上原有的复杂支架，使得桌面更加整洁。而运动饮料品牌力克的CEO李宇则改变了自己的工作习惯，曾一度将手机壳抛弃。经过使用图拉斯的产品，他感受到手的替代作用，仿佛让他在工作中自由地跳跃。

在使用支点壳方面，李宇有着独特的心得。他非常喜欢这个壳的支撑功能，比如他可以在一旁观看两个屏幕。同时，内衣品牌“和时”的联合创始人Sara也发现了新的用法。在内蒙古的小村庄拍摄产品外景时，Sara通过将指点壳挂在篱笆杆子上，成功固定了手机，记录下了当时的美好场景。当手机成为可移动的生产力枢纽时，托拉斯指点壳以其独特的功能实现了场景切换的自由。它安静地陪伴着大家，解放双手，助力创造，让生活的节奏更加自由从容。

为了探索在新的智能时代下创造如何更自如、记录如何更自在，图拉斯与品牌星球走访了包括Lily、Liyu和Sara在内的十位超级创造者。他们不再被单一的职业身份定义，而是主动编织着主理人、博主、父母和探索者等多元角色的生命经纬。这些故事最终汇集成一本超级创造者的生活方式图鉴，记录着当代创造者们的生活样本，反映出我们多面生活的另一种侧面。在不同身份和状态的转换中，图拉斯指点壳始终如影随形，成为服务我们的好伙伴，帮助我们更自在地衔接生活与创造。

在这一过程中，我们通过声音碰撞世界，带来生动的对话，与全球创新同步。这是科技早知道，我是丁角，欢迎来到我们的全球商业早知道栏目。在这个新专栏里，我会与Aaron一同聊聊全球范围内的创业故事、市场趋势和资本方向，从中国到世界，从创新到投资，带你探索全球机会。

哈喽，大家好，欢迎来到今天的科技早知道栏目。今天，我也是与Aaron联合主持的全球商业早知道。今天的嘉宾是ListenHub的创始人兼CEO李友橘子。李友橘子，你能简单介绍一下自己的背景吗？其实你并不是技术出身，而是产品经理出身，对吗？在此之前，你曾在minimax做音频方面的工作。我的整个履历可以分为两个大段；一个是AI时代，2022年底我去了minimax，入职两周后Charity发布了新产品。

在拆GDP之前我就已经入职了，正好踩在了这个风口上。负责公司工具产品方向的工作，比如写作和聊天功能。所以我在那里的职位是product lead，一共做了500天。那个阶段是行业里变化最激烈的，而我出来时，正好是SORA发布后的时期。虽然我的背景并非完全科技出身，但我发现自己在内容方面的成功转型，逐渐走向AI创业的道路。

我本来以为我有技术背景，但实际上不是。我学习的是文科，而我在大学时是文科学生。虽然高中时期我是全校理科第一名，但因为不想学数学，最终选择了语言学。后来我发现大学没有专门的语言学专业，只能选择学习语言，于是我写了一本叫《对外汉语》的书，旨在教外国人讲汉语。我当时觉得中国的崛起一定会催生强烈的全球需求。然而，毕业后我发现就业形势并不乐观，全球经济也在开始脱钩。现在，中国虽然依然在崛起，但可能是在另一个维度上发展。

我觉得事情之间是有联系的，就像"collecting the dots"。Leo是一个理科生，选择了文科并学习对外汉语，他的工作就是把汉语转化为外国人能听懂的语言，或将其他语言转化为我们可以理解的汉语，一切都与声音息息相关。在大学期间，我也接触了一些先进的语言理论，比如乔姆斯基的生成语法和索绪尔的理论。然而，随着大模型的出现，许多传统的理论似乎变得过时，语言的核心被技术重新定义，模型训练模式有效地解决了这一问题。可以说，我的背景在某种程度上也为如今的工作积累了经验。

我们在午饭时聊到，语音行业在中国似乎一直处于一种不温不火的状态。Leo最近完成了一轮融资，pitch了很多投资人，大家对语音赛道的质疑声也不小。前30分钟，我回顾了中国互联网语音科技发展的历程，思考为什么喜马拉雅尚未上市，为什么小宇宙在多年的发展中用户数量仍然不理想，种种疑问我也无从回答，只知道AI和语音领域会有很多新的机会，但为何以往没有成功，依然是个谜。

在这个领域创业时，我看到的机会在于随着AI的发展，语音的应用潜力激增。细想人类的发展史，语音是最早的交流方式，而文字的出现则相对较晚。语音的历史是文字的10到100倍，我们以语音交流是最自然的方式，录制播客时更是如此。文字曾被视为精英的传播手段，识字的人在当时并不多。近几年，有个名为PLOD的产品迅速崛起，它是一种小型录音卡片，而不仅仅是录音笔。尽管录音笔市场已有10年历史，现在却因AI的助力迎来爆发，年收入达3亿美元，令人惊讶。这是因为AI能够将线性的录音进行加工，转化为图表或视频，进而提升其使用价值。

另外，一家名为11Labs的波兰公司致力于解决电影配音问题。他们发现此领域无人问津，最终自己去训练模型，成为一家语音模型公司。目前，中国和美国对语音模型都不十分重视，这个领域被低估，我认为机会依然很多。过去一段时间，视频赛道的崛起与语音赛道的相对冷清有很大关系，因为视频找到了明确的商业化方向，而语音却在商业化上一直没能找到理想的路径。我们尝试让内容付费，但整体市场规模仍不够大。期待有一天像Leo这样的项目能够引领语音行业的发展。

关于产品形态，目前我们可以将其视为一款为语音创作者提供的工具，功能非常简洁。用户可以输入话题或上传PDF、YouTube链接，使内容转变为AI播客。其次，用户可以上传已写好的稿件，我们为其配音。还有一个最新的实验性功能是可以上传图片，比如我传一张家里的猫的照片，系统会根据这张图片生成一个故事，作为绘本视频，适合与家人或爱人一起分享。这些功能在AI播客和配音领域中，我们称之为"flow speech"，是全球首个结合大语言模型和TTS模型的智能配音创新。

我们在今年5月份上线了这款新产品。上线后，用户数量和收入都实现了三倍的增长。StoreBook这款创新产品展示了我们的潜力，实际上我们还有一系列待推出的新产品，最近我们刚完成了一款音乐相关的产品。你知道，目前苏诺也非常火，比如说用户可以把周杰伦的歌曲上传，然后让它用陶喆的声音进行演唱。这类语音方向的探索，我们希望最终能够实现一个通过语音交互获得所需内容的系统。比如说，在睡前，我希望得到一段冥想引导，结合我的个人记忆，提供一段催眠内容。这些核心技术我们采用的是Flow Speech，将TTS（文本到语音）和大型语言模型相结合，以此作为我们的语音基础架构。

语音是

声音，是 AI 创业的隐藏入口？和 ListenHub 创始人聊语音产品的下一波机会 | S9E36

内容要点: