
在AI时代,工具让生活和创造变得更加简单。手机已经成为工作的中心,而手机壳也随之迭代升级。图拉斯推出的指点壳,让创作变得更加自由与轻松,支撑起工作的节奏,记录每一个热爱的瞬间。接下来的三分钟,请大家一起探索图拉斯指点壳所带来的新生活方式。
我们每天都在使用手机,而与手机息息相关的手机壳,其主要作用是什么呢?很多人的初始定义是防震,因为手机常常摔落。最早对我而言,它只是一层保护,类似于手机的衣服,使手机看起来更美观,为其提供基础保护。而个性表达则是大多数人对手机壳的认知,但图拉斯发现,这个小小的辅助工具其实还有更多的可能性。
自从使用图拉斯指点壳后,大家对手机壳的看法逐渐发生了变化。指点壳在提升工具属性方面表现得更加出色。预建品牌创始人Lily认为,在商务场景中,指点壳更加适配。例如,指点壳背后的支架,已经替代了她办公桌上原有的复杂支架,使得桌面更加整洁。而运动饮料品牌力克的CEO李宇则改变了自己的工作习惯,曾一度将手机壳抛弃。经过使用图拉斯的产品,他感受到手的替代作用,仿佛让他在工作中自由地跳跃。
在使用支点壳方面,李宇有着独特的心得。他非常喜欢这个壳的支撑功能,比如他可以在一旁观看两个屏幕。同时,内衣品牌“和时”的联合创始人Sara也发现了新的用法。在内蒙古的小村庄拍摄产品外景时,Sara通过将指点壳挂在篱笆杆子上,成功固定了手机,记录下了当时的美好场景。当手机成为可移动的生产力枢纽时,托拉斯指点壳以其独特的功能实现了场景切换的自由。它安静地陪伴着大家,解放双手,助力创造,让生活的节奏更加自由从容。
为了探索在新的智能时代下创造如何更自如、记录如何更自在,图拉斯与品牌星球走访了包括Lily、Liyu和Sara在内的十位超级创造者。他们不再被单一的职业身份定义,而是主动编织着主理人、博主、父母和探索者等多元角色的生命经纬。这些故事最终汇集成一本超级创造者的生活方式图鉴,记录着当代创造者们的生活样本,反映出我们多面生活的另一种侧面。在不同身份和状态的转换中,图拉斯指点壳始终如影随形,成为服务我们的好伙伴,帮助我们更自在地衔接生活与创造。
在这一过程中,我们通过声音碰撞世界,带来生动的对话,与全球创新同步。这是科技早知道,我是丁角,欢迎来到我们的全球商业早知道栏目。在这个新专栏里,我会与Aaron一同聊聊全球范围内的创业故事、市场趋势和资本方向,从中国到世界,从创新到投资,带你探索全球机会。
哈喽,大家好,欢迎来到今天的科技早知道栏目。今天,我也是与Aaron联合主持的全球商业早知道。今天的嘉宾是ListenHub的创始人兼CEO李友橘子。李友橘子,你能简单介绍一下自己的背景吗?其实你并不是技术出身,而是产品经理出身,对吗?在此之前,你曾在minimax做音频方面的工作。我的整个履历可以分为两个大段;一个是AI时代,2022年底我去了minimax,入职两周后Charity发布了新产品。
在拆GDP之前我就已经入职了,正好踩在了这个风口上。负责公司工具产品方向的工作,比如写作和聊天功能。所以我在那里的职位是product lead,一共做了500天。那个阶段是行业里变化最激烈的,而我出来时,正好是SORA发布后的时期。虽然我的背景并非完全科技出身,但我发现自己在内容方面的成功转型,逐渐走向AI创业的道路。
我本来以为我有技术背景,但实际上不是。我学习的是文科,而我在大学时是文科学生。虽然高中时期我是全校理科第一名,但因为不想学数学,最终选择了语言学。后来我发现大学没有专门的语言学专业,只能选择学习语言,于是我写了一本叫《对外汉语》的书,旨在教外国人讲汉语。我当时觉得中国的崛起一定会催生强烈的全球需求。然而,毕业后我发现就业形势并不乐观,全球经济也在开始脱钩。现在,中国虽然依然在崛起,但可能是在另一个维度上发展。
我觉得事情之间是有联系的,就像"collecting the dots"。Leo是一个理科生,选择了文科并学习对外汉语,他的工作就是把汉语转化为外国人能听懂的语言,或将其他语言转化为我们可以理解的汉语,一切都与声音息息相关。在大学期间,我也接触了一些先进的语言理论,比如乔姆斯基的生成语法和索绪尔的理论。然而,随着大模型的出现,许多传统的理论似乎变得过时,语言的核心被技术重新定义,模型训练模式有效地解决了这一问题。可以说,我的背景在某种程度上也为如今的工作积累了经验。
我们在午饭时聊到,语音行业在中国似乎一直处于一种不温不火的状态。Leo最近完成了一轮融资,pitch了很多投资人,大家对语音赛道的质疑声也不小。前30分钟,我回顾了中国互联网语音科技发展的历程,思考为什么喜马拉雅尚未上市,为什么小宇宙在多年的发展中用户数量仍然不理想,种种疑问我也无从回答,只知道AI和语音领域会有很多新的机会,但为何以往没有成功,依然是个谜。
在这个领域创业时,我看到的机会在于随着AI的发展,语音的应用潜力激增。细想人类的发展史,语音是最早的交流方式,而文字的出现则相对较晚。语音的历史是文字的10到100倍,我们以语音交流是最自然的方式,录制播客时更是如此。文字曾被视为精英的传播手段,识字的人在当时并不多。近几年,有个名为PLOD的产品迅速崛起,它是一种小型录音卡片,而不仅仅是录音笔。尽管录音笔市场已有10年历史,现在却因AI的助力迎来爆发,年收入达3亿美元,令人惊讶。这是因为AI能够将线性的录音进行加工,转化为图表或视频,进而提升其使用价值。
另外,一家名为11Labs的波兰公司致力于解决电影配音问题。他们发现此领域无人问津,最终自己去训练模型,成为一家语音模型公司。目前,中国和美国对语音模型都不十分重视,这个领域被低估,我认为机会依然很多。过去一段时间,视频赛道的崛起与语音赛道的相对冷清有很大关系,因为视频找到了明确的商业化方向,而语音却在商业化上一直没能找到理想的路径。我们尝试让内容付费,但整体市场规模仍不够大。期待有一天像Leo这样的项目能够引领语音行业的发展。
关于产品形态,目前我们可以将其视为一款为语音创作者提供的工具,功能非常简洁。用户可以输入话题或上传PDF、YouTube链接,使内容转变为AI播客。其次,用户可以上传已写好的稿件,我们为其配音。还有一个最新的实验性功能是可以上传图片,比如我传一张家里的猫的照片,系统会根据这张图片生成一个故事,作为绘本视频,适合与家人或爱人一起分享。这些功能在AI播客和配音领域中,我们称之为"flow speech",是全球首个结合大语言模型和TTS模型的智能配音创新。
我们在今年5月份上线了这款新产品。上线后,用户数量和收入都实现了三倍的增长。StoreBook这款创新产品展示了我们的潜力,实际上我们还有一系列待推出的新产品,最近我们刚完成了一款音乐相关的产品。你知道,目前苏诺也非常火,比如说用户可以把周杰伦的歌曲上传,然后让它用陶喆的声音进行演唱。这类语音方向的探索,我们希望最终能够实现一个通过语音交互获得所需内容的系统。比如说,在睡前,我希望得到一段冥想引导,结合我的个人记忆,提供一段催眠内容。这些核心技术我们采用的是Flow Speech,将TTS(文本到语音)和大型语言模型相结合,以此作为我们的语音基础架构。
语音是