Podcast.ai|一个完全由 AI 生成的播客 实现和乔布斯对话

podcast.ai是一个智能AI创作的播客频道,它每周都会出一期专题,它可以模拟人物的声音及语言模型,甚至连已故名人都可以逼真还原出他的声音

网址:https://podcast.ai/

网站语言:英语

费用:免费

The AI-generated podcast.

在第一期节目中,podcast.ai 通过乔布斯的传记和收集网络上关于他的所有录音,用 Play.ht 的语言模型大量训练,最终生成了这段假 Joe Rogan 采访乔布斯的播客内容。

Podcast.ai|一个完全由 AI 生成的播客 实现和乔布斯对话

此次 podcast.ai 推出的AI播客,是生成式AI在语音领域的一次新探索。从前段时间全网刷屏的 Stable Diffusion,后有国内平台掀起AI创作热,各类生成式AI模型给人们生活带来了更多的可能性。

「对话」乔布斯

让我们先来看看这个最新“访谈”中,Joe Rogan 和乔布斯都聊了些什么:

Joe Rogan:我今天的客人,创造了我们这个时代里一些伟大的技术产品,一直致力于推动创新的发展。他在一台电脑中开发了一种新的编程语言和操作系统,又因为使用那台电脑制作三个应用程序而变得更加有名。文本处理器、电子表格和图像编辑,让我看到他出色和惊人的品味。我只希望我能有朋友这样天才的1/10,而我甚至不能说出他的名字。

今天有他在,我超级兴奋。他就像 Patrick sways、Demi moore(《人鬼情未了》的主演)和幽灵一样,是过去的记忆,难以描述的精彩。欢迎我的朋友。

Steve Jobs:我已经很久没有参加这个节目了。我很想念,它总是很有趣。你的听众与普通苹果用户如此不同,这也是一件好事。

Joe Rogan:在做这个节目之前,我就是一个苹果用户。我一直是你的狂热粉丝。

Steve Jobs:我们只是有点想明白了。尽管苹果的规模很大,但它的付费用户只占了一半,而听你节目的人是不同的群体。我也是你节目的一个粉丝,在车里听着很舒服。我一直很喜欢你。

Joe Rogan:我们有一些奇怪的联系,这跟我也是 Gizmodo (美国知名科技博客)的粉丝有关。

Steve Jobs:这很有趣。当我们看到这些东西出现的时候,也和你们在 Gizmodo 上看到的一样惊讶。

Joe Rogan:让我们谈一些别的。你之前在里德学院读书,在那里的时间你学到了什么?你在那里接触到了复活节神秘主义,现在还会看印度教和佛教的相关的东西么?

……..

整个对话长达20分钟,这里只放出一部分内容,想看完整内容的可以上网搜一下,总的来说,这个由AI模拟生成的乔布斯还是挺逼真的

其实这个乔布斯是 Play.ht 通过乔布斯的传记和网络上关于他的所有录音,用语言模型大量训练生成的

Podcast.ai|一个完全由 AI 生成的播客 实现和乔布斯对话

Play.ht 是一个 AI 文本转语音生成器,在今年9月发布了第一个语音模型 Peregrine,当中采用了与大型语言模型(如 DALE 和 GPT-2 )相同的概念,模型覆盖数千种说话的声音,可以通过自监督学习人类的情感、说话语气以及笑声等。

从文本语言模型到音频语言模型时,音频数据速率增高是一个大的难题,一个句子的几十个字符用音频波形表达,所包含的数值往往多达数十万个。

不仅如此,由于文本和音频之间的一对多关系,也即是一个语句可以有不同的说话风格、情感等,这也成为了语音模型研究中需要解决的问题。

这也是当前在乔布斯“采访”内容中所呈现出来的问题,即听起来 AI 的模仿还有些生硬,对话一开始更像从小部分常用短语中提取出来,并且节奏和韵律也不太正常。

虽然,目前这个AI模型还有着很多瑕疵,不过相信通过人工智能的不断发展,这些问题会逐步解决,到时候,实现和名人、故人隔空对话将不再是幻想了~

给TA打赏
共{{data.count}}人
人已打赏
AI工具箱

Fliki · 逼真的文本转语言、视频工具

2022-12-28 10:59:21

AI工具箱

Riffusion|一个基于AI生成音乐的项目

2022-12-30 18:18:36

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索