Podcast.ai|一個完全由 AI 生成的播客 實現和喬布斯對話

podcast.ai是一個智能AI創作的播客頻道,它每周都會出一期專題,它可以模擬人物的聲音及語言模型,甚至連已故名人都可以逼真還原出他的聲音

網址:https://podcast.ai/

網站語言:英語

費用:免費

The AI-generated podcast.

在第一期節目中,podcast.ai 通過喬布斯的傳記和收集網絡上關於他的所有錄音,用 Play.ht 的語言模型大量訓練,最終生成了這段假 Joe Rogan 採訪喬布斯的播客內容。

Podcast.ai|一個完全由 AI 生成的播客 實現和喬布斯對話

此次 podcast.ai 推出的AI播客,是生成式AI在語音領域的一次新探索。從前段時間全網刷屏的 Stable Diffusion,後有國內平台掀起AI創作熱,各類生成式AI模型給人們生活帶來了更多的可能性。

「對話」喬布斯

讓我們先來看看這個最新“訪談”中,Joe Rogan 和喬布斯都聊了些什麼:

Joe Rogan:我今天的客人,創造了我們這個時代里一些偉大的技術產品,一直致力於推動創新的發展。他在一台電腦中開發了一種新的編程語言和操作系統,又因為使用那台電腦製作三個應用程序而變得更加有名。文本處理器、電子表格和圖像編輯,讓我看到他出色和驚人的品味。我只希望我能有朋友這樣天才的1/10,而我甚至不能說出他的名字。

今天有他在,我超級興奮。他就像 Patrick sways、Demi moore(《人鬼情未了》的主演)和幽靈一樣,是過去的記憶,難以描述的精彩。歡迎我的朋友。

Steve Jobs:我已經很久沒有參加這個節目了。我很想念,它總是很有趣。你的聽眾與普通蘋果用戶如此不同,這也是一件好事。

Joe Rogan:在做這個節目之前,我就是一個蘋果用戶。我一直是你的狂熱粉絲。

Steve Jobs:我們只是有點想明白了。儘管蘋果的規模很大,但它的付費用戶只佔了一半,而聽你節目的人是不同的群體。我也是你節目的一個粉絲,在車裡聽着很舒服。我一直很喜歡你。

Joe Rogan:我們有一些奇怪的聯繫,這跟我也是 Gizmodo (美國知名科技博客)的粉絲有關。

Steve Jobs:這很有趣。當我們看到這些東西出現的時候,也和你們在 Gizmodo 上看到的一樣驚訝。

Joe Rogan:讓我們談一些別的。你之前在里德學院讀書,在那裡的時間你學到了什麼?你在那裡接觸到了復活節神秘主義,現在還會看印度教和佛教的相關的東西么?

……..

整個對話長達20分鐘,這裡只放出一部分內容,想看完整內容的可以上網搜一下,總的來說,這個由AI模擬生成的喬布斯還是挺逼真的

其實這個喬布斯是 Play.ht 通過喬布斯的傳記和網絡上關於他的所有錄音,用語言模型大量訓練生成的

Podcast.ai|一個完全由 AI 生成的播客 實現和喬布斯對話

Play.ht 是一個 AI 文本轉語音生成器,在今年9月發布了第一個語音模型 Peregrine,當中採用了與大型語言模型(如 DALE 和 GPT-2 )相同的概念,模型覆蓋數千種說話的聲音,可以通過自監督學習人類的情感、說話語氣以及笑聲等。

從文本語言模型到音頻語言模型時,音頻數據速率增高是一個大的難題,一個句子的幾十個字符用音頻波形表達,所包含的數值往往多達數十萬個。

不僅如此,由於文本和音頻之間的一對多關係,也即是一個語句可以有不同的說話風格、情感等,這也成為了語音模型研究中需要解決的問題。

這也是當前在喬布斯“採訪”內容中所呈現出來的問題,即聽起來 AI 的模仿還有些生硬,對話一開始更像從小部分常用短語中提取出來,並且節奏和韻律也不太正常。

雖然,目前這個AI模型還有着很多瑕疵,不過相信通過人工智能的不斷發展,這些問題會逐步解決,到時候,實現和名人、故人隔空對話將不再是幻想了~

給TA打賞
共{{data.count}}人
人已打賞
AI工具箱

Fliki · 逼真的文本轉語言、視頻工具

2022-12-28 10:59:21

AI工具箱

Riffusion|一個基於AI生成音樂的項目

2022-12-30 18:18:36

0 條回復 A文章作者 M管理員
    暫無討論,說說你的看法吧
個人中心
今日簽到
有新私信 私信列表
搜索