NotebookLM
昨天試用了 NotebookLM,雖然我一般來說不是太喜歡 Google 的產品,但我還是得說 NotebookLM 的「音訊導覽」功能真的非常有趣!
👂 聽聽看
聽 NotebookLM 的兩個主持人討論這篇文章(也就是他們自己)。
音訊導覽?
這個「音訊導覽」功能,簡單來說就是一個「AI Podcast 產生器」。你可以上傳任何文件給它,不論是部落格文章、論文、日記都可以;然後它就可以產生一段類似好檸檬 Podcast 風格的英文對話,由一男一女兩個 AI 主持人來討論你的文章(他們的節目名稱叫「Deep Dive」(深入探討))。
我上傳了幾篇這個部落格的貼文來試試看,聽兩個 AI 主持人討論自己寫的文章真的是很有娛樂性耶!我是說,這就像是合法版的「偷聽別人談論自己」,只是這次不用躲在門後聽了。
除了娛樂用途之外,我可以想像這個對於理解複雜文章會很有用,因為它是讓兩個 AI 用輕鬆聊天的方式討論給你聽,資訊的步調變慢了,所以可以讓你更容易吸收文章的內容。
要說有什麼明顯缺點的話,那就是它的 Podcast 有點太想要擬人了,所以會刻意加入些微的卡詞、笑聲(但有時候笑點不太好笑);以及其中一個人在講話時,另外一個人常常會反應太多,一直「Yep、Yes、Sure、嗯嗯、Totally、Exactly、Oh Wow」的,有點煩。
目前因為它還是測試版,所以是完全免費的,但我可以想像這個應該之後會變成付費服務。
有沒有辦法自己打造類似的功能?
其實 NotebookLM 大約就是把以下兩個步驟串起來而已:
- 用大型語言模型,把輸入的文件轉成兩人討論的 Podcast 逐字稿(這點用 Claude、ChatGPT 或各種離線模型都能做到)
- 把文字輸入到某種「文字轉語音」系統,產生最後的聲音檔案。(線上服務有很多家可以選擇,英文的話應該也有不少不錯的離線模型。)
GitHub 上面也有一個 open-notebooklm 專案,就是利用 Llama 3.1 和開放原始碼的文字轉語音模型來達成。我覺得效果沒有 Google 的好,但應該只要再給它一些時間就可以趕上了。
去試試看!
趁 NotebookLM 現在還免費,去試試看吧!