跳至主要内容

NotebookLM

· 閱讀時間約 4 分鐘

昨天試用了 NotebookLM,雖然我一般來說不是太喜歡 Google 的產品,但我還是得說 NotebookLM 的「音訊導覽」功能真的非常有趣!

👂 聽聽看

聽 NotebookLM 的兩個主持人討論這篇文章(也就是他們自己)。

音訊導覽?

這個「音訊導覽」功能,簡單來說就是一個「AI Podcast 產生器」。你可以上傳任何文件給它,不論是部落格文章、論文、日記都可以;然後它就可以產生一段類似好檸檬 Podcast 風格的英文對話,由一男一女兩個 AI 主持人來討論你的文章(他們的節目名稱叫「Deep Dive」(深入探討))。

我上傳了幾篇這個部落格的貼文來試試看,聽兩個 AI 主持人討論自己寫的文章真的是很有娛樂性耶!我是說,這就像是合法版的「偷聽別人談論自己」,只是這次不用躲在門後聽了。

除了娛樂用途之外,我可以想像這個對於理解複雜文章會很有用,因為它是讓兩個 AI 用輕鬆聊天的方式討論給你聽,資訊的步調變慢了,所以可以讓你更容易吸收文章的內容。

要說有什麼明顯缺點的話,那就是它的 Podcast 有點太想要擬人了,所以會刻意加入些微的卡詞、笑聲(但有時候笑點不太好笑);以及其中一個人在講話時,另外一個人常常會反應太多,一直「Yep、Yes、Sure、嗯嗯、Totally、Exactly、Oh Wow」的,有點煩。

目前因為它還是測試版,所以是完全免費的,但我可以想像這個應該之後會變成付費服務。

有沒有辦法自己打造類似的功能?

其實 NotebookLM 大約就是把以下兩個步驟串起來而已:

  1. 用大型語言模型,把輸入的文件轉成兩人討論的 Podcast 逐字稿(這點用 Claude、ChatGPT 或各種離線模型都能做到)
  2. 把文字輸入到某種「文字轉語音」系統,產生最後的聲音檔案。(線上服務有很多家可以選擇,英文的話應該也有不少不錯的離線模型。)

GitHub 上面也有一個 open-notebooklm 專案,就是利用 Llama 3.1 和開放原始碼的文字轉語音模型來達成。我覺得效果沒有 Google 的好,但應該只要再給它一些時間就可以趕上了。

去試試看!

趁 NotebookLM 現在還免費,去試試看吧!