跳至主要内容

私廚與 AI 音樂

· 閱讀時間約 7 分鐘

看到 Alex Hsu 這篇〈現點現做的盲盒音樂〉,說他會用 Suno AI 產生音樂給自己聽。

「取消 Spotify 訂閱半年了。本來還有點無聊。結果現在我每天都在聽音樂,自己生成的。……這就是我說的現點現做的盲盒音樂。而且要它唱什麼就唱什麼。像私廚一樣,告訴它你想要什麼口味,當場做給你。」

──Alex Hsu

(Alex 會主持三月份的 BlogBlog 同樂會,大家請繼續支持,用力投稿唷!)

看到 Alex 說「私廚」,我好像突然想通了一件事:對於大腦來說,聽到一首好聽的音樂,感受其實比較接近「吃到好吃的拉麵」,而比較不像「讀到一篇好文章」。

音樂提供的是更接近底層的「感官刺激」,而不是高層的「資訊傳遞」。這就是為什麼 Alex 的私廚比喻成立──你不需要知道今天的晚餐是哪個主廚做的,好吃就好。

「個人色彩」可能沒有那麼個人

老實說,自從 Suno 變得很強之後,我自己對數位音樂製作的興趣真的降低了不少

因為意識到音樂創作的「解決方案空間」(solution space)1比想像中還要狹窄。換句話說,在音樂中能夠放入的「個人色彩」,並不像其他藝術媒介那麼多;尤其是當你還想要兼顧這音樂能被一般人覺得「好聽」的話。

你當然可以用特殊的音色、句型、和弦、演奏法來區別你自己的個人色彩;但不管怎麼做,要被一般人覺得「好聽」,還是得在一個共識與範圍裡面。和弦的張力和解決、節奏的身體律動、旋律的預期與驚喜,都是有公式的。在這範圍裡面的「個人色彩」,其實也沒有那麼「個人色彩」。

你可能會反駁:「可是 YOASOBI、久石讓、蕭邦、Jacob Collier 的音樂都很有個人色彩啊!」當然沒錯,可是他們真的「那麼有」個人色彩到 AI 無從歸類分析的程度嗎?退一步說,就算 AI 沒有辦法學到很像,一般聽眾真的能辨認出那個「個人色彩」嗎?

除了少部份有研究的聽眾之外,我相信大部分人是無法分辨蕭邦、舒曼、舒伯特、孟德爾頌的鋼琴作品之間的差異的。這些作曲大師們都很有「個人色彩」,同時也不夠有──有是因為他們的差異具體到足以被描述、統計、甚至被模仿,不夠有是因為他們都還是落在「好聽的鋼琴曲」的範圍。

如果說「平凡無奇的大眾口味」是常態分佈的正中央,那大師們的「個人色彩」會不會只是位在「正中央稍微偏離一點點」的地方而已呢?因為如果太有個人色彩、偏離太多,就不會被大眾認為是「好聽」了呀2!既然大師們也只是在「好聽」的邊界上遊走,那這些相對微小的偏移量,遲早也會變成 AI 模型裡一個可以隨意調整的旋鈕,對吧?

我願意吃 AI 做的哪些東西?

讓我們來做一個跨媒介的思想實驗。想像所有東西都有 AI「私廚」,那你要吃嗎?

  • 📝 文字:想讀一個日常部落格,叫大型語言模型寫「專屬給我看的部落格」給我?好像不成立,看部落格是想要關心窺探另一個人類的生活,誰在乎 ChatGPT 今天的心情如何?
  • 🎬 影片:想看什麼影片,就叫 AI 生給我?好像也不成立。影片的價值很大一部份來自「真的有這個人」、「真的有這個地方」、「這件事真的發生了」,AI 影片做得再美也是假的。
  • 🎙️ 談話:想聽什麼 Podcast,就叫 AI 生給我?也許成立,要看主題。知識型的 Podcast 好像真的可以喔(NotebookLM 生成的對話節目其實滿好聽的)!但閒聊、陪伴、幹話型的可能就不行,我還是需要知道另一端是真正的人類。
  • 🍜 食物:我想吃一碗拉麵,AI 做給我?完全可以!我才不 care 拉麵是誰做的。好吃就好!再來一碗!
  • ❄️ 空調:AI 幫我自動溫控?當然好啊!誰在乎這冷氣是哪位工程師設計的,或者日本製的壓縮機到底稀不稀少,只要它可以噴出冷風我就開心了。

發現這個光譜了嗎?一端是「你在意這是誰做的」(日常部落格、紀實影片、閒聊型 Podcast),另一端是「你只在意結果的」(拉麵、冷氣)。

把音樂擺回這個光譜上看看。是不是有點驚訝,它的位置,比你想像中還要更靠近拉麵和冷氣那頭?3

輸出端 vs. 輸入端

我覺得可以這樣理解:音樂的價值大部分在「輸出端」──也就是你耳朵聽到的聲波本身。而文字和影片的價值有更大一部份在「輸入端」──這是誰寫的、這在哪裡、事情是不是真的發生了。

大部分人可以開心地聽一首不知道是誰做的 lo-fi beats to study to;但你很難想像有人會願意看 AI 虛擬人物的「今天早上我吃了蛋餅」日記。

這不是在貶低音樂,正好相反。音樂厲害到它不需要依賴真實人物和事件就能感動你,但這種「純粹」也是最大的弱點,反而讓音樂成為最容易被 AI 取代的藝術形式。

雖然不想承認,但我自己的身體早已給出了答案:我對於每天在這個 blog 上寫生活廢文的熱情,遠遠高過打開編曲軟體做音樂。看來我的潛意識早就搞懂哪一種創作比較不可被取代了(先不考慮賺不賺錢的問題)。

其實這不是新聞

這甚至不是 AI 時代的新發現:現場演唱會的票價越來越貴4,但串流分潤卻越來越低5。市場早就在跟我們說「錄好的音樂」沒有價值了,「演出」和「互動」才有。

音樂還是可以很有「個人色彩」的,但那要靠表演者的演出、人與人的互動來達成。光靠作曲、編曲和混音恐怕是撐不住了。

所以這篇的結論是什麼?那就是身為音樂人,未來的出路很明顯了。我們要走回「實體」、「體驗」和「陪伴」的路線。教鋼琴、現場演出、領導活動,這些連結到真實人物和事件的事情,才是價值的所在。

以後想要真正「享受音樂」,大概得自己動手去演奏它吧,所以還是去練琴比較實在。至於那些完美的數位聲音檔案?叫你的私廚做給你就好啦!

(如果你讀完這篇突然有點開始想練鋼琴,歡迎來參加好和弦的《鋼琴技巧急診室》!)

Footnotes

  1. 所有可行做法的集合。「煮一碗泡麵」的解決方案空間很小,大家煮出來都差不多。「寫一本小說」的空間就大得多。空間越小,AI 越容易覆蓋到每一個角落。

  2. 更偏離一點就叫「實驗音樂」,再偏更多就叫「噪音」,偏到底就叫做「鄰居小孩在練小提琴」。

  3. 當然,對於喜愛研究音樂的人來說,我們是把音樂當作文章在讀的,不過畢竟我們是少數。

  4. https://www.cnbc.com/2025/01/31/funflation-concert-ticket-prices-soar-but-music-fans-dont-care.html
    電影、劇場與演唱會的門票費用自 2021 年以來上漲了 20%,而且消費者照買不誤。這個現象甚至有了專有名詞叫「funflation」。

  5. https://www.headphonesty.com/2024/12/concert-ticket-prices-control-not-changing/
    串流收入不足以支撐音樂人的收入,演唱會已經成為藝人的主要收入來源。以前巡演是為了宣傳專輯,現在完全反過來了。