私廚與 AI 音樂
看到 Alex Hsu 這篇〈現點現做的盲盒音樂〉,說他會用 Suno AI 產生音樂給自己聽。
「取消 Spotify 訂閱半年了。本來還有點無聊。結果現在我每天都在聽音樂,自己生成的。⋯⋯這就是我說的現點現做的盲盒音樂。而且要它唱什麼就唱什麼。像私廚一樣,告訴它你想要什麼口味,當場做給你。」
──Alex Hsu
(Alex 會主持三月份的 BlogBlog 同樂會,大家請繼續支持,用力投稿唷!)
看到 Alex 說「私廚」,我好像突然想通了一件事:對於大腦來說,聽到一首好聽的音樂,感受其實比較接近「吃到好吃的拉麵」,而比較不像「讀到一篇好文章」。
音樂提供的是更接近底層的「感官刺激」,而不是高層的「資訊傳遞」。這就是為什麼 Alex 的私廚比喻成立──你不需要知道今天的晚餐是哪個主廚做的,好吃就好。
「個人色彩」可能沒有那麼個人
老實說,自從 Suno 變得很強之後,我自己對數位音樂製作的興趣真的降低了不少。
因為意識到音樂創作的「解決方案空間」(solution space)1比想像中還要狹窄。換句話說,在音樂中能夠放入的「個人色彩」,並不像其他藝術媒介那麼多;尤其是當你還想要兼顧這音樂能被一般人覺得「好聽」的話。
你當然可以用特殊的音色、句型、和弦、演奏法來區別你自己的個人色彩;但不管怎麼做,要被一般人覺得「好聽」,還是得在一個共識與範圍裡面。和弦的張力和解決、節奏的身體律動、旋律的預期與驚喜,都是有公式的。在這範圍裡面的「個人色彩」,其實也沒有那麼「個人色彩」。
你可能會反駁:「可是 YOASOBI、久石讓、蕭邦、Jacob Collier 的音樂都很有個人色彩啊!」當然沒錯,可是他們真的「那麼有」個人色彩到 AI 無從歸類分析的程度嗎?退一步說,就算 AI 沒有辦法學到很像,一般聽眾真的能辨認出那個「個人色彩」嗎?
除了少部份有研究的聽眾之外,我相信大部分人是無法分辨蕭邦、舒曼、舒伯特、孟德爾頌的鋼琴作品之間的差異的。這些作曲大師們都很有「個人色彩」,同時也不夠有──有是因為他們的差異具體到足以被描述、統計、甚至被模仿,不夠有是因為他們都還是落在「好聽的鋼琴曲」的範圍。
如果說「平凡無奇的大眾口味」是常態分佈的正中央,那大師們的「個人色彩」會不會只是位在「正中央稍微偏離一點點」的地方而已呢?因為如果太有個人色彩、偏離太多,就不會被大眾認為是「好聽」了呀2!既然大師們也只是在「好聽」的邊界上遊走,那這些相對微小的偏移量,遲早也會變成 AI 模型裡一個可以隨意調整的旋鈕,對吧?
我願意吃 AI 做的哪些東西?
讓我們來做一個跨媒介的思想實驗。想像所有東西都有 AI「私廚」,那你要吃嗎?
- 📝 文字:想讀一個日常部落格,叫大型語言模型寫「專屬給我看的部落格」給我?好像不成立,看部落格是想要關心另一個人類的生活,誰在乎 ChatGPT 今天的心情如何?
- 🎬 影片:想看什麼影片,就叫 AI 生給我?好像也不成立。影片的價值很大一部份來自「真的有這個人」、「真的有這個地方」、「這件事真的發生了」,AI 影片做得再美也是假的。
- 🎙️ 談話:想聽什麼 Podcast,就叫 AI 生給我?也許成立,要看主題。知識型的 Podcast 好像真的可以喔(NotebookLM 生成的對話節目其實滿好聽的)!但閒聊、陪伴、幹話型的可能就不行,我還是需要知道另一端是真正的人類。
- 🍜 食物:我想吃一碗拉麵,AI 做給我?完全可以!我才不 care 拉麵是誰做的。好吃就好!再來一碗!
- ❄️ 空調:AI 幫我自動溫控?當然好啊!誰在乎這冷氣是哪位工程師設計的,或者日本製的壓縮機到底稀不稀少,只要它可以噴出冷風我就開心了。
發現這個光譜了嗎?一端是「你在意這是誰做的」(日常部落格、紀實影片、閒聊型 Podcast),另一端是「你只在意結果的」(拉麵、冷氣)。
把音樂擺回這個光譜上看看。是不是有點驚訝,它的位置,比你想像中還要更靠近拉麵和冷氣那頭?3
輸出端 vs. 輸入端
我覺得可以這樣理解:音樂的價值大部分在「輸出端」──也就是你耳朵聽到的聲波本身。而文字和影片的價值有更大一部份在「輸入端」──這是誰寫的、這在哪裡、事情是不是真的發生了。
大部分人可以開心地聽一首不知道是誰做的 lo-fi beats to study to;但你很難想像有人會願意看 AI 虛擬人物的「今天早上我吃了蛋餅」日記。
這不是在貶低音樂,正好相反。音樂厲害到它不需要依賴真實人物和事件就能感動你,但這種「純粹」也是最大的弱點,反而讓音樂成為最容易被 AI 取代的藝術形式。
雖然不想承認,但我自己的身體早已給出了答案:我對於每天在這個 blog 上寫生活廢文的熱情,遠遠高過打開編曲軟體做音樂。看來我的潛意識早就搞懂哪一種創作比較不可被取代了(先不考慮賺不賺錢的問題)。
其實這不是新聞
這甚至不是 AI 時代的新發現:現場演唱會的票價越來越貴4,但串流分潤卻越來越低5。市場早就在跟我們說「錄好的音樂」沒有價值了,「演出」和「互動」才有。
音樂還是可以很有「個人色彩」的,但那要靠表演者的演出、人與人的互動來達成。光靠作曲、編曲和混音恐怕是撐不住了。
所以這篇的結論是什麼?那就是身為音樂人,未來的出路很明顯了。我們要走回「實體」、「體驗」和「陪伴」的路線。教鋼琴、現場演出、領導活動,這些連結到真實人物和事件的事情,才是價值的所在。
以後想要真正「享受音樂」,大概得自己動手去演奏它吧,所以還是去練琴比較實在。至於那些完美的數位聲音檔案?叫你的私廚做給你就好啦!
(如果你讀完這篇突然有點開始想練鋼琴,歡迎來參加好和弦的《鋼琴技巧急診室》!)