跳至主要内容

AI 問題挑戰

· 閱讀時間約 11 分鐘

相信大家一定都對 AI 有一套自己的看法──有人深度依賴、有人嗤之以鼻、有人用完還要假裝自己沒用。所以讓我們一起來玩這個「AI 問題挑戰」,把這些思考更具體化、順便讓大家也知道你是怎麼想的吧!歡迎複製以下的問題,在自己的部落格上回答!

挑戰問題源自 Rishabh P. Sharma 的部落格,原文在此

以下中文版問題是我的翻譯:

  1. 你第一次體驗 AI 模型的感受如何?
  2. 你自己會用 AI 嗎,還是完全反對它?
  3. 你會比較偏好哪一種模型嗎(例如 Claude 和 ChatGPT 之間)?如果有,你是怎麼選擇的?
  4. AI 有哪些地方是你喜歡的?哪些是不喜歡的?
  5. 你對 AI 生成圖片的感覺如何?如果有人在部落格文章裡放 AI 圖,你會覺得很煩嗎?
  6. 現在網路上到處都是 AI 垃圾內容(slop),充滿了生成的文字、圖片、聲音和影片。你怎麼把這些東西跟真正的人類創作區分開來?你有什麼過濾策略嗎?
  7. 你對 AI 帶來的未來感到樂觀,還是認為會走向反烏托邦?
英文原文(點這裡展開)
  1. How was your first experience with AI models?
  2. Do you use AI or are you completely against using it?
  3. Do you have any preference among different models, for example Claude vs ChatGPT? If yes, how do you choose?
  4. What aspect of AI models do you like and what do you not like?
  5. How do you feel about AI generated images? Does it annoy you if someone use them in a blog post?
  6. Internet is flooded with AI slop now, full of generated text, images, audio and videos. How do you filter it from authentic human creation? Do you have a strategy?
  7. Are you hopeful for a better future with A.I. or a dystopian one?

1. 你第一次體驗 AI 模型的感受如何?

ChatGPT 出現後沒幾天我就去試用了。

原本以為那會是一個超沒用的科技噱頭,結果發現完全不是──它真的會考慮到你輸入的每個字、計算它們之間的關係,然後輸出一個還算合理的結果。

比起以前傳統的拼字檢查、文法工具或 Google 翻譯,大型語言模型更人性化,輸出更不像是「寫死的」(hard-coded),很好玩!

我也去研究了一些技術文件和影片,大致了解它背後的運作原理,所以我知道它的強項在哪裡(了解文字之間的關係),也知道它的侷限在哪裡(沒有真實生活經驗)。我認為自己會比一般(不懂電腦的)人更知道如何使用它,所以我還滿擁抱這個技術的。

不過我也很快產生了警覺:雖然它很好用,但如果只有雲端版的話,我其實還不太願意讓它深入我的工作流程,因為這樣就產生了不好的依賴。於是,我也開始研究離線 AI 的解決方案。

2. 你自己會用 AI 嗎,還是完全反對它?

當然會用,而且用爆!

現在大家口中的「AI」,大多指的是 ChatGPT、Claude 之類的大型語言模型(LLM,Large Language Model)。但在那之前,我早就在使用各種「AI」工具啦!例如:

  • 可以辨識語音,自動上字幕的 Whisper1
  • 可以拆分音樂,變成多個分軌的 demucs2
  • 可以自動母帶後製的 iZotope Ozone3

至於現在的 LLM,我最常用的方式,是叫它把 YouTube 影片或冗長的外文文章,重寫成中文文章讓我閱讀。

說到這裡,我一定要強烈推薦 cpdown 這個瀏覽器外掛,這太方便了!到 YouTube 任何一個影片按下它,它就能將字幕檔轉成 Markdown 並複製到剪貼簿,然後你就可以丟給語言模型,叫它寫成漂亮的文章。不必再忍受 YouTuber 那些煩人的剪輯、音效、字卡、廢話,連業配都自動跳過了,只留下真正的重點。我現在「看」YouTube 的量可能只有以前的 10% 不到,心理健康程度大大改善,我強烈建議大家試試看。

另外,我每天寫這個部落格時,也會使用 LLM。我曾經提過,我的寫作流程是先把想法「從頭腦中倒出來」,然後丟給 LLM 整理,最後在參考它的輸出自己編輯一次。但我沒有實際示範過那看起來像是怎樣,所以這邊給一個實例。

以下是〈為什麼古典音樂人要看譜?〉草稿的其中一段為例,這是「從我的頭腦倒出來」的樣子,我個人的習慣是一句話寫一行,並且用縮排表示層次:

  • 最根本的原因是,古典音樂是一個「不即興」的音樂類型。
  • 作曲家在音樂裡的每一個音,都做了非常精細的設計,資訊量非常高。
  • 事實上,在十九世紀李斯特發明了「現代鋼琴獨奏會」的表演形式之前,背譜演奏並不是常態
    • 上台時「不看譜演奏」反而會被認為是對作曲家的冒犯!
    • 邏輯是:不看譜,很容易讓觀眾覺得你在即興創作,這不是把作曲家的心血佔為己有嗎?

我會把以上的東西丟給 AI,參考 AI 的版本尋找我可以替換的用詞,以及修順句子。以下是最後的版本,全部都還是我自己親手打字,只是加入了一些從 AI 潤稿版看到的寫法:

最根本的原因是,古典音樂基本上是一個「不即興」的音樂類型。作曲家在樂譜上的每一個音,都做了非常精細的設計,資訊量非常高,而演奏者想要確定把它彈對。

事實上,在十九世紀的鋼琴家們(最常被提到的是李斯特)發明了「現代鋼琴獨奏會」的表演形式之前,背譜演奏根本不是常態。反而,上台時「不看譜演奏」會被認為是對作曲家的冒犯!當時的邏輯是:如果上台不看譜,觀眾很可能會以為你是在即興,這不就是在把作曲家的心血佔為己有嗎?

其實 90% 以上仍然是我的原文,只是變得更漂亮、更好閱讀了。而且在重新打字的過程中,我可能會學到一些更精準的用詞或更簡潔的句法,我覺得滿好的,會讓我自己的寫作更進步。

我是覺得這樣使用 AI 滿健康的呀!它只是幫我做文字苦工,讓我的頭腦空出來思考更重要的事情。

3. 你會比較偏好哪一種模型嗎(例如 Claude 和 ChatGPT 之間)?如果有,你是怎麼選擇的?

用在腦力激盪的話,絕對是 Claude。例如在寫作時,我想講某個觀念,想到了 A 和 B 例子,這時候如果我叫 Claude 幫我延伸,它通常都找得到我不會想到的 C、D、E 例子。

用在修順文章的話,我現在最喜歡離線的 Gemma 4 31B。經過我特製的 System Prompt 調教之後,Gemma 4 的語感超級符合我的口味!

Gemini 3.5 Flash 我覺得還行,偶爾當我需要一點不同視角的聯想時,我會使用一下作為「第二意見」。

以寫作來說,我最不喜歡的是 ChatGPT,我覺得 ChatGPT 的寫作風格油到不行,AI 味超重的!不過 ChatGPT 寫程式似乎還是滿強的。

目前我只有訂閱 Claude 的月費方案,而其他線上模型我都是透過儲值型的 OpenRouter 使用。離線模型我則是使用 Ollama + OpenWebUI 跑在自己的電腦上。

4. AI 有哪些地方是你喜歡的?哪些是不喜歡的?

其實對我來說,AI 沒有什麼好「不喜歡」的,它們就只是工具而已。

我不喜歡的,是那些既不了解工具原理,品味又很差,然後產生一大堆垃圾內容丟到網路上、只想要「套利」的人類。

而我「更」受不了的,是那些每天吃著上述垃圾,然後還覺得很好吃、想吃更多的人類。喔我的天啊!

5. 你對 AI 生成圖片的感覺如何?如果有人在部落格文章裡放 AI 圖,你會覺得很煩嗎?

我不討厭 AI 生成圖片本身,我覺得它就像是一個更方便、更自動化的 GIMP/Krita/Photoshop。以前要花超多時間在影像處理軟體做的去背、合成等等事情,現在 AI 全部可以瞬間完成,我覺得超棒的呀!

例如,只贏來我們家玩的時候,送了我們飛天小女警的公仔。我們一起把它們組起來,放在椅子上拍了張照。

(原始照片)

然後我想,如果可以把背景修掉,把它們放在舞台上,該有多好呀!以前要做這件事,可能要用電腦弄好幾小時,而且還不會很好看。但現在用離線的 Flux.2 Klein 9B4 模型,只要 30 秒就好了,它還幫你重新打光!

(換成舞台背景 + 打光!)

至於在部落格裡放 AI 圖,我覺得還是要看情況和品味。如果只是跟文章無關的封面圖,我是覺得大可不必;但如果是真的有幫助到文章內容的,我是覺得沒什麼不好。

最討厭的是「跟風型」的和「功利型」的 AI 圖片:

  • 跟風型的代表大概就是「吉卜力風格自拍」吧。那個看到就覺得煩躁、想馬上逃走。
  • 功利型的則是那些自以為有深度、有內容的「社群媒體資訊圖卡」。我會覺得丟出這種圖片的人是在想:「我不想付出努力,我只想用一張廉價的 AI 圖片來獲取流量。」感覺很差,我會直接對這個人大扣分

(這就是我最討厭的那種「AI 資訊圖卡」。)

6. 現在網路上到處都是 AI 垃圾內容(slop),充滿了生成的文字、圖片、聲音和影片。你怎麼把這些東西跟真正的人類創作區分開來?你有什麼過濾策略嗎?

這個簡單,只要三個字母就可以解決── 🆁🆂🆂!

用 RSS 訂閱你信任的高品質來源,就可以確保看到的都是優質內容啦!如果某個來源開始受到 AI 垃圾的污染,就取消訂閱就好了。

只要遠離大平台的演算法,基本上就不會太有遭到垃圾內容轟炸的問題。想在這個時代保持清醒和品味,RSS 是必備的生存技能。你各位快點開始用 RSS 啦

7. 你對 AI 帶來的未來感到樂觀,還是認為會走向反烏托邦?

我覺得所有事物都一定會走向反烏托邦,這是無法避免的。

大部分人都只想要方便、快速、即時滿足,這點永遠都不可能改變;因此「沒良心但不用動腦的科技」永遠會成為主流,這就是 Windows、iOS、Instagram 等產品成功的原因。以前一直都是這樣,AI 工具也不會是例外。

但也不是完全悲觀,一定會有一些清醒奇怪的人,能夠看穿這些「主流」都只是為了自己的利益在操控無知的大眾,於是尋求迴避、甚至反抗的手段(例如寫部落格、用 RSS、用自由軟體和 Linux)。

我的預測是:不久的將來,有 95% 的人會被「主流 AI」控制,他們的行為、思想甚至購物習慣都將變成大科技公司塑造的樣子──而且他們不會察覺,反而會深信都一切都是自己的自由意志。至於剩下 5% 的清醒者(就是你),就是我想藉由寫部落格找到的同類,我們必須集結起來,一起防止世界「完全」毀滅(頂多只能讓它毀滅 95%),責任就在我們身上了!


以上就是我的「AI 問題挑戰」。我也想很看大家對於 AI 的想法,歡迎在自己的部落格上也寫一篇唷!

Footnotes

  1. https://github.com/openai/whisper

  2. https://github.com/facebookresearch/demucs

  3. https://www.izotope.com/products/ozone-advanced

  4. https://bfl.ai/models/flux-2-klein