AI 寫故事的破綻:93% 準確率可辨識、Claude 偏平、GPT 愛夢境

Elponcrab
分享
AI 寫故事的破綻:93% 準確率可辨識、Claude 偏平、GPT 愛夢境

華頓商學院教授 Ethan Mollick(@emollick)5 月 28 日轉貼一篇剛上 arXiv 的研究,發現 AI 寫小說的破綻不只在 em-dash、引號這類「風格表面標記」,而是反映在敘事結構本身。根據論文「StoryScope」,研究者只用敘事特徵(不看用字風格)就能以 93.2% 準確率分辨 AI 與人類所寫的故事,而要求 AI「換個風格寫」對破綻幫助有限。

StoryScope 研究:只用敘事結構就能 93% 準確率辨識 AI

論文題目為「StoryScope: Investigating idiosyncrasies in AI fiction」,作者包含 Jenna Russell、Rishanth Rajendhran、Chau Minh Pham、Mohit Iyyer 與 John Wieting。

研究團隊把過去常用的「em-dash 多寡」「特定字彙」「平均句長」等表面風格特徵全部移除,只用情節結構、角色動機、時間軸鋪陳等「敘事面」特徵做分類,結果仍能達到 93.2% 準確率,約為包含風格特徵的完整模型 97% 以上的表現。換句話說,AI 故事的破綻主要不在「怎麼寫」、而是在「故事怎麼長出來」。

廣告 - 內文未完請往下捲動

AI 故事的共通破綻:說教式主題、單線情節、缺道德模糊性

論文整理出 AI 寫小說最常見的三大「敘事 tell」:

  • 過度說教主題:AI 故事傾向把「這個故事的主題是什麼」明白寫出來,而不是讓讀者自行解讀
  • 偏好「乾淨單線」情節:避免分支、回憶或多伏筆,主角從 A 到 B 一條路走到底
  • 缺少道德模糊性:主角的選擇容易黑白分明,不會出現「我也不知道對不對」的灰色決定

研究同時指出,AI 故事在時間結構上也較單一,較少使用倒敘、跳接或多時間線手法。

模型各有獨家「指紋」:Claude 平鋪、GPT 愛夢境、Gemini 重外型

除了 AI 整體的共通破綻外,論文也找出各模型獨有的傾向:

  • Claude:事件強度的階梯較平、戲劇張力起伏小(flat event escalation)
  • GPT:頻繁使用「夢境序列」推進劇情(over-indexes on dream sequences)
  • Gemini:預設用外貌描寫介紹角色,而不是透過行為或對話(defaults to external character description)

研究者結論認為,AI 生成的小說「聚集在敘事空間的某個小區塊」,而人類作者的故事在結構上分散得多。AI 寫作的破綻不只是字面風格,而是故事被「組構」的方式從根本上趨同。

風險提示

加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。