AI 人工智慧產品技術

AI 寫故事的破綻：93% 準確率可辨識、Claude 偏平、GPT 愛夢境

Elponcrab

2026/5/28

華頓商學院教授 Ethan Mollick（@emollick）5 月 28 日轉貼一篇剛上 arXiv 的研究，發現 AI 寫小說的破綻不只在 em-dash、引號這類「風格表面標記」，而是反映在敘事結構本身。根據論文「StoryScope」，研究者只用敘事特徵（不看用字風格）就能以 93.2% 準確率分辨 AI 與人類所寫的故事，而要求 AI「換個風格寫」對破綻幫助有限。

Table of Contents

StoryScope 研究：只用敘事結構就能 93% 準確率辨識 AI

論文題目為「StoryScope: Investigating idiosyncrasies in AI fiction」，作者包含 Jenna Russell、Rishanth Rajendhran、Chau Minh Pham、Mohit Iyyer 與 John Wieting。

研究團隊把過去常用的「em-dash 多寡」「特定字彙」「平均句長」等表面風格特徵全部移除，只用情節結構、角色動機、時間軸鋪陳等「敘事面」特徵做分類，結果仍能達到 93.2% 準確率，約為包含風格特徵的完整模型 97% 以上的表現。換句話說，AI 故事的破綻主要不在「怎麼寫」、而是在「故事怎麼長出來」。

廣告 - 內文未完請往下捲動

AI 故事的共通破綻：說教式主題、單線情節、缺道德模糊性

論文整理出 AI 寫小說最常見的三大「敘事 tell」：

過度說教主題：AI 故事傾向把「這個故事的主題是什麼」明白寫出來，而不是讓讀者自行解讀
偏好「乾淨單線」情節：避免分支、回憶或多伏筆，主角從 A 到 B 一條路走到底
缺少道德模糊性：主角的選擇容易黑白分明，不會出現「我也不知道對不對」的灰色決定

研究同時指出，AI 故事在時間結構上也較單一，較少使用倒敘、跳接或多時間線手法。

模型各有獨家「指紋」：Claude 平鋪、GPT 愛夢境、Gemini 重外型

除了 AI 整體的共通破綻外，論文也找出各模型獨有的傾向：

Claude：事件強度的階梯較平、戲劇張力起伏小（flat event escalation）
GPT：頻繁使用「夢境序列」推進劇情（over-indexes on dream sequences）
Gemini：預設用外貌描寫介紹角色，而不是透過行為或對話（defaults to external character description）

研究者結論認為，AI 生成的小說「聚集在敘事空間的某個小區塊」，而人類作者的故事在結構上分散得多。AI 寫作的破綻不只是字面風格，而是故事被「組構」的方式從根本上趨同。

風險提示

加密貨幣投資具有高度風險，其價格可能波動劇烈，您可能損失全部本金。請謹慎評估風險。

AI 寫作 Claude Ethan Mollick GPT StoryScope

鏈新聞

衍伸閱讀