牙膏品牌高露潔用 AI 模擬消費者做市調，預測「你會不會買」準確度達 9 成

Neo

2026/6/14

當品牌推出一款新牙膏、洗髮精或沐浴乳時，第一件事通常不是上市，而是先花大錢做市場調查。找數百位消費者填問卷、評估「你會不會買」。如今，這件事可能正被 AI 改寫。

高露潔母公司 Colgate-Palmolive 與 AI 研究團隊 PyMC Labs 最新發布論文指出，大型語言模型（LLM）已能扮演「虛擬消費者（synthetic consumers）」進行商品測試，甚至重現接近真人的購買意願（purchase intent）分布與產品偏好排序。研究團隊直言，企業未來可能不用每次都先花大錢做真人市調，而是先用 AI 模擬市場反應。

這篇題為《LLMs Reproduce Human Purchase Intent via Semantic Similarity Elicitation of Likert Ratings》的研究，使用高露潔旗下 57 項個人護理產品概念測試、共 9,300 名真實美國消費者資料作為驗證基準，涵蓋牙膏、口腔與個人護理產品等類型。

廣告 - 內文未完請往下捲動

Table of Contents

不再問 AI「你會買嗎？」而是讓它「變成消費者」

研究最大突破，在於它發現：AI 不適合被直接問「你會買嗎？」

過去研究常直接要求 ChatGPT、Gemini 等模型回答 1 到 5 分的購買意願（Likert Scale），但結果常出現「過度保守」或「集中在中間值」問題，像真人會打 4、5 分的產品，AI 卻常回答「3 分」，失去真實市場訊號。

因此，高露潔研究團隊換了一種方式。

他們先讓 AI 扮演特定背景的消費者，例如不同年齡、收入、地區、族群的人，再讓 AI 看產品圖片與文案，最後不直接評分，而是像真人一樣先說感想：「如果效果真的不錯，而且價格合理，我可能會試試看。」

接著，研究團隊再利用語意分析（Semantic Similarity Rating，SSR），把這段自然語言與不同購買意願的標準句進行向量比對，換算成 1 到 5 分的購買機率。

AI 模擬消費者，與真人吻合度達 90%

結果讓研究團隊意外。論文指出，當 AI 被賦予消費者人格與人口特徵後，其模擬結果對產品吸引力排序的吻合度，最高可達真人測試重現率（test-retest reliability）的 90%，同時生成的評分分布也與真人相近。

換句話說，如果真人認為 A 產品比 B 產品更值得買，AI 大致也能得出相同結論。更重要的是，AI 還能給出「理由」。真人問卷常只有數字評分，但虛擬消費者會補充像是：「價格有點高」、「方便攜帶」、「香味吸引人，但不確定效果」等評論。

研究認為，這種質化回饋可能比傳統市調更有價值，因為品牌不只知道產品賣不賣，還知道「為什麼有人不買」。

收入低的人更不想買？AI 甚至模擬出消費階級差異

研究還發現，AI 不只是亂猜。當系統被設定成不同收入層消費者時，低收入族群對產品購買意願明顯下降，而中高收入者較願意嘗試新品，這與真人數據趨勢高度一致。年齡層差異也被部分成功重現：中年族群購買意願較高，年輕與高齡族群相對保守。

但若拿掉人格設定，只讓 AI「自由發揮」，結果就失真。研究發現，此時 AI 幾乎會對所有產品都偏樂觀，導致產品排序能力大幅下降。這意味著，AI 想模擬人，前提是先有「人設」。

研究團隊認為，這類「AI 虛擬消費者」短期內不會完全取代真人市調，但可能成為前置工具。未來品牌推出新產品時，或許先由 AI 跑數千次模擬，快速淘汰吸引力低的概念，只留下最有潛力的產品，再投入昂貴的人類測試。對大企業來說，這代表更低成本、更快迭代；對小品牌而言，則可能首次擁有過去只有大公司負擔得起的消費者洞察能力。

風險提示

加密貨幣投資具有高度風險，其價格可能波動劇烈，您可能損失全部本金。請謹慎評估風險。