牙膏品牌高露潔用 AI 模擬消費者做市調,預測「你會不會買」準確度達 9 成
當品牌推出一款新牙膏、洗髮精或沐浴乳時,第一件事通常不是上市,而是先花大錢做市場調查。找數百位消費者填問卷、評估「你會不會買」。如今,這件事可能正被 AI 改寫。
高露潔母公司 Colgate-Palmolive 與 AI 研究團隊 PyMC Labs 最新發布論文指出,大型語言模型(LLM)已能扮演「虛擬消費者(synthetic consumers)」進行商品測試,甚至重現接近真人的購買意願(purchase intent)分布與產品偏好排序。研究團隊直言,企業未來可能不用每次都先花大錢做真人市調,而是先用 AI 模擬市場反應。
這篇題為《LLMs Reproduce Human Purchase Intent via Semantic Similarity Elicitation of Likert Ratings》的研究,使用高露潔旗下 57 項個人護理產品概念測試、共 9,300 名真實美國消費者資料作為驗證基準,涵蓋牙膏、口腔與個人護理產品等類型。
不再問 AI「你會買嗎?」而是讓它「變成消費者」
研究最大突破,在於它發現:AI 不適合被直接問「你會買嗎?」
過去研究常直接要求 ChatGPT、Gemini 等模型回答 1 到 5 分的購買意願(Likert Scale),但結果常出現「過度保守」或「集中在中間值」問題,像真人會打 4、5 分的產品,AI 卻常回答「3 分」,失去真實市場訊號。
因此,高露潔研究團隊換了一種方式。
他們先讓 AI 扮演特定背景的消費者,例如不同年齡、收入、地區、族群的人,再讓 AI 看產品圖片與文案,最後不直接評分,而是像真人一樣先說感想:「如果效果真的不錯,而且價格合理,我可能會試試看。」
接著,研究團隊再利用語意分析(Semantic Similarity Rating,SSR),把這段自然語言與不同購買意願的標準句進行向量比對,換算成 1 到 5 分的購買機率。
AI 模擬消費者,與真人吻合度達 90%
結果讓研究團隊意外。論文指出,當 AI 被賦予消費者人格與人口特徵後,其模擬結果對產品吸引力排序的吻合度,最高可達真人測試重現率(test-retest reliability)的 90%,同時生成的評分分布也與真人相近。
換句話說,如果真人認為 A 產品比 B 產品更值得買,AI 大致也能得出相同結論。更重要的是,AI 還能給出「理由」。真人問卷常只有數字評分,但虛擬消費者會補充像是:「價格有點高」、「方便攜帶」、「香味吸引人,但不確定效果」等評論。
研究認為,這種質化回饋可能比傳統市調更有價值,因為品牌不只知道產品賣不賣,還知道「為什麼有人不買」。
收入低的人更不想買?AI 甚至模擬出消費階級差異
研究還發現,AI 不只是亂猜。當系統被設定成不同收入層消費者時,低收入族群對產品購買意願明顯下降,而中高收入者較願意嘗試新品,這與真人數據趨勢高度一致。年齡層差異也被部分成功重現:中年族群購買意願較高,年輕與高齡族群相對保守。
但若拿掉人格設定,只讓 AI「自由發揮」,結果就失真。研究發現,此時 AI 幾乎會對所有產品都偏樂觀,導致產品排序能力大幅下降。這意味著,AI 想模擬人,前提是先有「人設」。
研究團隊認為,這類「AI 虛擬消費者」短期內不會完全取代真人市調,但可能成為前置工具。未來品牌推出新產品時,或許先由 AI 跑數千次模擬,快速淘汰吸引力低的概念,只留下最有潛力的產品,再投入昂貴的人類測試。對大企業來說,這代表更低成本、更快迭代;對小品牌而言,則可能首次擁有過去只有大公司負擔得起的消費者洞察能力。
風險提示
加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。



