ผลการศึกษาโดย Giskard บริษัททดสอบ AI ในปารีส พบว่าเมื่อสั่งให้แชทบอท AI ตอบคำถามแบบกระชับ มันอาจสร้างข้อมูลผิด ๆ มากขึ้น เพราะไม่เปิดโอกาสให้ AI ได้แก้ไขข้อผิดพลาด หรืออธิบายหัวข้อที่ซับซ้อน ทำให้บางครั้ง แชทบอทเลือกความรวดเร็วแทนความถูกต้อง
จากการทดสอบ โมเดลที่พบอาการหลอน (hallucination) มีทั้ง GPT-4o และ mini, Mistral Small และ Large, DeepSeek v3, รวมทั้ง Grok 2 ซึ่งมีอาการหลอนมากที่สุดเมื่อต้องตอบสั้น ๆ