ChatGPT
ทีมนักวิจัยจากเยอรมนี Sophie Jentzsch และ Kristian Kersting ทดลองให้ ChatGPT 3.5 เล่ามุกตลกจำนวน 1,008 ครั้ง พบว่า 90% ของคำตอบเป็นมุกซ้ำเดิม 25 มุก
ทีมวิจัยประเมินว่าเหตุผลที่ ChatGPT ยิงมุกซ้ำๆ มาจากข้อมูลการเทรนโมเดลครั้งแรกสุด และมุกที่ไม่ค่อยตลกนักเป็นเพราะวิธีการเทรนแบบ reinforcement learning through human feedback (RLHF) ที่ให้มนุษย์ให้คะแนนคำตอบว่าดีแค่ไหน ซึ่งมนุษย์ที่ให้คะแนนตอนเทรน มักอิงกับแนวทางคำตอบตามคู่มือที่ได้รับมากกว่าเน้นความสร้างสรรค์
ทีมวิจัยยังบอกว่าจะทดลองแบบเดิมกับ GPT-4 ในอนาคตด้วย