DeepSeek อาจใช้ข้อมูลจาก Google Gemini ในการเทรนโมเดล R1-0528

By Fzo

on 6 June 2025 - 09:54 Tag: DeepSeek, LLM, Gemini, Artificial Intelligence, China

DeepSeek

DeepSeek ผู้พัฒนา AI จากจีน ที่เพิ่งอัปเดตโมเดล R1-0528 ซึ่งเน้นความสามารถด้านการให้เหตุผล (reasoning) ถูกตั้งข้อสังเกตว่า อาจได้ใช้ข้อมูลที่มาจากผลลัพธ์ของโมเดล Google Gemini มาใช้ในการเทรนโมเดลดังกล่าว

นักพัฒนาอย่าง Sam Paeach วิเคราะห์พบว่า โมเดล R1-0528 ของ DeepSeek แสดงรูปแบบการใช้คำศัพท์และสำนวนที่ใกล้เคียงกับ Google Gemini อย่างชัดเจน เช่นคำว่า “context window,” “foundation model,” หรือ “function calling” ซึ่งเป็นคำเฉพาะที่พบได้บ่อยในเอกสารและผลลัพธ์ของ Gemini

การใช้ข้อมูลจากโมเดล AI อื่นมาสร้างหรือเทรนโมเดลของตัวเอง เรียกว่า “distillation” หรือ “prompt chaining” ซึ่งหมายถึงการเก็บเอาลักษณะภาษาหรือวิธีการตอบของโมเดลหนึ่งมาเป็นข้อมูลฝึกสำหรับโมเดลใหม่ นี่จึงเป็นความเป็นไปได้อย่างมากที่ DeepSeek อาจนำผลลัพธ์จาก Gemini มาใช้ในกระบวนการพัฒนา R1-0528

ก่อนหน้านี้ DeepSeek เคยถูกจับสังเกตว่าโมเดล V3 ของพวกเขามักตอบว่าเป็น ChatGPT ซึ่งทำให้มีข้อสงสัยว่าอาจใช้ข้อมูลจาก OpenAI มาเทรนเช่นกัน ขณะที่ OpenAI เองก็เคยออกมาเปิดเผยว่าพบหลักฐานว่า DeepSeek ใช้วิธีการ distillation เพื่อสร้างโมเดลของตัวเอง

จนถึงตอนนี้ DeepSeek ยังไม่ได้ออกมาตอบหรือปฏิเสธข้อกล่าวหาอย่างเป็นทางการ แต่กระแสข่าวนี้ก็สร้างความตื่นตัวในวงการ AI ว่าการนำข้อมูลจากโมเดลคู่แข่งมาใช้เทรนโมเดลของตัวเอง อาจทำให้เกิดข้อถกเถียงเรื่องสิทธิ์และความโปร่งใสในการพัฒนาเทคโนโลยี AI

If you're wondering why new deepseek r1 sounds a bit different, I think they probably switched from training on synthetic openai to synthetic gemini outputs. pic.twitter.com/Oex9roapNv

— Sam Paech (@sam_paech) May 29, 2025