DeepSeek ผู้พัฒนา AI จากจีน ที่เพิ่งอัปเดตโมเดล R1-0528 ซึ่งเน้นความสามารถด้านการให้เหตุผล (reasoning) ถูกตั้งข้อสังเกตว่า อาจได้ใช้ข้อมูลที่มาจากผลลัพธ์ของโมเดล Google Gemini มาใช้ในการเทรนโมเดลดังกล่าว
นักพัฒนาอย่าง Sam Paeach วิเคราะห์พบว่า โมเดล R1-0528 ของ DeepSeek แสดงรูปแบบการใช้คำศัพท์และสำนวนที่ใกล้เคียงกับ Google Gemini อย่างชัดเจน เช่นคำว่า “context window,” “foundation model,” หรือ “function calling” ซึ่งเป็นคำเฉพาะที่พบได้บ่อยในเอกสารและผลลัพธ์ของ Gemini
การใช้ข้อมูลจากโมเดล AI อื่นมาสร้างหรือเทรนโมเดลของตัวเอง เรียกว่า “distillation” หรือ “prompt chaining” ซึ่งหมายถึงการเก็บเอาลักษณะภาษาหรือวิธีการตอบของโมเดลหนึ่งมาเป็นข้อมูลฝึกสำหรับโมเดลใหม่ นี่จึงเป็นความเป็นไปได้อย่างมากที่ DeepSeek อาจนำผลลัพธ์จาก Gemini มาใช้ในกระบวนการพัฒนา R1-0528
ก่อนหน้านี้ DeepSeek เคยถูกจับสังเกตว่าโมเดล V3 ของพวกเขามักตอบว่าเป็น ChatGPT ซึ่งทำให้มีข้อสงสัยว่าอาจใช้ข้อมูลจาก OpenAI มาเทรนเช่นกัน ขณะที่ OpenAI เองก็เคยออกมาเปิดเผยว่าพบหลักฐานว่า DeepSeek ใช้วิธีการ distillation เพื่อสร้างโมเดลของตัวเอง
จนถึงตอนนี้ DeepSeek ยังไม่ได้ออกมาตอบหรือปฏิเสธข้อกล่าวหาอย่างเป็นทางการ แต่กระแสข่าวนี้ก็สร้างความตื่นตัวในวงการ AI ว่าการนำข้อมูลจากโมเดลคู่แข่งมาใช้เทรนโมเดลของตัวเอง อาจทำให้เกิดข้อถกเถียงเรื่องสิทธิ์และความโปร่งใสในการพัฒนาเทคโนโลยี AI
If you're wondering why new deepseek r1 sounds a bit different, I think they probably switched from training on synthetic openai to synthetic gemini outputs. pic.twitter.com/Oex9roapNv
— Sam Paech (@sam_paech) May 29, 2025
ที่มา :
TechCrunch: DeepSeek may have used Google’s Gemini to train its latest model
on
จีนก็คือจีน copy & develop
pie001 Fri, 06/06/2025 - 11:46
จีนก็คือจีน copy & develop
เป็นปัญหาเดียวกับ Bard…
lew Fri, 06/06/2025 - 12:06
เป็นปัญหาเดียวกับ Bard ของกูเกิลด้วยเช่นกัน โลกทุกวันนี้มีข้อมูลจาก model คู่แข่งแน่ๆ แต่ระดับความตั้งใจคงต่างกันไป
แล้วเราก็ใช้ตัว Distill เป็น…
mr_tawan Fri, 06/06/2025 - 15:00
แล้วเราก็ใช้ตัว Distill เป็น gemma หรือ llama อีกที เป็น distill-ception
"อาจทำให้เกิดข้อถกเถียงเรื่อ…
langisser Fri, 06/06/2025 - 16:29
"อาจทำให้เกิดข้อถกเถียงเรื่องสิทธิ์และความโปร่งใสในการพัฒนาเทคโนโลยี AI"
ส่วนนึงผมก็คิดว่าก็ดีนะครับ หลังจากที่โลก AI ไปมีประเด็นแบบนี้กับวงการอื่นๆ มาแล้วและมันก็ทำได้ด้วย คราวนี้โดนเองจะว่ายังไงนะ