เอกสารกำกับโมเดลปัญญาประดิษฐ์ หรือ model card ของ Gemini 3 Pro โมเดลรุ่นต่อไปของกูเกิลที่ยังไม่เปิดตัวหลุดออกมาในเว็บ Pixeldrain แสดงให้เห็นว่าโมเดลรุ่นนี้เอาชนะได้ทั้ง Claude Sonnet 4.5 และ GPT-5.1 และหลายชุดทดสอบชนะขาดยกเว้นเพียง SWE-Bench Verified ที่แพ้ Sonnet 4.5 ไปเล็กน้อย
เอกสารระบุว่า Gemini 3 Pro รองรับอินพุต 1 ล้านโทเค็น และเอาต์พุต 64,000 โทเค็น เป็นโมเดลที่สร้างขึ้นมาใหม่ ไม่ได้ fine-tune จากโมเดลเดิม ตัวโมเดลเป็นแบบ sparse mixture-of-experts ที่โมเดลจะทำงานเพียงบางส่วนตามอินพุตที่ใช้งานอยู่
ตัวโมเดลฝึกข้อมูลถึงเดือนมกราคม 2025
การทดสอบความปลอดภัยพบว่า Gemini 3 Pro มีระดับความปลอดภัยดีกว่า Gemini 2.5 Pro ชัดเจน โดยการวิเคราะห์ความปลอดภัยด้วยตัวเองดีขึ้น 10.4% แต่มีระดับการปฏิเสธคำสั่งอย่างผิดพลาดเพิ่มขึ้นเล็กน้อย 3.7%
ที่มา - Hacker News, Pixeldrain
on
พอถึงวันปล่อยของ Cloudflare…
zyzzyva Tue, 18/11/2025 - 21:19
พอถึงวันปล่อยของ Cloudflare ดันล่ม เลยต้องเลื่อนไปพรุ่งนี้ 555
ไม่รู้ว่าคิดไปเองมั้ย ,…
tontpong Tue, 18/11/2025 - 22:03
ไม่รู้ว่าคิดไปเองมั้ย , คนอื่นคิดไงบ้าง .. พวก close model นี่ , ของที่ได้ใช้จิง รุ้สึกว่า drop จาก benchmark ไปมาก ( claude นี่รุ้สึกว่าใกล้สุด ซึ่งก็ยังห่างจนรุ้สึกได้ )
บางที , หลังปล่อยจริงช่วงแรกๆ ก็ยังดูดี .. ผ่านไปซักพัก หลักสัปดาห์บ้าง หลักเดือนบ้าง , เรื่ม drop จากที่ช่วงแรกทำได้แบบนึง ซักพักเริ่มทำไม่ได้ละ
benchmark…
lew Wed, 19/11/2025 - 21:13
In reply to ไม่รู้ว่าคิดไปเองมั้ย ,… by tontpong
benchmark มันสะท้อนได้จำกัดครับ หลายคนวิจารณ์ เช่น SWE Bench มีชุดทดสอบ Python + Django เยอะ
ส่วนตัวแนะนำให้ทุกคนทำ benchmark ของตัวเอง ไม่ต้องยากมาก ไม่กี่ข้อก็ได้แต่สะท้อนการใช้งานของตัวเอง ex: ลองสั่งทำเว็บ app สักแบบ งานคล้ายๆ ที่เราใช้จริงหรือ stack ที่ตรงกับที่เราทำจริงๆ พอเจอตัวใหม่ก็ลองสักที
นึกถึง tag นี้เลย 😅 ,…
tontpong Thu, 20/11/2025 - 01:52
In reply to benchmark… by lew
นึกถึง tag นี้เลย 😅 , pelican-riding-a-bicycle
https://simonwillison.net/tags/pelican-riding-a-bicycle/
anyway , อาการ gemini ที่เจอ .. คือใช้แทน assistance ( เพราะอากู๋เค้าบังคับ ) , โมเดลใหม่มาก็จะรวนพักนึงแล้วก็นิ่ง ผ่านไปซักเดือนเริ่มรวนอีกละ ( คำสั่ง/คำถาม ก็เดิมๆ เหมือนตั้งแต่สมัย assistant เลย )
พลอยนึกถึง horizon alpha …
tontpong Wed, 19/11/2025 - 19:58
พลอยนึกถึง horizon alpha .. ตกลง เบื้องหลัง เป็นใคร ?
https://www.blognone.com/node/147614
Horizon Alpha…
zyzzyva Wed, 19/11/2025 - 20:31
In reply to พลอยนึกถึง horizon alpha … by tontpong
Horizon Alpha พอเริ่มดังเลยถูกทดสอบเยอะขึ้น (รวมถึง Horizon Beta ด้วย) แต่พอถูกทดสอบเยอะมันไม่ได้ดีเหมือนที่คิด คนเลยเลิกสนใจที่จะหาว่าใครสร้าง
สรุปว่า model ใดๆ ,…
tontpong Thu, 20/11/2025 - 01:42
In reply to Horizon Alpha… by zyzzyva
สรุปว่า model ใดๆ , ต้องรอซักพักใหญ่ๆ แล้วค่อยลองส่องรีวิวจากผู้ใช้จริง 😥 .. ว่าแต่ ปกติมีแหล่งส่องมั้ยครับ ( reddit ? )