กูเกิลอัพเดตโมเดล Gemini 2.5 Pro เป็นเวอร์ชั่น 05-06 (6 พฤษภาคม) โดยชูประเด็นสำคัญคือมันทำคะแนนทดสอบด้านการเขียนเว็บ หรือ WebDev Arena เอาชนะ Claude 3.7 ได้เป็นตัวแรก นับแต่แยกหมวดหมู่มา แถมยังชนะค่อนข้างขาดด้วยคะแนน ELO 1420
ทางกูเกิลระบุว่าตั้งใจจะเปิดตัวโมเดลเวอร์ชั่นนี้ในงาน Google I/O ที่กำลังจะจัดปลายเดือนนี้ แต่เปลี่ยนใจปล่อยออกมาทันทีเลยให้ใช้กันก่อนงาน
WebDev Arena เป็นบริการทดสอบปัญญาประดิษฐ์แบบเทียบกันตัวต่อตัว โดยผู้ใช้สามารถสั่งทำเว็บแบบต่างๆ ใน sandbox ได้ค่อนข้างอิสระ บริการนี้เปิดตัวมาตั้งแต่ปลายปี 2024 และ Claude ก็นำมาโดยตลอด ตั้งแต่ช่วงแรกที่นำโดย Claude 3.5 และภายหลังก็นำโดย Claude 3.7
กลุ่มผู้ใช้งานหลักของ LLM มักเป็นโปรแกรมเมอร์ที่ใช้งานอย่างหนัก ดังนั้นการที่ Gemini ทำคะแนนด้านการเขียนโปรแกรมได้ดีขึ้นก็น่าจะช่วยให้ได้รับความนิยมมากขึ้น
ตอนนี้ Gemini 2.5 Pro ยังอยู่ในสถานะพรีวิว กูเกิลตัดสินใจอัพเดตเวอร์ชั่นให้ผู้ใช้เดิมที่ใช้เวอร์ชั่น 03-25 อัตโนมัติ ผู้ที่เรียกเวอร์ชั่นเดิมก็จะได้โมเดลเวอร์ชั่นใหม่ไปเอง สามารถใช้งานได้ทั้ง Google AI Studio และ Vertex AI
ที่มา - Google Blog, @OfficialLoganK, @lmarena_ai

on
จริงๆกะเปิดตัวงาน I/O แหละ
zyzzyva Wed, 07/05/2025 - 00:24
จริงๆกะเปิดตัวงาน I/O แหละ แต่ปีที่แล้วโดน OpenAI ปาดหน้าเค้ก ปีนี้เลยปล่อยออกมาก่อน แล้วกว่าจะถึงวันงานอีกตั้ง 2 สัปดาห์ เผลอๆอาจทำรุ่นที่ดีกว่าเสร็จทันเปิดตัววันงานแบบทอดร้อนๆกันเลยทีเดียว
ลองแล้ว โหดจริง
Fzo Wed, 07/05/2025 - 01:20
ลองแล้ว โหดอยู่
ถ้า deepseek ที่เป็น opensrc
tontpong Wed, 07/05/2025 - 03:30
ถ้า deepseek ที่เป็น opensrc ทั้ง stack ออกมาแล้ว , หลังจากนั้นซักพัก จะดันวงการไปขนาดไหนนะ .. ปล. ยังไม่โดน รบ.จีน lock ไว้ใช่มั้ย 🥹
deepseek ไม่เคย open source
lew Wed, 07/05/2025 - 10:57
In reply to ถ้า deepseek ที่เป็น opensrc by tontpong
deepseek ไม่เคย open source "ทั้ง stack" นะครับ เปิดมาเยอะ แต่ก็เป็นชิ้นๆ
หมายถึงเชิง interoperability
tontpong Wed, 07/05/2025 - 22:34
In reply to deepseek ไม่เคย open source by lew
ไม่ได้หมายถึง "ถ้า deepseek ปล่อย opensrc ทั้ง stack ออกมา" , แต่หมายถึงเชิง interoperability กับ opensrc environment น่ะครับ .. จากข่าวนี้ น่าจะหมายถึงแบบนั้นรึป่าว , https://www.blognone.com/node/145855
เข้าใจว่าการต่อยอด deepseek พักเบรกกันไปเยอะ , เพราะไม่คุ้มกับส่วนที่ต้องยอม trade off หรือพลังที่ต้องใช้ .. ecosystem เลยยังไม่โตมาก , การพัฒนาก็เลยยังช้ากว่าศักยภาพที่อาจจะเป็นไปได้
ถ้าคนอื่นเอาไปใช้แล้ว , เทียบได้ใกล้เคียงกับที่ host โดย deepseek เอง .. การ adopt น่าจะไต่ขึ้นไปสูงกว่านี้ได้อีกพอควร
ว่าแล้วก็ , รอๆ ดูอยู่ .. ว่า llama ที่ host โดย meta เอง , จะมี advantage อะไรบ้าง ( https://www.blognone.com/node/146151 )
พึ่งเห็น .. ว่าจากที่
tontpong Thu, 08/05/2025 - 05:41
In reply to หมายถึงเชิง interoperability by tontpong
พึ่งเห็น .. ว่าจากที่ deepseek เคย hint , เอาไป implement ต่อกันจนได้ใกล้เคียงกับ deepseek เองละ
https://x.com/lmsysorg/status/1919465296966123721