Tags:
Node Thumbnail

กูเกิลเพิ่งเปิดตัว Gemini Ultra ไปหมาดๆ วันนี้ปล่อยของต่อเนื่องด้วยโมเดลเวอร์ชันอัพเดต Gemini 1.5 Pro ซึ่งเป็นการอัพเกรดโมเดลระดับกลาง (Pro) ที่มีความสามารถระดับเดียวกับ Gemini 1.0 Ultra แต่ใช้พลังประมวลผลน้อยกว่า

ฟีเจอร์เด่นของ Gemini 1.5 Pro ที่น่าสนใจคือการรองรับอินพุตขนาดใหญ่ถึง 1 ล้านโทเคน ซึ่งถือว่ามากที่สุดในบรรดาโมเดลภาษาขนาดใหญ่ทุกวันนี้ (Anthropic Claude 2.1 รองรับ 2 แสนโทเคน) เปิดโอกาสให้ใช้งานโมเดล LLM กับงานที่หลากหลายขึ้นอีกมาก กูเกิลเทียบให้เห็นภาพว่าเท่ากับคลิปเสียงยาว 11 ชั่วโมง, วิดีโอ 1 ชั่วโมง, เอกสาร 700,000 คำ, โค้ด 30,000 บรรทัด

No Description

No Description

เบื้องหลังของ Gemini 1.5 เป็นสถาปัตยกรรมใหม่ที่เรียกว่า Mixture-of-Experts (MoE) ซึ่งอิงจากงานวิจัยของกูเกิลในปี 2017 แนวคิดของมันคือการสร้างเครือข่าย neural network ขนาดเล็กที่เชี่ยวชาญเฉพาะเรื่องมาต่อกัน แทนการสร้างเครือข่าย neural network ใหญ่อันเดียว แบบที่ใช้ในโมเดลรุ่นก่อน พอถึงเวลาใช้งาน ก็จะหยิบเฉพาะเครือข่ายที่เกี่ยวข้องมาทำงาน ช่วยให้ประสิทธิภาพของการรันโมเดลดีขึ้นกว่าเดิมมาก

กูเกิลโชว์การรัน Gemini 1.5 โดยให้อ่านบันทึกการสนทนาทั้งหมดของนักบินอวกาศในภารกิจ Apollo 11 ไปดวงจันทร์ ที่ถอดเป็นเอกสารยาว 402 หน้า ผลคือ Gemini สามารถเข้าใจรายละเอียดต่างๆ ของภารกิจได้เป็นอย่างดี

อีกตัวอย่างคือการเอาหนังเงียบเรื่อง Sherlock Jr. (1924) ความยาว 44 นาทียัดเข้าไปใน Gemini ให้ดูหนัง (ที่ไม่มีเสียงพูด) แล้ววิเคราะห์เหตุการณ์ต่างๆ ในเรื่องได้เช่นกัน

ตอนนี้ Gemini 1.5 ยังเปิดทดสอบแบบ early testing โดยยังเปิดให้ใช้งานแบบ 128,000 โทเคนเป็นมาตรฐาน แต่นักพัฒนาและลูกค้าองค์กรบางรายจะได้ทดสอบเวอร์ชัน 1 ล้านโทเคนก่อนใคร

ที่มา - Google

Get latest news from Blognone

Comments

By: shub on 16 February 2024 - 08:50 #1305908

ไม่รู้ว่าเริ่มใช้รึยังแต่เห็นgeminiตอนนี้ที่ใช้อยู่เวลาจะให้แปลอะไรบางทีก็โดนสลับไปใช้โมเดลแปลภาษาที่แปลได้อย่างเดียวเรียบเรียงแก้ไขอะไรไม่ได้แล้วแอบรู้สึกว่ามันไม่ได้คำตอบที่เราต้องการถ้าจะแปลอย่างเดียวก็เข้าทรานสเลดแล้วมั้ยจะมาใช้เอไอทำไม -

By: au8ust
AndroidSymbianWindows
on 16 February 2024 - 09:08 #1305912 Reply to:1305908

มันเอ๋อแบบนั้นมาตั้งแต่ตอนเป็น Bard จนตอนนี้ใน Gemini ก็ยังเป็น ใน Gemini Advanced ดีกว่านิดนึง แต่บางครั้งก็ยังกลับไปปฏิเสธหัวแข็งเหมือนเดิม คิดว่าน่าจะอยู่ในระดับแกนเลยหรือเปล่านะ

By: VirtualPrivateUser on 16 February 2024 - 19:29 #1305955 Reply to:1305908

อันนี้ทีแรกผมก็เจอ น่าจะเกิดจาก instructed prompt ลองเปลี่ยนไปใช้ที่อยู่ใน Vertex AI แทนแล้วไม่เป็นแหะ ลองดูครับ