NVIDIA เปิดตัวโมเดล Nemotron-4 340B เป็นโมเดลสำหรับสร้างข้อมูลสังเคราะห์ (synthetic data) เพื่อใช้เทรนโมเดลภาษาขนาดใหญ่ LLM อีกทีหนึ่ง
จุดเด่นของ Nemotron-4 340B คือการสร้างข้อมูลคุณภาพสูงในราคาถูก ตัวสัญญาอนุญาตเป็น NVIDIA Open Model ใช้งานในเชิงพาณิชย์ได้ฟรี นำโมเดลไปดัดแปลงต่อได้
Nemotron-4 ประกอบด้วยโมเดล 3 ตัวทำงานร่วมกันคือ base, instruct, reward ปรับแต่งให้ทำงานกับเฟรมเวิร์ค NVIDIA NeMo และจะออกแพ็กเกจสำหรับ NVIDIA NIM ให้นำไปดีพลอยบนเครื่องต่างๆ ได้สะดวก โมเดลสามารถดาวน์โหลดได้แล้วจาก Hugging Face

ที่มา - NVIDIA
on
เอิ่ม ไม่ใช่ Inbreeding
big50000 Mon, 17/06/2024 - 13:30
เอิ่ม ไม่ใช่ Inbreeding หรอกใช่ไหม
จริงๆ กระบวนการ RHLF
lew Mon, 17/06/2024 - 16:12
In reply to เอิ่ม ไม่ใช่ Inbreeding by big50000
จริงๆ กระบวนการ RHLF ที่กำเนิด GPT3.5 นี่ก็ค่อนข้าง inbreed นะครับ มีคนแตะนิดเดียวคือให้เลือก output ที่ชอบจาก 4 output ที่ gen มา