By arjin Writer on Tag: Qwen, Alibaba Cloud, Alibaba, LLM, Artificial Intelligence
Qwen

Alibaba เปิดตัวโมเดลปัญญาประดิษฐ์รุ่นล่าสุด Qwen3 โดยบอกว่ามีผลการทดสอบในบางหัวข้อดีกว่า DeepSeek-R1, o1, o3-mini, Grok-3 และ Gemini-2.5-Pro

Qwen3 ออกโมเดลสองรุ่นย่อยคือ Qwen3-235B-A22B ขนาดพารามิเตอร์รวม 235B และพารามิเตอร์ที่ทำงาน 22B และโมเดลรุ่นเล็ก Qwen3-30B-A3B ขนาดพารามิเตอร์รวม 30B และพารามิเตอร์ที่ทำงาน 3B และมีโมเดลแบบ open-weighted อีก 6 ขนาดตั้งแต่ 0.6B ถึง 32B

By lew Founder on Tag: Alibaba Cloud, LLM, Qwen
Alibaba Cloud

ทีม Qwen ของ Alibaba Cloud เปิดตัวโมเดลปัญญาประดิษฐ์เพิ่มสองรุ่น คือ Qwen2.5 Omni โมเดลแบบ multimodal อ่านภาพ, ฟังเสียง, และดูวิดีโอได้ พร้อมกับสามารถตอบเป็นเสียงหรือข้อความได้ อีกโมเดลคือ QVQ-Max โมเดลคิดก่อนตอบแบบอ่านภาพได้ ทำให้สามารถอ่านเอกสารซับซ้อนสูงได้

Qwen2.5 Omni เป็นโมเดล multimodal ที่รับได้ทั้งข้อความ, เสียง, และภาพ โดยภายในมันสามารถดูภาพตามเวลา (time aligned multimodal) ทำให้เข้าใจวิดีโอได้ด้วย ขณะที่ฝั่งเอาท์พุตนั้นสามารถสร้างเสียงตอบกลับได้ ตัวสถาปัตยกรรมรองรับการ "ฟังไป ตอบไป" โดยสามารถรับอินพุตยังไม่จบแต่ตอบไปก่อนได้

By arjin Writer on Tag: Alibaba Cloud, LLM, Qwen
Alibaba Cloud

Alibaba Cloud ออกโมเดลปัญญาประดิษฐ์ใหม่ Qwen2.5-VL-32B ซึ่งเป็นโมเดลขนาดใหญ่ 32B แบบโอเพนซอร์สภายใต้สัญญาอนุญาต Apache 2.0 สามารถดาวน์โหลดได้ที่ Hugging Face และ GitHub

By lew Founder on Tag: Qwen, Alibaba Cloud, LLM
Qwen

Alibaba Cloud เปิดตัวโมเดลปัญญาประดิษฐ์ LLM ในชื่อ QwQ-32B (อ่านว่า ควิว) โมเดลคิดก่อนตอบ ที่เคยเปิดรุ่นพรีวิวไปก่อนหน้านี้เมื่อปลายปี 2024 แต่ตอนนี้ออกเป็นตัวจริง โดยผลที่ได้มีคะแนนทดสอบหลายชุดดีขึ้นอย่างชัดเจน จนขึ้นมาใกล้เคียงกับ DeepSeek-R1 ที่มีขนาดใหญ่กว่า 20 เท่า

By lew Founder on Tag: LLM, Artificial Intelligence, Qwen, OCR
LLM

Ai2 สถาบันวิจัยที่ก่อตั้งโดย Paul Allen ผู้ร่วมก่อตั้งไมโครซอฟท์ เปิดตัวโมเดลปัญญาประดิษฐ์ olmOCR โมเดลแปลงภาพเป็นข้อความคุณภาพสูง ทดสอบแบบใช้มนุษย์ตัดสินแล้วดีกว่าโมเดลปัญญาประดิษฐ์ในกลุ่มเดียวกันมาก

olmOCR สร้างจาก Qwen2-VL-7B-Instruct โมเดลขนาดเล็กของ Alibaba Cloud แต่ปรับแต่งโมเดลเพิ่มเติมด้วยการฝึกแปลงภาพเป็นข้อความจากเอกสาร 250,000 ฉบับ

By arjin Writer on Tag: Alibaba Cloud, Artificial Intelligence, LLM, Qwen
Alibaba Cloud

Alibaba เผยแพร่โมเดลปัญญาประดิษฐ์ Qwen2.5-Max ซึ่งเป็นโมเดลภาษาขนาดใหญ่แบบ MoE (Mixture-of-Expert) เหมือนกับ DeepSeek V3 ถูก Pre-train มากกว่า 20 ล้านล้านโทเค็น และทำ Post-Train ด้วยวิธี SFT (Supervised Fine-Tuning) และ RLHF (Reinforcement Learning from Human Feedback)

ผลทดสอบความสามารถของ Qwen2.5-Max ได้คะแนนเหนือกว่า DeepSeek-V3, GPT-4o และ Claude-3.5-Sonnet ในหัวข้อเช่น Arena-Hard, LiveBench ส่วนหัวข้ออย่าง MMLU-Pro กับ LiveCodeBench คะแนนสูงกว่า DeepSeek-V3 แต่น้อยกว่า Claude-3.5-Sonnet

By arjin Writer on Tag: Alibaba Cloud, LLM, Qwen
Alibaba Cloud

Alibaba เปิดตัวโมเดลปัญญาประดิษฐ์ใหม่ในตระกูล Qwen2.5 ชื่อว่า Qwen2.5-VL โดย VL ย่อมาจาก Vision Language เป็นรุ่นถัดจาก Qwen2-VL มีความสามารถเข้าใจวิดีโอ รูปภาพ ข้อความ และเป็น Agentic ที่ทำงานแทนได้ด้วย

By lew Founder on Tag: Alibaba Cloud, LLM, Qwen, Chat Bot
Alibaba Cloud

Alibaba Cloud เปิดบริการ Qwen Chat แบบเดียวกับ ChatGPT ให้ลูกค้าบุคคลทั่วไปใช้งาน จากเดิม Qwen เปิดให้บริการ API บน Alibaba Cloud สำหรับลูกค้าองค์กรเป็นหลัก

Qwen Chat ให้บริการทั้งโมเดล Qwen เวอร์ชั่นโอเพนซอร์สและเวอร์ชั่นปิดที่เคยต้องเรียกผ่าน API เท่านั้น รวมถึงโมเดลแบบคิดก่อนตอบอย่าง QwQ และ QVQ ด้วย

หน้าจอใช้ OpenWebUI แบบเดียวกับที่จุฬาลงกรณ์มหาวิทยาลัยใช้งาน ทำให้มีฟีเจอร์ตามมาหลายตัว เช่น การเปรียบเทียบโมเดลรุ่นต่างๆ ตอนนี้ยังไม่มีเงื่อนไขค่าบริการแต่อย่างใด

By arjin Writer on Tag: Alibaba Cloud, LLM, Qwen
Alibaba Cloud

Alibaba Cloud ประกาศลดราคาค่าใช้งานโมเดลปัญญาประดิษฐ์ที่รับอินพุทเป็นรูปภาพและวิดีโอ Qwen-vl-max ลง 85% โดยราคาอยู่ที่ 0.003 หยวนต่อ 1,000 อินพุทโทเค็น

การลดราคานี้เพื่อให้โมเดลทำความเข้าใจรูปภาพของ Alibaba Cloud สามารถแข่งขันด้านราคากับโมเดลประเภทเดียวกันของ ByteDance ได้ ซึ่งคิดราคาที่ 0.003 หยวน เท่ากัน

By lew Founder on Tag: Alibaba Cloud, LLM, Qwen
Alibaba Cloud

ทีม Qwen ของ Alibaba Cloud เปิดโมเดล QvQ-72B-Preview ที่พัฒนาต่อจาก Qwen-VL-72B แต่ฝึกให้คิดเป็นขั้นเป็นตอนเพื่อเพิ่มความแม่นยำมากขึ้น

ผลทดสอบที่ทีม Qwen ใช้ทดสอบมี 4 ชุด ได้แก่ MMMU, MathVista, MathVision, และ OlympiadBench คะแนนที่ได้ขึ้นไปถึงระดับ Claude 3.5 Sonnet เข้าใกล้ OpenAI o1 มากขึ้น โดยพฤติกรรมของโมเดลจะคิดไปเรื่อยๆ และตอบคำถามสุดท้าย

โมเดลเปิดให้ทดสอบผ่าน HuggingFace ไฟล์โมเดลเปิดให้ดาวน์โหลดในไลเซนส์แบบ Qwen License โดยตอนนี้ยังส่งคำสั่งได้รอบเดียว ไม่สามารถคุยต่อเนื่องได้

By lew Founder on Tag: Alibaba Cloud, LLM, Qwen
Alibaba Cloud

ทีม Qwen ของ Alibaba Cloud เปิดโตัวโมเดลปัญญาประดิษฐ์ QwQ (อ่านว่า ควิว/quil) เป็นโมเดลเพื่อการทดลองที่จะไม่มุ่งตอบคำถามทันที แต่พยายามคิดทบทวนก่อน ทำให้คำตอบที่ได้แม่นยำขึ้น

ความโดดเด่นของ QwQ-32B คือคะแนนทดสอบหลายชุดทดสอบ เช่น GPQA, AIME, MATH-500, หรือ LiveCodeBench นั้นสูงขึ้นมาก เทียบชั้นกับ OpenAI o1-preview เลยทีเดียว อย่างไรก็ดีทีมงานพบปัญหาการคิดของโมเดลมักสลับภาษาไปมา (ผมทดลองถามภาษาไทยก็คิดเป็นภาษาจีน) บางครั้งคิดวนไปวนมาไม่ได้คำตอบ นอกจากนี้ยังต้องเพิ่มความระมัดระวังความปลอดภัยในการใช้งาน และคะแนนทดสอบก็อาจจะมีข้อจำกัดไม่สามารถทดสอบความสามารถบางด้าน

By lew Founder on Tag: Alibaba Cloud, LLM, Qwen
Alibaba Cloud

Alibaba เปิดโมเดล Qwen2.5-Turbo โมเดลปัญญาประดิษฐ์ที่ปรับปรุงขึ้นจากรุ่นโอเพนซอร์ส เน้นขนาดข้อมูลที่รองรับได้ จากเดิม 128,000 โทเค็นเป็น 1 ล้านโทเค็น ทำให้รองรับข้อมูลระดับหนังสือทั้งเล่มได้ คิดเป็นขนาดข้อมูลประมาณ 1 ล้านคำหรืออักษรจีน 1.5 ล้านตัวอักษร

ผลทดสอบของ Qwen2.5-Turbo ค่อนข้างดีมากการถามตอบจากข้อมูลขนาดใหญ่ Passkey Retrieval ได้เต็ม 100 คะแนน ขณะที่ชุดทดสอบ RULER ก็ได้คะแนนสูงกว่า GPT-4 เมื่อใส่ข้อมูลเต็ม 1 ล้านโทเค็นจะเริ่มตอบใน 68 วินาที ราคาต่อ 1 ล้านโทเค็นอยู่ที่ 0.3 หยวน ถูกกว่า GPT-4o-mini อยู่ 4.6 เท่าตัว

By lew Founder on Tag: Alibaba Cloud, LLM, Qwen, Programming
Alibaba Cloud

ทีมวิจัย Qwen ของ Aliababa เปิดตัวโมเดล Qwen2.5-Coder โมเดล LLM ช่วยเขียนโค้ดที่ปรับปรุงกระบวนการฝึกจนได้ประสิทธิภาพสูงสุดในหมู่โมเดลโอเพนซอร์ส คะแนนทดสอบรวมพอๆ กับ GPT-4o ในการทดสอบหลายตัว

กระบวนการฝึก Qwen2.5-Coder นั้นอาศัยการฝึกเป็นขั้น เริ่มตั้งแต่การฝึกโค้ดแบบไฟล์เดี่ยว (file-level pretrain) แล้วขยับมาเป็นการฝึกแบบหลายไฟล์ (repo-level pretrain) สุดท้ายจึงฝึกการเขียนโค้ดตามคำสั่ง โดยอาศัยชุดข้อมูลโค้ดที่พบในอินเทอร์เน็ต นำมาสร้างคำสั่งเพื่อให้ได้โค้ดนั้น แล้วจึงนำชุดข้อมูลไปฝึก

By lew Founder on Tag: Alibaba Cloud, LLM, Qwen
Alibaba Cloud

Alibaba Cloud เปิดบริการ LLM ของตัวเองในตระกูล Qwen แต่เป็นเวอร์ชั่นไม่เปิดให้ดาวน์โหลดโมเดล ได้แก่ Qwen-Max, Qwen-Plus, และ Qwen-Turbo โดยชูความสามารถของ Qwen-Max ว่าใกล้เคียง Llama3.1-405B และ GPT-4o แล้ว โดยเอาชนะได้บางขุดทดสอบ เช่น MATH หรือ LiveCodeBenach

ราคาค่าใช้งาน Qwen-Max อยู่ที่ 10 ดอลลาร์ต่อล้านโทเค็นสำหรับอินพุต และ 30 ดอลลาร์ต่อล้านโทเค็นสำหรับเอาท์พุต แพงกว่า GPT-4o ประมาณเท่าตัว

By lew Founder on Tag: Alibaba Cloud, LLM, Qwen
Alibaba Cloud

Alibaba Cloud เปิดตัวโมเดลปัญญาประดิษฐ์ Qwen เวอร์ชั่น 2.5 จุดเด่นของโมเดลเวอร์ชั่นนี้คือฝึกด้วยข้อมูลขนาดถึง 18 ล้านล้านโทเค็น รองรับ 29 ภาษารวมภาษาไทย โดยเปิดให้ใช้งานได้อิสระแทบทุกรุ่น

ตัวโมเดลรองรับอินพุต 128K token และตอบข้อมูลได้ 8K token ยกเว้นรุ่น 3B ลงไปจะรองรับอินพุต 32K token เท่านั้น

รุ่นใหญ่สุด Qwen2.5-72B ได้ผลทดสอบชนะ Llama3.1-70B แทบทุกการทดสอบขึ้นไปใกล้เคียง Llama3.1-405B แต่เวอร์ชั่น 72B แจกแบบ Qwen License ซึ่งจำกัดการใช้งานกับบริการที่ผู้ใช้เกิน 100 ล้านคนต่อเดือน

By arjin Writer on Tag: Alibaba Cloud, LLM, Qwen
Alibaba Cloud

Alibaba Cloud ปล่อยโมเดล LLM ตระกูล Qwen 2 รุ่นล่าสุด Qwen2-VL โดย VL ย่อมาจาก Vision Language ที่พัฒนาบนพื้นฐานของ Qwen2

Qwen2-VL มีจุดเด่นคือความสามารถในการทำความเข้าใจรูปภาพ ที่มีความละเอียดและอัตราส่วนภาพหลากหลาย ผลการทดสอบทำงานได้ดีกว่าโมเดลประเภทเดียวกัน ซึ่งสามารถนำไปประยุกต์ใช้ได้กับอุปกรณ์ที่ต้องใช้การทำความเข้าใจภาพที่เห็น เช่น สมาร์ทโฟน, หุุ่นยนต์ หรือระบบอัตโนมัติอื่นที่ต้องอาศัยภาพในการตัดสินใจ

By lew Founder on Tag: Alibaba Cloud, LLM, Qwen
Alibaba Cloud

Alibaba Cloud ปล่อยโมเดล LLM แบบโอเพนซอร์สตระกูล Qwen 2 เพิ่มอีกสองรุ่น ได้แก่ Qwen2-Math และ Qwen2-Audio

Qwen2-Math เป็นโมเดลที่ฝึกต่อจก Qwen2 โดยสร้างชุดข้อมูลคุณภาพสูงด้านคณิตศาสตร์เฉพาะ ทั้งหนังสือ, โค้ดต่างๆ, ชุดข้อสอบต่างๆ, จนถึงข้อมูลที่สังเคราะห์ออกมาจาก Qwen2 เอง จุดเด่นของโมเดลนี้คือทำคะแนนทดสอบด้านคณิตศาสตร์ เช่น GSM8K, MATH หรือ MMLU-STEM ได้สูงกว่าโมเดลปิดอย่าง GPT-4o หรือ Gemini เสียอีก

Qwen2-Math ยังใช้งานได้เฉพาะภาษาอังกฤษเท่านั้น และมี 3 ขนาด คือ 1.5B, 7B, 72B เปิดให้ใช้งานแบบสัญญาอนุญาต Apache 2.0 ทีมงานระบุว่าจะเปิดเวอร์ชั่นภาษาจีนเร็วๆ นี้

By lew Founder on Tag: Alibaba Cloud, LLM, Open Source, Qwen
Alibaba Cloud

ทีมวิจัย Qwen ของ Alibaba Cloud เปิดตัวโมเดล LLM ในชื่อ Qwen2 มี 5 ขนาดให้เลือกตั้งแต่ 0.5B, 1.5B, 7B, 14B, และ 72B โดยชูจุดเด่นรองรับภาษาอื่นๆ นอกจากภาษาอังกฤษ เช่นแถบเอเชียตะวันออกเฉียงใต้นั้นรองรับทั้ง ไทย, เวียดนาม, อินโดนีเซีย, เมียนมาร์, ลาว, กัมพูชา และยังรองรับ context window ถึง 128K

ผลทดสอบยอดนิยมเช่น MMLU หรือ HumanEval นั้น Qwen2-72B ทำได้เหนือกว่า Llama3-70B ไปเล็กน้อย ขณะที่ Qwen2-7B ก็เอาชนะ Llama3-7B ได้หลายชุดทดสอบโดยเฉพาะชุดทดสอบ HumanEval ที่คะแนนนำค่อนข้างมาก

Subscribe to Qwen
Apple
public://topics-images/apple_webp.png
SCB10X
public://topics-images/347823389_774095087711602_515970870797767330_n_webp.png
Windows 11
public://topics-images/hero-bloom-logo.jpg
Huawei
public://topics-images/huawei_standard_logo.svg_.png
Google Keep
public://topics-images/google_keep_2020_logo.svg_.png
Instagram
public://topics-images/instagram_logo_2022.svg_.png
SCB
public://topics-images/9crhwyxv_400x400.jpg
Microsoft
public://topics-images/microsoft_logo.svg_.png
Basecamp
public://topics-images/bwpepdi0_400x400.jpg
Tinder
public://topics-images/hwizi8ny_400x400.jpg
FTC
public://topics-images/seal_of_the_united_states_federal_trade_commission.svg_.png
Pinterest
public://topics-images/pinterest.png
Palantir
public://topics-images/-nzsuc6w_400x400.png
AIS Business
public://topics-images/logo-business-2021-1.png
PostgreSQL
public://topics-images/images.png
JetBrains
public://topics-images/icx8y2ta_400x400.png
Krungthai
public://topics-images/aam1jxs6_400x400.jpg
Palworld
public://topics-images/mccyhcqf_400x400.jpg
Bill Gates
public://topics-images/bill_gates-september_2024.jpg
VMware
public://topics-images/1nj4i1gp_400x400.jpg
Take-Two Interactive
public://topics-images/0khle7nh_400x400.jpg
OpenAI
public://topics-images/ztsar0jw_400x400.jpg
Thailand
public://topics-images/flag_of_thailand.svg_.png
NVIDIA
public://topics-images/srvczsfq_400x400.jpg
ServiceNow
public://topics-images/ytnrfphe_400x400.png
Klarna
public://topics-images/urcllpjp_400x400.png
Google Play
public://topics-images/play.png
Drupal
public://topics-images/drupal.png
Virtua Fighter
public://topics-images/virtua_figther_2024_logo.png
Paradox Interactive
public://topics-images/paradox_interactive_logo.svg_.png
Europa Universalis
public://topics-images/europa-icon.png
Nintendo Switch 2
public://topics-images/mainvisual.png
Cloudflare
public://topics-images/cloudflare_logo.svg_.png
Samsung
public://topics-images/samsung.png
Google
public://topics-images/google_2015_logo.svg_.png
Uber
public://topics-images/uber.png
Microsoft 365
public://topics-images/m365.png
USA
public://topics-images/flag_of_the_united_states.svg_.png
GM
public://topics-images/0pe0po-z_400x400.jpg
Perplexity
public://topics-images/perplex.jpg
Xperia
public://topics-images/xperia.png
iOS 18
public://topics-images/ios-18-num-96x96_2x.png
True
public://topics-images/true_logo.png
SoftBank
public://topics-images/softbank.jpg
Pac-Man
public://topics-images/pacman.png
Harry Potter
public://topics-images/harry.png
Marvel
public://topics-images/marvel.png
Skydance
public://topics-images/skydance.png
SEA
public://topics-images/sealogo.png
Find My Device
public://topics-images/find.png
Gemini
public://topics-images/google_gemini_logo.svg__1.png
Accessibility
public://topics-images/accessibility-128x128_2x.png
Material Design
public://topics-images/m3-favicon-apple-touch.png
Android 16
public://topics-images/android16.png
Android
public://topics-images/android_0.png
Firefox
public://topics-images/firefox_logo-2019.svg_.png
Google Messages
public://topics-images/messages.png
Notepad
public://topics-images/notepad.png
Singapore
public://topics-images/flag_of_singapore.svg_.png
Airbnb
public://topics-images/airbnb.png
PS5
public://topics-images/ps5.png
Krafton
public://topics-images/krafton.png
Doom
public://topics-images/doom-game-s_logo.svg_.png
AMD
public://topics-images/amd_logo.svg_.png
GTA
public://topics-images/gta_0.png
DoorDash
public://topics-images/doordash.png
YouTube
public://topics-images/yt.png
YouTube Music
public://topics-images/yt-music.png
Facebook
public://topics-images/fb.png
iQiyi
public://topics-images/iqiyi_0.png
Viu
public://topics-images/viu.png
Amazon Prime Video
public://topics-images/prime-vid.png
Spotify
public://topics-images/spotify.jpg
Apple TV
public://topics-images/apple-tv.png
HBO Max
public://topics-images/max.png
Threads
public://topics-images/threads.png
Alexa
public://topics-images/alexa.png
Kindle App
public://topics-images/kindle.png
Shopee
public://topics-images/shopee.png
Waze
public://topics-images/waze.png
Bilibili
public://topics-images/bili.png
Google Maps
public://topics-images/maps.png
Apple Music
public://topics-images/apple-music.png
Claude
public://topics-images/claude.png
TikTok
public://topics-images/tiktok.png
Xbox
public://topics-images/xbox.png
Tesla
public://topics-images/tesla.png
Chrome
public://topics-images/chrome.png
Google Calendar
public://topics-images/gcal.png
Google Home
public://topics-images/ghome.png
Google Meet
public://topics-images/meet.png
NotebookLM
public://topics-images/notebooklm.png
Reddit
public://topics-images/reddit.png
Assassin’s Creed
public://topics-images/ac.png
Mark Zuckerberg
public://topics-images/zuck.jpg
Meta
public://topics-images/meta.png
Meta AI
public://topics-images/meta-ai.png
Epic Games
public://topics-images/epic_games_logo.svg_.png
Unreal
public://topics-images/unreal_engine_logo-new_typeface-svg.png
Fortnite
public://topics-images/fortnite.png