ไมโครซอฟท์ประกาศฟีเจอร์ใหม่ของ Windows โดยเน้นฟีเจอร์ด้านปัญญาประดิษฐ์อย่างหนัก เปลี่ยนชื่อไลบรารีจากเดิม Windows Copilot Runtime เป็น Windows AI Foundry มีฟีเจอร์เพิ่มเติม ได้แก่
- เรียกใช้โมเดลจาก Foundry Local, Ollama, และ NVIDIA NIM ได้โดยตรง หากโมเดลที่เลือก ทำงานร่วมกับส่วนเร่งความเร็วเช่น NPU หรือ GPU ได้ก็จะเลือกใช้ส่วนเร่งความเร็วไปด้วย โดยโมเดลเหล่านี้จะรันผ่าน Windows ML ที่รองรับชิป AMD, Intel, NVIDIA, และ Qualcomm
- API ด้าน AI เข้าสู่สถานะเสถียร เช่น API สรุปข่อความ, แปลงภาพเป็นข้อความ, อ่านข้อความในภาพ, เพิ่มความละเอียดภาพ, หรือการแบ่งส่วนภาพ โมเดลทั้งหมดรันบนเครื่องโดยตรง
- รองรับ LoRA เมื่อรันโมเดล Phi Silica ในวินโดวส์ สามารถไปฝึกโมเดลเพิ่มเติมแล้วดาวน์โหลดมาเฉพาะ LoRA adapter เพื่อใช้งาน
- Semantic Search API: API ชุดใหม่ทำให้วินโดวส์รองรับการทำ RAG (Retrieval-Augmented-Generation) ได้ในตัว
- MCP: เพิ่มฟีเจอร์ให้แอปพลิเคชั่นบนวินโดวส์ให้เปิดเป็น MCP server ได้โดยตรง เปิดใทางให้ AI เข้ามาสั่งการข้อมูลในเครื่อง
ฟีเจอร์ต่างๆ เน้นการพัฒนาแอปพลิเคชั่น AI ในตัว แต่แต่ละฟีเจอร์นั้นจะมีรอบปล่อยไม่ตรงกัน เช่น ฟีเจอร์ OCR, สรุปข้อความนั้น จะมาพร้อมกับ Windows App SDK 1.7.2 ที่ติดตั้งได้ทันที แต่ฟีเจอร์ fine-tune Phi แบบ LoRA จะมาใน Windows App SDK Experimental 2 ขณะที่ฟีเจอร์ Foundry Local ตอนนี้ต้องดาวน์โหลดแยกผ่าน Winget
ที่มา - Windows Blog
on
อันนี้ค่อยดีหน่อย แบบนี้ NPU…
tontan Tue, 20/05/2025 - 00:10
อันนี้ค่อยดีหน่อย แบบนี้ NPU ค่อยได้ใช้ประโยชน์ขึ้นมาบ้าง แต่ฝัง MCP นี่เป็นการเพิ่มความเสี่ยงของระบบพอควร ระบบป้องกันอะไรควรประกาศมาพร้อมกัน ส่วน Phi Silica ไม่ปล่อย base model ออกมาเลย การดัดแปลงอะไรแลดูยาก เพราะต้องจูนตัว instruction เท่านั้น ควรให้เปลี่ยน Phi Silica ไปเป็นตัวอื่น ๆ ได้ด้วยจะดีกว่า
เอาจริงก็ยังมีคำถามว่าออกฟีเ…
lew Tue, 20/05/2025 - 02:16
In reply to อันนี้ค่อยดีหน่อย แบบนี้ NPU… by tontan
เอาจริงก็ยังมีคำถามว่าออกฟีเจอร์ชุดนี้ออกมาแล้ว NPU จะได้ใช้งานจริงๆ ไหม เพราะผลทดสอบตอนนี้ token/sec ก็ยังไม่ดีนักเทียบกับ GPU หรือ CPU (แม้จะประหยัดไฟกว่า) ใช้จริงๆ ประสบการณ์การใช้งานอาจจะลดลงถ้าไม่ได้เพิ่มพลังประมวลผล จูนกับโมเดลบางตัวจนประสิทธิภาพดีมากๆ
รันโมเดลขนาดเล็กไม่เปลืองแบต…
tontan Tue, 20/05/2025 - 11:58
In reply to เอาจริงก็ยังมีคำถามว่าออกฟีเ… by lew
รันโมเดลขนาดเล็กไม่เปลืองแบตที่ไม่ต้องตอบสนองทันที น่าจะช่วยได้เยอะเลยครับ เช่นพวก local RAG รันเงียบ ๆ เวลามีไฟล์ใหม่เข้ามา กรณีประมาณนี้น่าจะมีประโยชน์สุดครับ
เช่น API สรุปข่อความ …
panurat2000 Tue, 20/05/2025 - 17:45
ข่อความ => ข้อความ