ในงาน Microsoft BUILD ที่ผ่านมาไมโครซอฟท์ได้ประกาศถึงซอฟต์แวร์และบริการที่เกี่ยวกับปัญญาประดิษฐ์จำนวนมาก แต่ฟีเจอร์หนึ่งที่ประกาศออกมา คือ Windows AI Foundry ที่ปรับปรุงจากไลบรารีเดิม และเพิ่มความสามารถสำคัญคือการรันโมเดลปัญญาประดิษฐ์แบบ large language model ได้ในตัว ในงานครั้งนี้ Steven Bathiche ที่เป็น Microsoft Technical Fellow ก็ให้สัมภาษณ์ถึงแนวทางการพัฒนาวินโดวส์ด้วยเทคโนโลยีตัวนี้ว่ามันจะเป็นอินเทอร์เฟซของการทำงานร่วมกับคอมพิวเตอร์ในยุคต่อไป

Bathiche เล่าถึงประวัติศาสตร์การพัฒนาคอมพิวเตอร์ว่าเราวนอยู่กับรูปแบบเดิมซ้ำๆ นั่นคือ
- พลังประมวลผลที่สูงขึ้น เช่นชิปรุ่นใหม่ที่เร็วขึ้น หรือเทคโนโลยีการผลิตใหม่ๆ
- ซอฟต์แวร์ที่ซับซ้อนขึ้น เนื่องจากนักพัฒนาสามารถทำงานที่ระดับสูงขึ้น เช่นช่วงหลังที่ไม่ต้องจัดการหน่วยความจำด้วยตัวเองแล้ว
- การทำงานร่วมกับคอมพิวเตอร์เปลี่ยนไป จากซอฟต์แวร์ใหม่ๆ
- รูปแบบของคอมพิวเตอร์ที่เปลี่ยนไป ผู้ผลิตสามารถออกแบบคอมพิวเตอร์แบบใหม่ๆ ได้จากการใช้งานที่เปลี่ยนไป
รูปแบบการพัฒนาเหล่านี้สามารถย้อนไปได้ไกลหลายสิบปี เช่น คอมพิวเตอร์ยุคแรกๆ ที่ไม่มีซอฟต์แวร์ใดๆ แต่ต่อมาก็มี bootloader จัดการฟังก์ชันพื้นฐานของฮาร์ดแวร์ให้ หรือความเปลี่ยนแปลงสำคัญคือการใช้งานคอมพิวเตอร์แบบกราฟิก (GUI) ที่วินโดวส์เป็นจุดเปลี่ยนของไมโครซอฟท์เอง
การพัฒนาในช่วงปีที่ผ่านมาในมุมมองของ Bathiche มีสองส่วนประกอบกันคือ เทคโนโลยี machine learning ที่ก้าวหน้าขึ้นอย่างรวดเร็ว ขณะที่พลังประมวลผลในคอมพิวเตอร์ก็สูงขึ้นมาก โดยเขาเลือกชูประเด็น NPU ซึ่งเป็นหน่วยประมวลผล Matrix ที่สามารถคำนวณข้อมูลขนาดใหญ่ๆ ได้อย่างมีประสิทธิภาพ (Copilot+ PC ของไมโครซอฟท์นั้นกำหนดว่าต้องมี NPU ด้วยเสมอ)
ขณะที่ฝั่งซอฟต์แวร์นั้น Bathiche ระบุว่ามีความก้าวหน้าในการพัฒนาโมเดลปัญญาประดิษฐ์ในช่วงปีที่ผ่านมา เช่น Speculative Decoding ที่ช่วยเร่งความเร็วในการรันโมเดลปัญญาประดิษฐ์ หรือ Quantization ระดับ 2 บิตที่ช่วยบีบโมเดลให้เล็กลงมาก ทำงานเร็วขึ้น โดยยังได้ประสิทธิภาพที่ค่อนข้างดี เขาสาธิตรันโมเดล Phi-4 โดยที่ระบบไม่โหลดซีพียูหรือจีพียูบนเครื่องแต่อย่างใด แต่สามารถใช้ NPU ที่ทำงานโดยเฉพาะได้

แนวทางการรันโมเดลปัญญาประดิษฐ์บนคอมพิวเตอร์ส่วนบุคคลนับเป็นแนวทางสำคัญในช่วงหลัง นักพัฒนาจำนวนมากใช้งาน Ollama เพื่อรันโมเดลบนพีซีกันอยู่แล้ว แอปเปิลถึงกับโชว์ประสิทธิภาพการรัน LLM เมื่อเปิดตัวชิป M3 Ultra ขณะที่แพลตฟอร์มโทรศัพท์มือถือก็ล้วนโชว์ว่าปัญญาประดิษฐ์รุ่นต่อๆ ไปจะสามารถรันบนเครื่องได้โดยตรงโดยไม่อาศันบริการคลาวด์
Windows AI Foundry Local โดยหลักแล้วค่อนข้างคล้ายกับคำสั่ง Ollama ที่เมื่อติดตั้งแล้วจะเปิดให้ผู้ใช้ดาวน์โหลดโมเดลรุ่นต่างๆ มาใช้งานได้ แต่ความต่างสำคัญคือไมโครซอฟท์สามารถควบคุมการรองรับฮาร์ดแวร์ได้เองทั้งหมด ทำให้พยายามขยายการรองรับโมเดลต่างๆ บนแพลตฟอร์มที่ต้องการได้ ระหว่างชิปกราฟิก, NPU, หรือแม้แต่ CPU ธรรมดาเอง โดยไมโครซอฟท์ย่อโมเดลให้พร้อมใช้งานมาแล้วจำนวนหนึ่ง และเปิดเครื่องมือสำหรับการย่อโมเดลให้นักพัฒนาภายนอกด้วย
Bathiche ระบุว่าเป้าหมายปลายทางของการรันปัญญาประดิษฐ์บนพีซียุคต่อไปคือการสร้าง Agent เพื่อติดต่อกับผู้ใช้ แทนที่จะให้ผู้ใช้เรียนรู้อินเทอร์เฟซและความสามารถต่างๆ ของคอมพิวเตอร์ Agent จะสามารถจดจำเรื่องราวต่างๆ ที่ผ่านมา ทำความเข้าใจอินเทอร์เฟซของโปรแกรมต่างๆ ในปัจจุบัน และสามารถเข้าควบคุมโปรแกรมต่างๆ แทนคนได้อย่างมีประสิทธิภาพ เขายอมรับว่าโมเดลทุกวันนี้อาจจะยังต้องการการออปติไมซ์เพิ่มเติมเพื่อให้ใช้งานได้ดีขึ้นต่อไป
on
Windows AI Foundry Local…
tontan Wed, 04/06/2025 - 00:54
Fail ตั้งแต่คิดล่ะ มีแค่ Windows ใช้งานได้ก็จบแล้ว เพราะแพ้ ollama ไปแล้ว ทำ ollama ทีเดียวใช้ได้หมด นอกจาก ollama ก็มี llama.cpp ทำงานได้ตั้งแต่คอมมี GPU ไปถึง RPI ยังไม่รวมตัวอื่น gguf จะมาแทน ONNX ไม่ต้องใช้ onnxruntime กับ windows ml kit (ฝั่ง llm ตัว onnx แพ้ gguf ไปแล้ว)
และไม่แน่ใจ MS ได้พูดถึงเครื่องมือหรืออะไรที่สามารถจูงโมเดลเพิ่มเติมเองภายในเครื่องผู้ใช้ไหม อันนี้ถ้ามีจะน่าสนใจกว่า
ผมว่าปัญหาก้อนใหญ่คือ Ollama…
lew Wed, 04/06/2025 - 08:09
In reply to Windows AI Foundry Local… by tontan
ผมว่าปัญหาก้อนใหญ่คือ Ollama (และโครงการอื่นๆ) ไม่ยอมรองรับ NPU ครับ เลยต้องมาทำเอง
เพราะฝั่ง MLX รองรับกันไปนานแล้ว ซึ่งก็น่าคิดเหมือนกันว่าไมโครซอฟท์คิดผิดไหม เพราะ NPU มันจำกัดมากแม้จะบอกว่าออกแบบมาเฉพาะ ตัว Phi-4 นี่ต้อง quantize 2-bit ถึงรันได้
NPU น่าจะเกิดยากแล้วอ่ะครับ…
tontan Wed, 04/06/2025 - 18:20
In reply to ผมว่าปัญหาก้อนใหญ่คือ Ollama… by lew
NPU น่าจะเกิดยากแล้วอ่ะครับ จนกว่าจะมี vulkan / opengl แบบที่พวก GPU มีใช้กัน ซอฟต์แวร์ กับ มาตรฐานกลาง
+1…
hisoft Wed, 04/06/2025 - 21:56
In reply to ผมว่าปัญหาก้อนใหญ่คือ Ollama… by lew
+1 คิดว่าสเปคมันออกมาเร็วไปมาก ตัว NPU ขั้นต่ำจำกัดมากเกินจนแทบใช้งานอะไรจริงยังไม่ได้
สมมติอนาคตหาทางให้อะไรมันมารันเป็นเรื่องเป็นราวได้จริงมันก็ยังจำกัดมากอยู่ดี อย่างน้อยที่สุดก็คงต้องมีอัปเกรดสเปคขั้นต่ำอีกรอบนึง
ขอสัก FP4 ก็ยังดี…
lew Wed, 04/06/2025 - 22:48
In reply to +1… by hisoft
ขอสัก FP4 ก็ยังดี กับอีกจุดคือ memory bandwidth ถ้าจะทำ AI PC จริงๆ อาจจะควรมี memory แยกไป
Bring Me The Horizon - …
Tasksenger Wed, 04/06/2025 - 06:47
Bring Me The Horizon - 'Kingslayer' เพลงนี้มันส์ดีนะ ฟังแล้วนึกถึงโลกยุคอนาคต ทั้งที่เนื้อเพลงเกี่ยวกับการสรรเสริญนักบุญ
https://www.youtube.com/watch?v=hb2mMVdx1KU