ในช่วงการเลือกตั้งประธานาธิบดีสหรัฐอเมริกาที่ผ่านมา บริการแชทบอต AI ต่างถูกจับตามองมากว่าจะให้คำตอบข้อมูลที่เกี่ยวกับการเลือกตั้งได้ถูกต้อง หรือมีอคติแบบใด ทำให้ผู้พัฒนาหลายรายเลือกใช้วิธีที่แตกต่างกันออกไป
OpenAI เปิดเผยว่าแชทบอต ChatGPT ได้ใช้วิธีตั้งฟิลเตอร์คำถามเกี่ยวกับการเลือกตั้งสหรัฐ โดยแนบลิงก์ให้ไปดูข้อมูลที่เว็บไซต์ภายนอก เช่น เว็บไซต์อธิบายขั้นตอนการลงคะแนน หรือหากเป็นการถามผลคะแนนล่าสุดจะเป็นลิงก์ไปที่สำนักข่าว Reuters กับ AP ซึ่ง OpenAI บอกว่ามีการส่งคำถามเกี่ยวกับผลการเลือกตั้งมากกว่า 2 ล้านครั้ง ในวันเลือกตั้งที่ผ่านมา และยังปฏิเสธคำสั่งที่ให้สร้างรูปภาพปลอมนักการเมืองมากกว่า 2.5 แสนครั้งในช่วงที่ผ่านมา
กูเกิลประกาศว่า Google Vids แอปสร้างวิดีโอนำเสนอเอกสารด้วยปัญญาประดิษฐ์ Gemini จะเริ่มเปิดให้ใช้งานได้ทั่วไปแล้วสำหรับลูกค้า Workspace บางกลุ่ม ได้แก่ Business, Enterprise, Essentials และ Education Plus จากก่อนหน้านี้เปิดให้ใช้งานผ่าน Workspace Labs เฉพาะลูกค้าที่จ่ายแพ็คเกจเสริม Gemini for Workspace
Google Vids เปิดตัวมาตั้งแต่เดือนเมษายน ให้ผู้ใช้งานสร้างวิดีโอนำเสนอจากเอกสารใน Google Drive สามารถเลือกรูปแบบ ปรับแต่งภาพที่แทรก ไปจนถึงรายละเอียดเล็กน้อย สามารถแทรกวิดีโอบรรยายของตนเอง หรือบันทึกหน้าจอ หรือไฟล์เสียง เข้าไปเพิ่มเติมได้ด้วย
Bloomberg รายงานโดยอ้างแหล่งข่าวที่เกี่ยวข้องบอกว่า Baidu บริษัทเทคโนโลยีรายใหญ่ในจีน เตรียมเปิดตัวแว่นตาอัจฉริยะพลัง AI ที่มีลักษณะคล้ายกับแว่นตาอัจฉริยะ Ray-Ban Meta Smart Glasses ของ Meta ในงานสัมมนาประจำปี Baidu World สัปดาห์หน้า
ข้อมูลบอกว่าแว่นตาจะมีกล้องด้านหน้าสำหรับถ่ายภาพและวิดีโอ รองรับการสั่งงานและโต้ตอบด้วยเสียงผ่านโมเดล AI Ernie ของ Baidu เชื่อมต่อกับบริการต่าง ๆ ที่ Baidu มีทั้งแผนที่นำทาง และคลังข้อมูล ราคาขายคาดว่าจะต่ำกว่าแว่นของ Meta ที่ขายอยู่ 299 ดอลลาร์ และน่าจะเริ่มขายในต้นปีหน้า
ไมโครซอฟท์ประกาศเพิ่มความสามารถใหม่ด้าน AI ใน Paint และ Notepad โดยมีผลกับผู้ใช้งาน Windows 11 กลุ่ม Windows Insiders ก่อน มีรายละเอียดดังนี้
Paint เวอร์ชัน 11.2410.28.0 เพิ่มฟีเจอร์ Generative fill สร้างวัตถุในรูปภาพตามตำแหน่งที่ระบุด้วย prompt หากรูปที่ได้ยังไม่ถูกใจ สามารถเลือก Try again หรือปรับรายละเอียดเพิ่มเติมใน prompt ได้ ฟีเจอร์นี้ได้เฉพาะ Copilot+ PC ที่เป็นซีพียู Snapdragon เท่านั้น การใช้งานต้องล็อกอินบัญชี Microsoft ด้วย
ปัจจุบันโมเดล LLM เก่งๆ มีหลากหลายโมเดล แต่ส่วนใหญ่ถูกพัฒนาจากกรอบของภาษาอังกฤษ หรือภาษาอื่นที่เป็นภาษาหลักของโลก รวมถึงชุดข้อมูลและการปรับแต่ง ก็ถูกตีกรอบด้วยอิทธิพลและมุมมองจากตะวันตกเป็นหลัก ทำให้ในหลายๆ ประเทศ หลายๆ ภูมิภาค ที่มีภาษาและบริบททางวัฒนธรรมเฉพาะ ไม่สามารถเข้าถึง LLM ได้ ซึ่งบริษัทใหญ่ๆ ก็คงไม่เน้นพัฒนาให้ หรือประเทศนั้นๆ จะพัฒนาเอง ก็ไม่ได้มีทรัพยากรเพียงพอ
มีรายงานสั้น ๆ จาก Nikkei Asia พูดถึงแผนการสร้างเซิร์ฟเวอร์ของแอปเปิล เพื่อใช้ประมวลผลปัญญาประดิษฐ์ Apple Intelligence บอกว่าแอปเปิลได้ให้ Foxconn เป็นผู้ผลิตเซิร์ฟเวอร์ให้
Ollama ซอฟต์แวร์รันไทม์สำหรับรันโมเดลปัญญาประดิษฐ์ ออกเวอร์ชั่น 0.4 รองรับการรันโมเดลที่รับอินพุตเป็นภาพ โมเดลสำคัญคในกลุ่มนี้คือ Llama 3.2 ของ Meta
llama3.2-vision
มีทั้งรุ่น 11B และ 90B ต้องการแรมขั้นต่ำ 8GB ส่วนรุ่น 90B ต้องการขั้นต่ำ 64GB โดยโมเดลรุ่นเล็กเหล่านี้เป็นแบบ quantize 4 bit รุ่นใหญ่สุดแบบ FP16 นั้นเฉพาะไฟล์โมเดลก็ขนาดถึง 177GB แล้ว
การใช้งาน llama3.2-vision
สามารถใช้งานได้ทั้งการทำ OCR, อ่านลายมือ, อธิบายภาพ
ที่มา - Ollama
ความร้อนแรงในการลงทุนของสตาร์ทอัป AI ยังมีรายงานออกมาต่อเนื่อง โดย Perplexity AI เข้าสู่ขั้นตอนสุดท้ายของการรับเงินทุนเพิ่ม 500 ล้านดอลลาร์ ที่มูลค่ากิจการ 9 พันล้านดอลลาร์ สูงกว่ารายงานที่ออกมาเมื่อสัปดาห์ก่อนซึ่งอยู่ที่ 8 พันล้านดอลลาร์
มูลค่ากิจการของ Perplexity AI ทำให้เป็นหนึ่งบริษัทเติบโตอย่างรวดเร็ว เมื่อต้นปีบริษัทมีมูลค่าประมาณ 520 ล้านดอลลาร์
Anthropic ประกาศว่าโมเดลปัญญาประดิษฐ์ Claude 3.5 Haiku ที่เป็นรุ่นเล็กมีราคาถูก ตอนนี้เปิดให้ใช้งานแล้วผ่าน API และผ่านผู้ให้บริการคลาวด์ทั้ง Amazon Bedrock และ Vertex AI หลังจากเปิดตัวไปเมื่อเดือนที่แล้วพร้อมกับ Sonnet 3.5 รุ่นปรับปรุง
รายงานประจำปีเศรษฐกิจดิจิทัลภูมิภาคเอเชียตะวันออกเฉียงใต้ e-Conomy SEA 2024 ประจำปีนี้ออกมาแล้ว ซึ่งจัดทำโดยความร่วมมือของกูเกิล, Temasek และ Bain & Company เพื่อนำเสนอทิศทางเศรษฐกิจดิจิทัลของหนึ่งในภูมิภาคที่มีการเติบโตสูงต่อเนื่องหลายปีในโลก โดยรายงานยังคงจัดทำเนื้อหาใน 6 ประเทศคือ อินโดนีเซีย มาเลเซีย ฟิลิปปินส์ สิงคโปร์ ไทย และเวียดนาม
มูลค่าเงินในธุรกิจรวมหรือ GMV ปีนี้เพิ่มขึ้น 15% จากปี 2023 เป็น 2.63 แสนล้านดอลลาร์ (ไม่รวมธุรกิจฟินเทค) คิดเป็นรายได้ของธุรกิจ 8.9 หมื่นล้านดอลลาร์ เพิ่มขึ้น 14% และรายงานปีนี้เริ่มวัดผลการทำกำไรของธุรกิจดิจิทัลเป็นปีแรกพบว่าเพิ่มขึ้น 2.5 เท่า ในช่วงสองปีที่ผ่านมาเป็น 1.1 หมื่นล้านดอลลาร์
OpenAI ยืนยันว่า Caitlin Kalinowski อดีตหัวหน้าฝ่ายพัฒนาแว่นตา AR ที่ Meta ได้เข้าร่วมงานกับบริษัทในตำแหน่งหัวหน้าทีมพัฒนาฮาร์ดแวร์หุ่นยนต์และสินค้าสำหรับลูกค้าบุคคล
Kalinowski ขึ้นมารับตำแหน่งหัวหน้าทีมพัฒนาแว่นตา AR ที่ Meta ตั้งแต่ปี 2022 ซึ่งรวมทั้งดูแลโครงการแว่นตา Orion ที่ Meta เพิ่งเปิดตัวด้วย ก่อนหน้านั้น Kalinowski ดูแลทีมพัฒนาแว่น VR และก่อนมาทำงานที่ Meta เคยอยู่ฝ่ายออกแบบฮาร์ดแวร์ MacBook ที่แอปเปิล
แอปเปิลออกอัปเดต iOS 18.2 เบต้าที่ 2 ให้นักพัฒนาได้ทดสอบในวันนี้ ซึ่งใน iOS 18.2 มีของใหม่สำคัญคือการเชื่อมต่อกับ ChatGPT ผ่าน Siri อย่างไรก็ตามมีข้อมูลเพิ่มเติมว่าการเรียกใช้งาน ChatGPT ผ่านช่องทางนี้จะมีจำนวนจำกัดต่อวัน
ใน Settings ของ iOS ระบุว่าความสามารถขั้นสูงในการใช้งาน ChatGPT ผ่าน Siri มีจำนวนจำกัดต่อวัน (Daily Limit) โดยไม่ได้บอกเป็นตัวเลข แต่บอกเพียงครบจำนวนหรือไม่ พร้อมแถบสมัครใช้งาน ChatGPT Plus เพื่อให้ไม่มีข้อจำกัดใช้งาน หรือไม่ก็ได้ใช้ ChatGPT แบบฟังก์ชันพื้นฐานแทน
ผู้ใช้งาน ChatGPT Plus อยู่แล้ว สามารถล็อกอินเพื่อเชื่อมต่อบริการได้เลยใน Settings แต่หากยังไม่มีก็กดสมัครโดยตรงจาก Settings ได้เช่นกัน ในราคา 19.99 ดอลลาร์ต่อเดือน
มีรายงานความคืบหน้าของการเปลี่ยนโครงสร้างบริษัท OpenAI ให้เป็นรูปแบบแสวงหากำไรมากขึ้น (For-Profit) จากที่โครงสร้างปัจจุบัน ให้อำนาจส่วนไม่แสวงหากำไร (Non-Profit) สูงกว่า ซึ่งส่วนหนึ่งเป็นผลมาจากการเพิ่มทุนรอบล่าสุดด้วย
โดย Bloomberg อ้างแหล่งข่าวสองรายที่เกี่ยวข้องบอกว่า OpenAI ได้เข้าหารือกับอัยการแห่งรัฐแคลิฟอร์เนียเกี่ยวกับขั้นตอนการแก้ไขโครงสร้างบริษัทแล้ว ข้อมูลเบื้องต้นนั้นบอกว่าส่วนธุรกิจ Non-Profit ยังคงมีอยู่ต่อไป แต่จะเป็นผู้ถือหุ้นรายเล็กในบริษัท For-Profit ที่จะขึ้นมาเป็นส่วนธุรกิจหลักแทน
สำนักข่าว CNA ของไต้หวันรายงานว่า NVIDIA จองกำลังแพ็กเกจชิปแบบ TSMC CoWoS (Chip on Wafer on Substrate) ไว้ 50% ของกำลังผลิตปี 2025 เรียบร้อยแล้ว แม้ว่าทาง TSMC จะเพิ่มกำลังผลิตขึ้นอย่างมากในปีที่ผ่านมา
CoWoS เป็นเทคโนโลยีการเชื่อมชิปหลายตัวบนแผ่นซิลิกอนที่โรงงานผลิตสมัยใหม่สามารถทำได้หลายแห่งรวมถึงอินเทลที่มีเทคโนโลยี EMIB และ Foveros ของตัวเอง ที่ผ่านมา NVIDIA นั้นใช้โรงงานผลิตของ TSMC เป็นหลัก โดยรายได้จากธุรกิจแพ็กเกจชิปของ TSMC นั้นคิดเป็น 7-9% ของรายได้บริษัท
Runway สตาร์ทอัปที่เน้นพัฒนาปัญญาประดิษฐ์สร้างวิดีโอ ประกาศเพิ่มเครื่องมือ Advanced Camera Control บนโมเดล Gen-3 Alpha Turbo ทำให้ผู้ใช้งานกำหนดรายละเอียดทิศทางมุมกล้องที่ต้องการได้ตั้งแต่ใน Prompt
ทิศทางและการเคลื่อนที่ของกล้องสามารถกำหนดได้ตั้งแต่ระดับ เลื่อนซ้าย-ขวา-บน-ล่าง, ซูมเข้า, ทิศทางกล้องหมุน ความเร็ว จนถึงระยะห่างที่ซูมกับวัตถุ ทำให้การสร้างวิดีโอด้วย Gen-3 Alpha Turbo ควบคุมได้มากขึ้นคล้ายกับการถ่ายงานวิดีโอจริงมากขึ้นไปอีก
ในยุคที่บริษัทผู้ผลิตชิปต่างออกชิปเร่งความเร็วประมวลผล AI ฝั่งอินเทลก็มีชิปแบบนี้เช่นกันในตระกูล Gaudi ซึ่งรุ่นล่าสุดที่เปิดตัวเมื่อต้นปีคือ Intel Gaudi 3 อย่างไรก็ตามดูเหมือนอินเทลจะยังทำยอดขายส่วนนี้ไม่ได้ตามแผน
Pat Gelsinger ซีอีโออินเทลให้ข้อมูลในช่วงแถลงผลประกอบการไตรมาสที่ผ่านมา ยอมรับว่าบริษัทจะขายชิปตระกูล Gaudi ไม่ได้ตามเป้าหมายที่วางไว้คือ 500 ล้านดอลลาร์ ในปี 2024 ซึ่งเขาให้เหตุผลว่าเป็นเพราะเรื่องการเปลี่ยนผ่านจาก Gaudi 2 มาเป็น Gaudi 3 ของลูกค้า รวมทั้งความง่ายในการใช้งานซอฟต์แวร์
ฝ่ายวิจัยพื้นฐานปัญญาประดิษฐ์ของ Meta หรือทีม FAIR เผยแพร่งานวิจัยในการพัฒนา AI ที่สามารถรับรู้ผ่านการสัมผัส เพื่อให้นำไปใช้งานกับหุ่นยนต์ที่เลียนแบบความรู้สึกของมนุษย์ได้ โดยงานวิจัยนี้เป็นความร่วมมือกับบริษัทผู้ผลิตอุปกรณ์เซ็นเซอร์ GelSight และบริษัทหุ่นยนต์ Wonik Robotics
Sam Altman ซีอีโอ OpenAI ตอบคำถามในเซสชัน AMA บน Reddit หลังการเปิดตัวบริการค้นหาข้อมูลผ่านแชทบอต ChatGPT Search โดยมีคำถามหนึ่งคือโมเดลปัญญาประดิษฐ์รุ่นใหม่ของ OpenAI หรือที่เรียกกันเองว่า GPT-5 จะออกมาเมื่อใด
Altman บอกว่าการเปิดตัวโมเดลที่ปรับปรุงครั้งใหญ่รอบใหม่นั้น ไม่น่าจะมีออกมาในปีนี้ โดยโฟกัสหลักตอนนี้การพัฒนาโมเดลปัจจุบันที่มีอยู่ ให้รองรับการคิดแบบเป็นเหตุเป็นผล และตอบคำถามที่ซับซ้อนได้ดีขึ้น
เขาบอกว่าจะมีสิ่งใหม่เปิดตัวอีกภายในปีนี้ แต่ทั้งหมดนั้นไม่ใช่อะไรที่เรียกว่า GPT-5 แน่
OpenAI เปิดตัวบริการใหม่ ChatGPT Search เพื่อให้ผู้ใช้งานค้นหาข้อมูลจากเว็บไซต์ต่าง ๆ รองรับข้อมูลที่มีการปรับปรุงอยู่ตลอดอย่าง ผลการแข่งขันกีฬา, ข่าวสาร หรือราคาหุ้น ด้วยรูปแบบการโต้ตอบของแชทบอตผ่านกล่อง ChatGPT
ในการทำงาน ChatGPT จะเลือกค้นหาข้อมูลผ่านเว็บตามลักษณะคำถาม หรือผู้ใช้งานจะเลือกปุ่ม Web Search เพื่อให้ ChatGPT ค้นหาข้อมูลจากเว็บไซต์ก็ได้ ในผลคำตอบจะมีลิงก์แนบท้ายเพื่อให้ดูข้อมูลเพิ่มเติมที่ต้นทางด้วย
Universal Music Group (UMG) ประกาศทำข้อตกลงความร่วมมือกับ Klay บริษัทผู้พัฒนาโมเดลปัญญาประดิษฐ์แบบมีจริยธรรม (Ethical Model) โดยมีเป้าหมายพัฒนาเครื่องมือสร้างเพลงด้วย AI รองรับนวัตกรรมและความคิดสร้างสรรค์ใหม่ แต่ตอบโจทย์ด้านลิขสิทธิ์และทรัพย์สินทางปัญญาของอุตสาหกรรมดนตรี
Ary Attie ซีอีโอและผู้ก่อตั้ง Klay บอกว่าเป้าหมายการสร้างโมเดล AI ของบริษัทคือผลิตเพลงที่เป็นส่วนหนึ่งของวัฒนธรรมของผู้คน ไม่ใช่แค่การโชว์ผลงานวิจัย และเผยแพร่ผลงานสั้น ๆ บริษัทเชื่อว่านักดนตรีที่มีชื่อเสียงในยุคหน้าจะสร้างเพลงด้วย Klay ได้
สำนักข่าว Reuters อ้างแหล่งข่าวที่เกี่ยวข้องเผยว่า OpenAI กำลังร่วมมือกับ Broadcom และ TSMC เพื่อพัฒนาชิปของตนเองสำหรับงานประมวลผล AI นอกจากนี้บริษัทยังเริ่มสั่งซื้อชิป AI จาก AMD เพิ่มเติมนอกเหนือจาก NVIDIA เพื่อรองรับความต้องการใช้งานที่มากขึ้น
ก่อนหน้านี้มีรายงานว่า OpenAI ได้ศึกษาแนวทางเพื่อลดการพึ่งพาชิปประมวลผล AI จากบริษัทภายนอก เพื่อให้มีชิปใช้งานเอง เหมือนที่บริษัทเทคโนโลยีรายใหญ่ทำ โดยแผนแรกนั้น OpenAI ต้องการทำทุกอย่างตั้งแต่ต้นน้ำถึงปลายน้ำ ซึ่งรวมทั้งการมีโรงงานผลิตชิปของตนเองเลย แต่บริษัทก็ยกเลิกแผนนี้เนื่องจากต้นทุนที่สูง และต้องใช้เวลานานมาก
GitHub ประกาศว่าฟีเจอร์ด้านปัญญาประดิษฐ์ GitHub Copilot จะเพิ่มทางเลือกให้ผู้ใช้งานมากขึ้นจากปัจจุบันที่เป็น GPT-4o โดยสามารถเลือกใช้โมเดล AI ได้ทั้ง Claude 3.5 Sonnet ของ Anthropic, Gemini 1.5 Pro ของกูเกิล และ o1-preview กับ o1-mini ของ OpenAI โดยจะเริ่มให้เลือกใช้งานได้ใน Copilot Chat ก่อน
ตัวเลือก o1-preview กับ o1-mini เริ่มเปิดให้ใช้งานได้ตั้งแต่วันนี้ ส่วน Claude 3.5 Sonnet จะมาในสัปดาห์หน้า และ Gemini 1.5 Pro จะตามมาในภายหลัง
Thomas Dohmke ซีอีโอ GitHub บอกว่าตอนนี้ไม่มีโมเดล AI ตัวใดที่สามารถใช้งานได้กับทุกสถานการณ์ นักพัฒนาจึงควรมีทางเลือกผู้ช่วยที่เหมาะกับแต่ละคนมากที่สุด
จากข่าว Open Source Initiative หรือ OSI ออกมาให้นิยามของ AI โอเพนซอร์สว่าต้องมีเงื่อนไขใดบ้าง ซึ่งผลคือนิยามนั้นทำให้โมเดล AI ที่ผู้พัฒนาเผยแพร่บอกว่าเป็นโอเพนซอร์สยอดนิยมหลายตัว ไม่เข้าข่าย ซึ่งรวมทั้ง Llama ของ Meta ด้วย
Faith Eischen โฆษกของ Meta ชี้แจงว่าบริษัทเห็นด้วยกับ OSI ที่ทำงานร่วมกันเป็นพาร์ตเนอร์มาตลอดในหลายประเด็น แต่กับนิยาม AI โอเพนซอร์สนี้บริษัทไม่เห็นด้วย เพราะยังไม่มีนิยามเดียวที่สามารถใช้ได้ สำหรับโลกของ AI ที่มีความซับซ้อนสูง และมีการพัฒนาเปลี่ยนแปลงอย่างรวดเร็ว
Sarah Friar ซีเอฟโอของ OpenAI ให้สัมภาษณ์กับ Bloomberg ให้ข้อมูลโครงสร้างรายได้ขององค์กรต่อสาธารณะเป็นครั้งแรกๆ ช่วยให้เราเห็นภาพว่ารายได้ของ OpenAI ในปัจจุบันมาจากไหนบ้าง
ที่มา - Bloomberg
Open Source Initiative (OSI) หน่วยงานผู้ให้นิยามของซอฟต์แวร์โอเพนซอร์ส ประกาศนิยามของปัญญาประดิษฐ์โอเพนซอร์ส The Open Source AI Definition – 1.0 เพื่อให้อุตสาหกรรมเข้าใจตรงกันว่าการเป็นโอเพนซอร์ส (ตาม OSI) ต้องมีเงื่อนไขใดบ้าง
แนวทางนิยามของ OSI สำหรับปัญญาประดิษฐ์นั้นไม่ต่างจากซอฟต์แวร์มากนัก แต่เพิ่มนิยามรายละเอียด แยกส่วน เช่น ข้อมูลที่ใช้ฝึกนั้นต้องให้รายละเอียดเพียงพอ แม้จะไม่ต้องแชร์ข้อมูลออกมาเสมอไป, ตัวโค้ดที่ใช้รันต้องใช้สัญญาอนุญาตที่ OSI รองรับว่าเป็นโอเพนซอร์ส, และตัวพารามิเตอร์ต้องแจกในสัญญาอนุญาตที่ OSI รับรองเช่นกัน