Tags:
Node Thumbnail

นอกจากเปิดตัว Gemini 1.5 Pro แล้ว กูเกิลยังประกาศว่าโมเดล AI ทั้ง Gemini 1.0 Pro และ Gemini 1.0 Ultra ที่เปิดตัวเมื่อสัปดาห์ที่แล้ว ตอนนี้เปิดให้นักพัฒนาสามารถใช้งานได้แล้วผ่าน Vertex AI

โดย Gemini 1.0 Pro สามารถใช้งานได้แล้วสำหรับลูกค้า Vertex AI ทุกคน ส่วน Gemini 1.0 Ultra โมเดลรุ่นใหญ่ที่สุดในตระกูล Gemini ที่กูเกิลบอกว่าคะแนนทดสอบสูงกว่า GPT-4 ตอนนี้เปิดให้ใช้งานสำหรับลูกค้า Vertex AI ที่อยู่ใน allowlist

ที่มา: กูเกิล

Tags:
Node Thumbnail

OpenAI เปิดตัวโมเดลใหม่ สำหรับสร้างวิดีโอด้วย AI จากข้อความ (Text-to-Video) มีชื่อว่า Sora จุดเด่นคือสามารถสร้างวิดีโอความยาวถึง 1 นาที ที่มีความละเอียดสูง และลงรายละเอียดในวิดีโอได้ตาม prompt ของผู้ใช้งาน

Sora มีความสามารถสร้างวิดีโอที่มีฉากหลังรายละเอียดซับซ้อน มีตัวละครอยู่ในวิดีโอหลายคน ระบุรูปแบบการเคลื่อนไหวได้ รวมถึงลงรายละเอียดปลีกย่อยได้ ซึ่งจุดเด่นที่ Sora มีคือการแสดงผลแบบเป็นไปตามสภาพจริงที่ปรากฏอยู่

มีข้อดีก็มีข้อจำกัด OpenAI บอกว่า Sora ยังไม่สมบูรณ์แบบ โดยเฉพาะฉากที่มีวัตถุหลายอย่างซับซ้อน การแสดงผลทางฟิสิกส์อาจผิดพลาด เช่น ฉากกินขนม ขนมก็อาจไม่มีรอยหรือหายไปตามการถูกกิน และบางครั้งโมเดลก็สับสนในการทำงานระหว่างซ้ายและขวา

Tags:
Node Thumbnail

กูเกิลเพิ่งเปิดตัว Gemini Ultra ไปหมาดๆ วันนี้ปล่อยของต่อเนื่องด้วยโมเดลเวอร์ชันอัพเดต Gemini 1.5 Pro ซึ่งเป็นการอัพเกรดโมเดลระดับกลาง (Pro) ที่มีความสามารถระดับเดียวกับ Gemini 1.0 Ultra แต่ใช้พลังประมวลผลน้อยกว่า

ฟีเจอร์เด่นของ Gemini 1.5 Pro ที่น่าสนใจคือการรองรับอินพุตขนาดใหญ่ถึง 1 ล้านโทเคน ซึ่งถือว่ามากที่สุดในบรรดาโมเดลภาษาขนาดใหญ่ทุกวันนี้ (Anthropic Claude 2.1 รองรับ 2 แสนโทเคน) เปิดโอกาสให้ใช้งานโมเดล LLM กับงานที่หลากหลายขึ้นอีกมาก กูเกิลเทียบให้เห็นภาพว่าเท่ากับคลิปเสียงยาว 11 ชั่วโมง, วิดีโอ 1 ชั่วโมง, เอกสาร 700,000 คำ, โค้ด 30,000 บรรทัด

Tags:
Node Thumbnail

Y Combinator โครงการบ่มเพาะสตาร์ทอัพชื่อดัง อัพเดตหมวดของสตาร์ทอัพที่พาร์ตเนอร์มีความสนใจร่วมลงทุน ซึ่ง Y Combinator เรียกรายการนี้ว่า Request for Startups (RFS) โดยใช้หมวดเหล่านี้ในการพิจารณามาตั้งแต่ปี 2009 และปรับหมวดที่สนใจเป็นระยะ

รายการ RFS นี้ไม่มีการเปลี่ยนแปลงมาตั้งแต่ปี 2018 โดยเพิ่งประกาศ 20 หมวดล่าสุดในปีนี้ ซึ่งมีหัวข้อใหม่เพิ่มเข้ามาที่น่าสนใจและตามกระแส โดยเฉพาะกลุ่ม AI ขณะเดียวกันก็มีหมวดอย่างเทคโนโลยีสภาพอากาศ (Climate Tech) หรือแม้แต่สตาร์ทอัพที่ทำให้ภาคการผลิตกลับสู่อเมริกา

20 หมวดของสตาร์ทอัพใน RFS ปัจจุบันของ Y Combinator มีดังนี้

Tags:
Node Thumbnail

Stability AI เปิดตัวโมเดลสร้างรูปภาพจากข้อความ Stable Cascade ที่สถานะตอนนี้ยังเป็นงานวิจัย สามารถนำไปใช้งานได้ในงานที่ไม่ใช่เชิงพาณิชย์ สามารถดูรายละเอียดเพิ่มเติมได้ที่ GitHub

Stable Cascade เป็นโมเดลสร้างรูปภาพที่มีขั้นตอนการทำงานต่างไปจาก Stable Diffusion ที่เป็นเครื่องมือสร้างรูปภาพหลักของ Stability AI โดยประกอบด้วย 3 โมเดลย่อยบนสถาปัตยกรรม Würstchen ขั้นตอนแรกเรียกว่า Stage C เป็นการสร้างรายละเอียดย่อยในภาพ (Latent Generator) แล้วส่งต่อไป Stage B และ Stage A เพื่อปรับแต่งความละเอียดรูปภาพให้ออกมาคมชัด ผลลัพธ์ที่ได้นอกจากภาพที่ละเอียดมากกว่า ยังใช้เวลาในการสร้างรูปภาพที่สั้นกว่าโมเดลเดิมด้วย

Tags:
Node Thumbnail

แอปเปิลเผยแพร่งานวิจัยด้าน AI ตัวล่าสุด ซึ่งอาจทำให้เห็นทิศทางฟีเจอร์ใหม่ ๆ ในสินค้าแอปเปิล โดยคราวนี้เป็นเครื่องมือชื่อว่า Keyframer ที่มีความสามารถสร้างอนิเมชันเคลื่อนไหว จากภาพนิ่งตั้งต้น 2 มิติ โดยใช้โมเดลภาษาขนาดใหญ่ (LLM) ช่วยป้อนคำสั่งที่ต้องการ

ในงานวิจัยนี้ อินพุทของรูปภาพต้องเป็นไฟล์ภาพ SVG แล้วป้อน prompt สิ่งที่ต้องการให้ในภาพมีการเคลื่อนไหว จากนั้น Keyframer จะสร้างโค้ด CSS เพื่อปรับวัตถุในภาพแต่ละส่วนให้เป็นไปตาม prompt ที่ระบุ

ทีมวิจัยบอกว่า Keyframer ช่วยลดขั้นตอนของผู้ผลิตอนิเมชัน ที่ทำให้สร้างภาพเคลื่อนไหวจากงานเริ่มต้น ซึ่งเดิมอาจต้องใช้เวลาพอสมควรเพราะต้องขยับวัตถุ มาช่วยให้ได้ผลลัพธ์ทันทีจากคำสั่ง

Tags:
Node Thumbnail

Slack เปิดตัว Slack AI เป็นชุดฟีเจอร์เสริม (แปลว่าคิดเงินเพิ่ม) ที่ใช้พลัง AI จากโมเดลภาษา LLM มาช่วยแก้ปัญหา "ข้อความแชทไหลบ่า" ที่พนักงานออฟฟิศต้องประสบพบเจอกันตลอดเวลา

Slack AI แบ่งฟีเจอร์ออกเป็น 2 กลุ่มใหญ่ๆ คือ summarize/recap ช่วยอ่านข้อความในห้องแชทต่างๆ แล้วสรุปใจความสั้นๆ ให้เรา (ในอนาคตจะมีฟีเจอร์ channel recap สรุปการแชทในห้องที่เราไม่ค่อยได้เข้าไปอ่าน) กับ search ที่ช่วยผู้ใช้ค้นหาคำตอบ-ข้อมูลจากประวัติแชทได้ละเอียด เจาะจง เป็นภาษามนุษย์ได้ง่ายขึ้น (เช่น พนักงานใหม่อาจถาม AI ได้เลยว่า "what is Project Gizmo" แล้วอ่านสรุปทีเดียว ไม่ต้องไปไล่อ่านแชท)

Tags:
Node Thumbnail

Andrej Karpathy นักวิจัยด้าน AI และเป็นหนึ่งในผู้ร่วมก่อตั้ง OpenAI ประกาศว่าเขาได้ลาออกจากการทำงานที่ OpenAI แล้ว ซึ่งเป็นการลาออกครั้งที่ 2 โดยครั้งแรกหลังจากร่วมก่อตั้ง เขาได้ลาออกมาทำงานที่ Tesla ในฝ่ายพัฒนาระบบขับเคลื่อนอัตโนมัติ และลาออกเมื่อปี 2022 โดยกลับมาทำงานที่ OpenAI อีกครั้ง

Karpathy โพสต์ข้อความใน X โดยบอกว่า "ไม่ได้มีเรื่องอะไร" ที่ทำให้เขาต้องตัดสินใจลาออก ซึ่งคงหมายถึงเหตุการณ์ชุลมุนดราม่าใน OpenAI ช่วงที่ผ่านมา ทั้งยังบอกว่าแต่ยังอยากอ่านทฤษฎีสมคบคิดทั้งหลายต่อไปเพราะมันสนุกดี

Tags:
Node Thumbnail

OpenAI และ Microsoft Threat Intelligence หน่วยงานความปลอดภัยของไมโครซอฟท์ เปิดเผยผลการศึกษา พบว่ามีหน่วยงานที่มุ่งหวังโจมตีทางไซเบอร์ ได้ประยุกต์ใช้เครื่องมือ AI เพื่อปรับปรุงประสิทธิภาพการโจมตีให้มีโอกาสประสบความสำเร็จมากขึ้น

ทั้งนี้ OpenAI และไมโครซอฟท์บอกว่าการเผยแพร่รายงานนี้ เพื่อแสดงถึงความโปร่งใสของข้อมูล และรายงานความก้าวหน้าของการปรับปรุงบริการ เพื่อไม่ให้เกิดการนำมาใช้งานประเภทนี้ในอนาคต

Tags:
Node Thumbnail

NVIDIA เปิดตัว Chat with RTX เป็นไคลเอนต์สำหรับรันแช็ทบ็อท Generative AI บนเครื่องพีซีของเราเอง ไม่ต้องพึ่งพาเซิร์ฟเวอร์ภายนอก ช่วยรักษาความเป็นส่วนตัวเรื่องข้อมูลได้ดีกว่าการไปใช้บริการ LLM บนคลาวด์

Chat with RTX เป็นแพลตฟอร์มที่ใช้รันโมเดลภาษาโอเพนซอร์ส (ตอนนี้รองรับ Llama 2 และ Mistral สองตัว) มารันบน Tensor Core ของจีพียู GeForce RTX ซีรีส์ 30 ที่มี VRAM 8GB ขึ้นไป (เบื้องหลังของมันคือ TensorRT-LLM และ RAG on Windows) ตอนนี้ยังรองรับเฉพาะบน Windows 10 และ 11 เท่านั้น

Tags:
Node Thumbnail

Jamin Ball นักวิเคราะห์จากบริษัท Altimeter Capital ประเมินว่าการลงทุนด้าน AI ของไมโครซอฟท์ ทำให้บริการ Microsoft Azure เติบโตขึ้นอย่างรวดเร็ว โดยมีรายได้เพิ่มขึ้น 30% ในไตรมาสล่าสุด และไล่กวดผู้นำตลาดอย่าง AWS มาอย่างรวดเร็ว (AWS เติบโตเพียง 13% ในไตรมาสเดียวกัน)

Ball ประเมินว่าเมื่อ 5 ปีก่อน ขนาดรายได้จากบริการโครงสร้างพื้นฐาน (infrastructure) ของ Azure มีเพียงครึ่งหนึ่งของ AWS แต่ตอนนี้คิดเป็น 3/4 ของ AWS แล้ว

Satya Nadella เปิดเผยในงานแถลงผลประกอบการไตรมาสล่าสุดว่า Azure มีลูกค้า 53,000 องค์กรที่ใช้บริการด้าน AI

Tags:
Node Thumbnail

Reuters รายงานว่า NVIDIA ได้ตั้งฝ่ายธุรกิจใหม่ในบริษัท เพื่อโฟกัสที่การออกแบบชิป ตามแบบที่ลูกค้ากลุ่มผู้ให้บริการคลาวด์กำหนดมา เน้นไปที่ชิปสำหรับการประมวลผล AI ขั้นสูง

ที่ผ่านมาชิปประมวลผล AI ของ NVIDIA อย่าง H100 เป็นสินค้าที่ลูกค้าซึ่งเป็นบริษัทผู้ให้บริการด้าน AI และคลาวด์ ต่างใช้งานกันแพร่หลาย อย่างไรก็ตามบริษัทเหล่านี้ก็มีรายงานมาอยู่ตลอด ว่าได้ออกแบบและพัฒนาชิปใช้งานเองภายในด้วยเช่นกัน ซึ่งเหตุผลหลักคือเพื่อรองรับงานเฉพาะอย่างที่กำหนด และต้องการควบคุมการใช้พลังงานให้ดีขึ้น ข่าวนี้จึงบอกได้ว่า NVIDIA ก็ต้องการเข้ามาสู่พื้นที่นี้ และเป็นตัวเลือกของบริษัทคลาวด์นั่นเอง

Tags:
Node Thumbnail

Sundar Pichai ซีอีโอกูเกิลให้สัมภาษณ์กับ Wired เนื่องในโอกาสเปิดตัว Gemini Advanced ซึ่งเป็นโมเดลปัญญาประดิษฐ์ที่เก่งที่สุดของกูเกิลในตอนนี้

Pichai บอกว่าจุดเด่นที่สุดของ Gemini คือความเป็น multimodal หรือการเทรนด้วยข้อมูลหลากหลายประเภท เช่น ข้อความ รูปภาพ เสียง โค้ดโปรแกรม ทำให้ Gemini รองรับอินพุตหลากหลายตั้งแต่ต้น มนุษย์สามารถสั่งงาน Gemini ได้ผ่านข้อความ เสียง หรือรูปภาพ แบบไม่ต้องแปลงฟอร์แมตก่อน ตรงนี้เป็นสิ่งที่ Gemini แตกต่างจากคู่แข่งฝั่ง OpenAI/Microsoft ที่โมเดลแต่ละตัวทำงานแยกจากกัน

Tags:
Node Thumbnail

หลังจากกูเกิลเริ่มปล่อยโมเดล Gemini Ultra ให้ใช้งานกันเมื่อคืนนี้ ก็เริ่มมีการเปรียบเทียบกับโมเดลอื่นในท้องตลาด โดยเฉพาะ GPT-4 ที่ยังเป็นผู้นำตลาดอยู่ในตอนนี้

Ethan Mollick อาจารย์ที่ Wharton School of the University of Pennsylvania ซึ่งมีโอกาสได้ลองใช้งาน Gemini Ultra ก่อนคนทั่วไปมาราวหนึ่งเดือน ได้โพสต์แสดงความเห็นในฐานะคนที่ลองใช้งานมาแล้วอย่างจริงจัง ระบุว่า โมเดล Gemini Ultra (ให้บริการภายใต้ชื่อ Gemini Advanced) ถือเป็นโมเดลระดับเดียวกับ GPT-4 อย่างชัดเจน ทำให้ตอนนี้วงการ AI มีโมเดลชั้นนำ 2 ตัว จากเดิมที่มีแค่ GPT-4 ตัวเดียว

Tags:
Node Thumbnail

กสทช. สหรัฐฯ หรือ FCC ออกประกาศระบุว่าการโทรหาลูกค้าเพื่อเสนอสินค้าหรือบริการ (robocall) โดยใช้เสียงที่สร้างจากปัญญาประดิษฐ์เป็นการกระทำที่ผิดกฎหมายในตัวเองทันที

ประกาศของ FCC ระบุว่าเดิมผู้ใช้เสียง AI ก็มักเป็นกลุ่มคนร้ายที่ล่อลวงเหยื่อโดยอาศัยเสียงคนดัง หรือเสียงของญาติพี่น้องของเหยื่ออยู่แล้ว แต่ประกาศนี้จะทำให้การใช้เสียง AI นั้นเป็นการกระทำผิดกฎหมายในตัวเอง ไม่ต้องไปพิสูจน์ความผิดว่าเป็นการหลอกลวงหรือไม่

แม้การเอาผิดกับคนร้ายที่หลอกลวงเหยื่อโดยตรงจะทำได้ยาก แต่การออกประกาศนี้ก็จะเปิดทางให้ FCC ประกาศแบนเครือข่ายโทรศัพท์ที่คนร้ายใช้เสียง AI โทรเข้าไปยังหมายเลขในสหรัฐฯ ได้ต่อไป

ที่มา - FCC

Tags:
Node Thumbnail

กูเกิลปล่อย Gemini Ultra 1.0 โมเดลรุ่นใหญ่ที่สุดในตระกูล Gemini ที่กูเกิลระบุว่าคะแนนทดสอบสูงกว่า GPT-4 โดยเปิดบริการ Gemini Advanced ให้ผู้ใช้ Google One แพ็กเกจระดับ AI Premium ที่มาพร้อมพื้นที่เก็บข้อมูล 2TB ราคาเดือนละ 750 บาท พร้อมช่วงทดสอบฟรีสองเดือน

ราคานี้ใกล้เคียงกับ Copilot Pro ของไมโครซอฟท์ที่เปิดให้ผู้ใช้ทั่วไปซื้อแพ็กเกจ GPT-4 ใช้งาน แต่ถูกกว่า Copilot for Microsoft 365 สำหรับลูกค้าองค์กรที่ราคา 30 ดอลลาร์ต่อเดือน

Tags:
Node Thumbnail

ETS ผู้ให้บริการทดสอบวัดระดับภาษาอังกฤษ TOEFL ประกาศเพิ่มบริการใหม่ชื่อว่า TestReady ซึ่งเป็นเครื่องมือสำหรับฝึกฝนเตรียมการสอบ ที่ระบุว่านำ AI มาช่วยปรับแต่ง แนะนำเนื้อหา ให้เหมาะกับผู้เรียนแต่ละคน โดยมีเป้าหมายให้ทำคะแนนสอบได้สูงที่สุด

TestReady ออกแบบมาสำหรับการสอบ TOEFL แบบ iBT โดยมีฟังก์ชันพื้นฐานให้ใช้งานได้ฟรี เช่น กิจกรรมทดสอบวัดผลรายวัน, ออกแบบตารางวางแผนเตรียมตัวสำหรับการสอบ และมีฟังก์ชันที่ต้องจ่ายเงินเพื่อใช้งาน เช่น ระบบทดสอบให้คะแนน และให้ Insight ของผลการทดสอบ, ระบบฝึกฝนแบบทดสอบการพูด ที่ให้ผลลัพธ์และคำแนะนำทันที รวมทั้งการให้ความเห็นเจาะจงสำหรับแต่ละคน

Tags:
Node Thumbnail

ไมโครซอฟท์ปรับหน้าตาของ Copilot เวอร์ชันเว็บ และมือถือ Android/iOS เล็กน้อย โดยเพิ่ม carousel หรือแถบเลื่อนแสดงภาพด้วย AI เพื่อเป็นไอเดียในการคุยกับบ็อท นอกจากนี้ยังเพิ่มฟีเจอร์การสั่งปรับแต่งภาพที่สร้างได้จากหน้าแชท Copilot โดยตรง

อัพเดตนี้ถือเป็นโอกาสครบรอบ 1 ปีของ Copilot (นับจากตอนแรกที่ใช้ชื่อ Bing Chat ก่อนรีแบรนด์มาเป็น Copilot เมื่อเดือนพฤศจิกายน 2023) ไมโครซอฟท์เปิดเผยสถิติว่ารอบปีที่ผ่านมา มีการแชทคุยกัน 5 พันล้านครั้ง และการสร้างภาพด้วยปัญญาประดิษฐ์ 5 พันล้านภาพ อีกทั้งยังช่วยให้ส่วนแบ่งตลาดของ Edge/Bing เพื่อขึ้นอย่างยั่งยืนด้วย

Tags:
Node Thumbnail

แอปเปิลเผยแพร่งานวิจัยด้าน AI ต่อสาธารณะ โดยเป็นโมเดลโอเพนซอร์ส ที่สามารถแก้ไขรูปภาพได้ตามคำสั่งภาษาธรรมชาติ (Natural Language) ซึ่งพัฒนาและวิจัยโดยทีมวิจัยของแอปเปิล ร่วมกับทีมนักวิจัยจาก University of California, Santa Barbara

โมเดล AI ตัวนี้มีชื่อว่า "MGIE" ย่อมาจาก MLLM-Guided Image Editing โดยนำโมเดลข้อมูลผสมผสานภาษาขนาดใหญ่ มาต่อยอดให้รับคำสั่งเพื่อแก้ไขรูปภาพในหลายแบบ ทั้งระดับเล็กที่พิกเซล จนถึงการแก้ไขภาพรวม

Tags:
Node Thumbnail

OpenAI ประกาศฝัง metadata ลงในภาพที่สร้างด้วย Dall-E 3 เพื่อระบุว่าเป็นภาพที่สร้างด้วย AI

ข้อมูล metadata ที่ฝังลงในภาพเป็นมาตรฐานกลาง C2PA แบบเดียวกับที่ใช้ในวงการภาพถ่าย ผู้ใช้สามารถนำภาพไปเช็คกับเว็บ Content Credentials ย้อนกลับได้ว่าเป็นภาพที่สร้างด้วย Dall-E หรือไม่ ส่วนบริษัทอย่าง Meta ก็ประกาศว่าจะอ่านค่า metadata ชุดนี้แล้วนำไปแปะป้ายบอกว่าเป็นภาพจาก AI เช่นกัน

Tags:
Node Thumbnail

Meta ประกาศแนวทางขึ้นป้ายกำกับ (label) บอกว่าภาพที่โพสต์ในระบบ Facebook, Instagram, Threads สร้างด้วย AI เพื่อป้องกันไม่ให้เกิดความเข้าใจผิด ป้ายกำกับนี้จะเริ่มใช้งานในอีกไม่กี่เดือนข้างหน้า (coming months)

Tags:
Node Thumbnail

Roblox เปิดตัวโมเดล AI ปรับแต่งที่รองรับการแปลข้อความในแชทภาษาต่าง ๆ แบบเรียลไทม์ โดยมีเป้าหมายให้การสนทนาลื่นไหลแบบที่ผู้เล่นไม่ทราบด้วยว่าคู่สนทนาจริง ๆ แชทมาด้วยภาษาอะไร

AI แปลภาษาใน Roblox รองรับการแปลทั้ง 16 ภาษา ซึ่งรวมทั้งภาษาไทยด้วย ส่วนภาษาอื่นเช่น ภาษาอังกฤษ ภาษาสเปน ภาษาฝรั่งเศส ภาษาเยอรมนี ภาษาอินโดนีเซีย ภาษาจีนทั้ง Simplified และ Traditional ภาษาญี่ปุ่น ภาษาเกาหลี ภาษาเวียดนาม ฯลฯ

Tags:
Node Thumbnail

ChatDB ปล่อยโมเดลปัญญาประดิษฐ์ Natural-SQL-7B โมเดลสำหรับเขียน SQL ตามคำสั่ง โดยชูจุดเด่นที่โมเดลมีขนาดเล็กมาก เพียง 7 พันล้านพารามิเตอร์แต่ได้ผลลัพธ์ค่อนข้างดี เหนือกว่า GPT-3.5 เสียอีก

คะแนนทดสอบ SQL-Eval ที่อาศัยการทดสอบคิวรีจริงด้วย PostgreSQL และ Snowflake ได้คะแนน 76.5% เป็นรอง SQLCoder-15B ที่ได้ 78% และ GPT-4 ที่ได้ 83%

ตัวโมเดลเปิดให้ใช้งานได้ฟรีแต่บังคับต้องเปิดเผยโมเดลที่ถูกดัดแปลงแบบเดียวกับ Creative Commons BY-SA 4.0 แต่เพิ่มเงื่อนไขจำกัดประเภทธุรกิจที่ใช้งานได้ทำให้ไม่เป็นโอเพนซอร์ส

ที่มา - HuggingFace: ChatDB/Natural-SQL-7B

Tags:
Node Thumbnail

Hugging Face แพลตฟอร์มด้าน AI ชื่อดัง เคยเปิดตัวบริการแช็ทบ็อท HuggingChat แบบเดียวกับ ChatGPT แต่เป็นโอเพนซอร์ส ไปก่อนแล้ว

ล่าสุด Hugging Face เปิดตัวบริการเสริมชื่อ HuggingChat Assistant สำหรับปรับแต่งแช็ทบ็อทให้มีความสามารถเฉพาะทาง แบบเดียวกับ GPT Builder และ GPT Store ของค่าย OpenAI แต่มีจุดต่างสำคัญคือเป็นโอเพนซอร์ส และใช้งานได้ฟรี (ค่าย OpenAI ต้องสมัคร ChatGPT Plus ราคา 20 ดอลลาร์ต่อเดือน)

Tags:
Node Thumbnail

กูเกิลเปิดตัวเครื่องมือสร้างภาพด้วย AI ตามคำสั่ง ใช้ชื่อว่า ImageFX โดยใช้โมเดล Imagen 2 ที่เปิดตัวในช่วงปลายปี 2023

ในแง่ความสามารถ ImageFX คงไม่ต่างอะไรจากการเรียกโมเดล Imagen 2 จาก Google Cloud มาสร้างภาพโดยตรง แค่เปลี่ยนจากการเรียกผ่าน API มาเรียกผ่านช่องทางหน้าบ้านที่กูเกิลสร้างให้เท่านั้น

ลูกเล่นเล็กๆ ของ ImageFX คือการเตรียมสไตล์ภาพที่ใช้บ่อยๆ ไว้เป็นเมนูให้เลือก ไม่ต้องพิมพ์คำสั่ง prompt เองทั้งหมด กูเกิลเรียกฟีเจอร์นี้ว่า expressive chips ช่วยให้เราทดลองไอเดียสร้างภาพได้รวดเร็วกว่าเดิม

Pages