Image

Large Language Model

By arjin Writer on Tag: Acrobat, Adobe, Artificial Intelligence, LLM, PDF
Acrobat

Adobe เปิดตัว AI Assistant ที่ตอนนี้มีสถานะเบต้า โดยเป็น Generative AI สำหรับไฟล์ PDF ในสองโปรแกรมของ Adobe คือ Reader และ Acrobat รองรับการสรุปเนื้อหา, ตอบคำถาม และจัดฟอร์แมตสำหรับใช้ส่งอีเมล ทำรายงาน หรือการนำเสนอ

Adobe บอกว่าความสามารถของ AI Assistant จะช่วยปลดล็อกคุณค่าของข้อมูลในเอกสาร PDF ที่มีประมาณ 3 ล้านล้านชุดในโลก

AI Assistant ทำงานบน AI และ Machine Learning บนพื้นฐานเดียวกับ Acrobat Liquid Mode ฟีเจอร์ที่ใช้ปรับปรุงการแสดงผลของเอกสาร PDF ให้เหมาะกับการอ่านบนหน้าจอมือถือ

By lew Founder on Tag: Gemini, LLM, Python, Programming
Gemini

กูเกิลอัพเดตบริการ Gemini Advanced (ที่ตอนนี้น่าจะยังอยู่ในช่วงทดสอบฟรีกันทุกคน) ให้สามารถรันโค้ดภาษา Python ได้ในเว็บ เป็นฟีเจอร์สำหรับผู้ใช้ที่สมัครแพ็กเกจจ่ายเงินเท่านั้น

แนวทางนี้ทำให้ผู้ใช้สามารถกดรันโค้ดและดูผลลัพธ์ได้ทันที โดยเมื่อผู้ใช้กดรันโค้ดบนหน้าเว็บแล้วเว็บ Gemini จะส่งโค้ดไปรันบนเซิร์ฟเวอร์เพื่อแสดงผล โดยตัว Gemini นั้นไม่ได้อ่านผลการรันด้วยตัวเองแต่อย่างใด ทำให้บางคำถาม ตัว Gemini จะตอบผลที่ผิดแม้จะเขียนโค้ดถูกและเมื่อรันโค้ดแล้วได้ผลลัพธ์ที่ถูกต้องก็ตาม

By arjin Writer on Tag: Gemini, Google, LLM, Artificial Intelligence, Google Workspace, Enterprise
Gemini

Dylan Roussel นักแกะฟีเจอร์ใหม่ Android โพสต์ข้อมูลที่เขาพบในบัญชี X เกี่ยวกับฟีเจอร์ใหม่ที่เตรียมประกาศของ Gemini สำหรับลูกค้า Google Workspace เพื่อนำ Gemini มาใช้ภายในองค์กร ที่ต้องการความสามารถปกป้องข้อมูลเพิ่มเติม

By lew Founder on Tag: Groq, LLM, Artificial Intelligence, Processor
Groq

Groq สตาร์ตอัพผู้พัฒนาชิป GroqChip 1 สำหรับการรันโมเดลปัญญาประดิษฐ์ LLM และผู้ให้บริการ LLM แบบคลาวด์ระบุถึงผลทดสอบของ ArtificialAnalysis.ai ที่แสดงให้เห็นว่า Groq เป็นผู้ให้บริการที่สามารถประมวลผล LLM ได้เร็วที่สุดในตลาด

By lew Founder on Tag: LLM, Artificial Intelligence
LLM

Ollama ซอฟต์แวร์รันโมเดล LLM สำหรับรันบนพีซีออกเวอร์ชั่น 0.1.25 ความเปลี่ยนแปลงสำคัญคือการรองรับวินโดวส์เป็นเวอร์ชั่นแรก

ตอนนี้เวอร์ชั่นวินโดวส์ยังอยู่ในสถานะพรีวิวแต่ก็สามารถใช้งานทั้งการเร่งความเร็วด้วยชิปกราฟิกหรือซีพียู และสามารถใช้งานโมเดลได้ทุกตัวในไลบรารี

เมื่อติดตั้งและรันโมเดลแล้ว ตัว Ollama จะรันที่พอร์ต 11434 รอรับ REST API โดยเวอร์ชั่นก่อนหน้านี้ Ollama เพิ่งรองรับ API แบบ OpenAI ไป ในเวอร์ชั่นนี้ก็ได้ฟีเจอร์นี้ด้วย

ที่มา - Ollama

By arjin Writer on Tag: Meta, Artificial Intelligence, LLM
Meta

อาจเรียกได้ว่าเป็นวันของการปล่อยของด้าน AI นอกจาก Gemini 1.5 Pro จากกูเกิล และ Sora จาก OpenAI แล้ว Meta ก็เปิดตัว V-JEPA สถาปัตยกรรมตัวใหม่ของระบบการเรียนรู้ตนเอง สำหรับการพัฒนา AI ขั้นสูง

โดย V-JEPA ซึ่งย่อมาจากคำว่า Video Joint Embedding Predictive Architecture พัฒนาโดยทีม AI ของ Meta ที่นำโดย Yann LeCun ต้องการสร้างโมเดลเรียนรู้ของ AI ขั้นสูง เพื่อให้รองรับการทำความเข้าใจทุกอย่างในโลกได้ดียิ่งขึ้น โดยมีหลักคิดว่ามนุษย์เราเริ่มเรียนรู้สิ่งใหม่จากการดูและสังเกต โดยไม่จำเป็นต้องอ่านหนังสือจำนวนมากเพื่อจะเข้าใจทุกเรื่อง V-JEPA จึงออกแบบมาให้เรียนรู้และเข้าใจโลกในวิธีเดียวกับที่คนเรียนรู้ ประยุกต์ และคิดต่อยอด ในการแก้ปัญหาต่าง ๆ

By arjin Writer on Tag: Gemini, Google, LLM, Artificial Intelligence, Google Cloud, Developer
Gemini

นอกจากเปิดตัว Gemini 1.5 Pro แล้ว กูเกิลยังประกาศว่าโมเดล AI ทั้ง Gemini 1.0 Pro และ Gemini 1.0 Ultra ที่เปิดตัวเมื่อสัปดาห์ที่แล้ว ตอนนี้เปิดให้นักพัฒนาสามารถใช้งานได้แล้วผ่าน Vertex AI

โดย Gemini 1.0 Pro สามารถใช้งานได้แล้วสำหรับลูกค้า Vertex AI ทุกคน ส่วน Gemini 1.0 Ultra โมเดลรุ่นใหญ่ที่สุดในตระกูล Gemini ที่กูเกิลบอกว่าคะแนนทดสอบสูงกว่า GPT-4 ตอนนี้เปิดให้ใช้งานสำหรับลูกค้า Vertex AI ที่อยู่ใน allowlist

By arjin Writer on Tag: OpenAI, Artificial Intelligence, Video, LLM, Sora
OpenAI

OpenAI เปิดตัวโมเดลใหม่ สำหรับสร้างวิดีโอด้วย AI จากข้อความ (Text-to-Video) มีชื่อว่า Sora จุดเด่นคือสามารถสร้างวิดีโอความยาวถึง 1 นาที ที่มีความละเอียดสูง และลงรายละเอียดในวิดีโอได้ตาม prompt ของผู้ใช้งาน

Sora มีความสามารถสร้างวิดีโอที่มีฉากหลังรายละเอียดซับซ้อน มีตัวละครอยู่ในวิดีโอหลายคน ระบุรูปแบบการเคลื่อนไหวได้ รวมถึงลงรายละเอียดปลีกย่อยได้ ซึ่งจุดเด่นที่ Sora มีคือการแสดงผลแบบเป็นไปตามสภาพจริงที่ปรากฏอยู่

By mk Founder on Tag: Gemini, Google, LLM, Artificial Intelligence
Gemini

กูเกิลเพิ่งเปิดตัว Gemini Ultra ไปหมาดๆ วันนี้ปล่อยของต่อเนื่องด้วยโมเดลเวอร์ชันอัพเดต Gemini 1.5 Pro ซึ่งเป็นการอัพเกรดโมเดลระดับกลาง (Pro) ที่มีความสามารถระดับเดียวกับ Gemini 1.0 Ultra แต่ใช้พลังประมวลผลน้อยกว่า

ฟีเจอร์เด่นของ Gemini 1.5 Pro ที่น่าสนใจคือการรองรับอินพุตขนาดใหญ่ถึง 1 ล้านโทเคน ซึ่งถือว่ามากที่สุดในบรรดาโมเดลภาษาขนาดใหญ่ทุกวันนี้ (Anthropic Claude 2.1 รองรับ 2 แสนโทเคน) เปิดโอกาสให้ใช้งานโมเดล LLM กับงานที่หลากหลายขึ้นอีกมาก กูเกิลเทียบให้เห็นภาพว่าเท่ากับคลิปเสียงยาว 11 ชั่วโมง, วิดีโอ 1 ชั่วโมง, เอกสาร 700,000 คำ, โค้ด 30,000 บรรทัด

By arjin Writer on Tag: Stability AI, Artificial Intelligence, LLM
Stability AI

Stability AI เปิดตัวโมเดลสร้างรูปภาพจากข้อความ Stable Cascade ที่สถานะตอนนี้ยังเป็นงานวิจัย สามารถนำไปใช้งานได้ในงานที่ไม่ใช่เชิงพาณิชย์ สามารถดูรายละเอียดเพิ่มเติมได้ที่ GitHub

By arjin Writer on Tag: Apple, Artificial Intelligence, LLM, Animation
Apple

แอปเปิลเผยแพร่งานวิจัยด้าน AI ตัวล่าสุด ซึ่งอาจทำให้เห็นทิศทางฟีเจอร์ใหม่ ๆ ในสินค้าแอปเปิล โดยคราวนี้เป็นเครื่องมือชื่อว่า Keyframer ที่มีความสามารถสร้างอนิเมชันเคลื่อนไหว จากภาพนิ่งตั้งต้น 2 มิติ โดยใช้โมเดลภาษาขนาดใหญ่ (LLM) ช่วยป้อนคำสั่งที่ต้องการ

ในงานวิจัยนี้ อินพุทของรูปภาพต้องเป็นไฟล์ภาพ SVG แล้วป้อน prompt สิ่งที่ต้องการให้ในภาพมีการเคลื่อนไหว จากนั้น Keyframer จะสร้างโค้ด CSS เพื่อปรับวัตถุในภาพแต่ละส่วนให้เป็นไปตาม prompt ที่ระบุ

By lew Founder on Tag: Canada, LLM, Chat Bot, Airline
Canada

Civil Resolution Tribunal หรือคณะอนุญาโตตุลาการแคนาดาตัดสินใจให้สายการบินแคนาดาต้องรับผิดชอบค่าเสียหาย เนื่องจากแชตบอตบนหน้าเว็บของสายการบินเองตอบข้อมูลผิดพลาด

คดีนี้เกิดขึ้นหลัง Jake Moffatt เดินทางโดยสายการบินแคนาดาเพื่อไปงานศพยายของเขา แต่ Moffatt ซื้อตั๋วราคาเต็มแม้สายการบินจะมีตั๋วราคาพิเศษสำหรับการเดินทางไปร่วมงานศพ หลังจากนั้น Moffatt ได้สอบถามกับแชตบอตบนหน้าเว็บของสายการบินว่าสามารถขอคืนเงินส่วนต่างได้หรือไม่และแชตบอตยืนยันว่าทำเอกสารย้อนหลังได้ภายใน 90 วันหลังการเดินทาง

By mk Founder on Tag: Gemini, Sundar Pichai, Google, Artificial Intelligence, LLM
Gemini

Sundar Pichai ซีอีโอกูเกิลให้สัมภาษณ์กับ Wired เนื่องในโอกาสเปิดตัว Gemini Advanced ซึ่งเป็นโมเดลปัญญาประดิษฐ์ที่เก่งที่สุดของกูเกิลในตอนนี้

Pichai บอกว่าจุดเด่นที่สุดของ Gemini คือความเป็น multimodal หรือการเทรนด้วยข้อมูลหลากหลายประเภท เช่น ข้อความ รูปภาพ เสียง โค้ดโปรแกรม ทำให้ Gemini รองรับอินพุตหลากหลายตั้งแต่ต้น มนุษย์สามารถสั่งงาน Gemini ได้ผ่านข้อความ เสียง หรือรูปภาพ แบบไม่ต้องแปลงฟอร์แมตก่อน ตรงนี้เป็นสิ่งที่ Gemini แตกต่างจากคู่แข่งฝั่ง OpenAI/Microsoft ที่โมเดลแต่ละตัวทำงานแยกจากกัน

By mk Founder on Tag: Gemini, LLM, OpenAI, Artificial Intelligence, Google
Gemini

หลังจากกูเกิลเริ่มปล่อยโมเดล Gemini Ultra ให้ใช้งานกันเมื่อคืนนี้ ก็เริ่มมีการเปรียบเทียบกับโมเดลอื่นในท้องตลาด โดยเฉพาะ GPT-4 ที่ยังเป็นผู้นำตลาดอยู่ในตอนนี้

By lew Founder on Tag: Gemini, Google, LLM, Bard
Gemini

กูเกิลรวมบริการด้าน LLM ที่เคยมีหลายชื่อ เช่น Bard, Duet AI เข้าเป็นชื่อ Gemini พร้อมกับปล่อยแอป Gemini เฉพาะบนแอนดรอยด์ และใส่ฟีเจอร์ Gemini ในแอป Google บน iOS

บริการ LLM บน Google Workspace จะเปลี่ยนชื่อเป็น Gemini for Workspace, บริการ Duet AI ใน Google Cloud จะเปลี่ยนชื่อเป็น Gemini เช่นเดียวกับบริการ Bard ก็เปลี่ยนชื่อเป็น Gemini เช่นกัน

By lew Founder on Tag: Gemini, Google, LLM, Artificial Intelligence, Google One
Gemini

กูเกิลปล่อย Gemini Ultra 1.0 โมเดลรุ่นใหญ่ที่สุดในตระกูล Gemini ที่กูเกิลระบุว่าคะแนนทดสอบสูงกว่า GPT-4 โดยเปิดบริการ Gemini Advanced ให้ผู้ใช้ Google One แพ็กเกจระดับ AI Premium ที่มาพร้อมพื้นที่เก็บข้อมูล 2TB ราคาเดือนละ 750 บาท พร้อมช่วงทดสอบฟรีสองเดือน

By arjin Writer on Tag: Apple, Artificial Intelligence, LLM, Image Editing
Apple

แอปเปิลเผยแพร่งานวิจัยด้าน AI ต่อสาธารณะ โดยเป็นโมเดลโอเพนซอร์ส ที่สามารถแก้ไขรูปภาพได้ตามคำสั่งภาษาธรรมชาติ (Natural Language) ซึ่งพัฒนาและวิจัยโดยทีมวิจัยของแอปเปิล ร่วมกับทีมนักวิจัยจาก University of California, Santa Barbara

โมเดล AI ตัวนี้มีชื่อว่า "MGIE" ย่อมาจาก MLLM-Guided Image Editing โดยนำโมเดลข้อมูลผสมผสานภาษาขนาดใหญ่ มาต่อยอดให้รับคำสั่งเพื่อแก้ไขรูปภาพในหลายแบบ ทั้งระดับเล็กที่พิกเซล จนถึงการแก้ไขภาพรวม

By arjin Writer on Tag: Roblox, Artificial Intelligence, Translation, LLM, Games
Roblox

Roblox เปิดตัวโมเดล AI ปรับแต่งที่รองรับการแปลข้อความในแชทภาษาต่าง ๆ แบบเรียลไทม์ โดยมีเป้าหมายให้การสนทนาลื่นไหลแบบที่ผู้เล่นไม่ทราบด้วยว่าคู่สนทนาจริง ๆ แชทมาด้วยภาษาอะไร

AI แปลภาษาใน Roblox รองรับการแปลทั้ง 16 ภาษา ซึ่งรวมทั้งภาษาไทยด้วย ส่วนภาษาอื่นเช่น ภาษาอังกฤษ ภาษาสเปน ภาษาฝรั่งเศส ภาษาเยอรมนี ภาษาอินโดนีเซีย ภาษาจีนทั้ง Simplified และ Traditional ภาษาญี่ปุ่น ภาษาเกาหลี ภาษาเวียดนาม ฯลฯ

By lew Founder on Tag: LLM, Artificial Intelligence
LLM

ChatDB ปล่อยโมเดลปัญญาประดิษฐ์ Natural-SQL-7B โมเดลสำหรับเขียน SQL ตามคำสั่ง โดยชูจุดเด่นที่โมเดลมีขนาดเล็กมาก เพียง 7 พันล้านพารามิเตอร์แต่ได้ผลลัพธ์ค่อนข้างดี เหนือกว่า GPT-3.5 เสียอีก

คะแนนทดสอบ SQL-Eval ที่อาศัยการทดสอบคิวรีจริงด้วย PostgreSQL และ Snowflake ได้คะแนน 76.5% เป็นรอง SQLCoder-15B ที่ได้ 78% และ GPT-4 ที่ได้ 83%

ตัวโมเดลเปิดให้ใช้งานได้ฟรีแต่บังคับต้องเปิดเผยโมเดลที่ถูกดัดแปลงแบบเดียวกับ Creative Commons BY-SA 4.0 แต่เพิ่มเงื่อนไขจำกัดประเภทธุรกิจที่ใช้งานได้ทำให้ไม่เป็นโอเพนซอร์ส

By arjin Writer on Tag: Amazon, Artificial Intelligence, E-commerce, Chatbot, LLM
Amazon

Amazon เปิดตัว Rufus แชทบอตผู้ช่วยพลัง Generative AI ที่ช่วยให้การเลือกค้นหาสินค้าทำได้ผ่านการสนทนาโต้ตอบอัตโนมัติ

ถ้าอธิบายการทำงาน Rufus ก็อาจสรุปได้ว่าเป็นแชทบอตสไตล์ ChatGPT ที่เชี่ยวชาญรายการสินค้าที่มีทั้งหมดใน Amazon รวมทั้งแนะนำให้ข้อมูลต่าง ๆ ได้ ข้อดีของ Rufus คือช่วยฟิลเตอร์สินค้า เจาะจงรายละเอียดได้มากเท่าที่ลูกค้าต้องการระบุ มากกว่าวิธีกรองสินค้าแบบเดิมนั่นเอง

Rufus เริ่มทดสอบวันนี้ในสถานะเบต้าบนแอป Amazon ในมือถือ เริ่มทดลองกับลูกค้ากลุ่มเล็กก่อน และจะขยายออกไปยังลูกค้าทุกคนในสหรัฐอเมริกาต่อไป

Subscribe to LLM