Tags:
Node Thumbnail

นักวิจัยของแอปเปิลเผยแพร่งานวิจัยของ MM1 ซึ่งเกี่ยวกับกระบวนการเทรนข้อมูลแบบผสมผสาน ว่าการเทรนข้อมูลแต่ละรูปแบบที่ต่างกัน ตลอดจนโครงสร้างโมเดล ส่งผลต่อประสิทธิภาพในการทดสอบ AI นั้นอย่างไร

ส่วนหนึ่งของงานวิจัยนี้พบว่าตัวเลือกวิธีเข้ารหัสรูปภาพ และความละเอียดของภาพที่ใช้เทรน มีผลกระทบมากต่อประสิทธิภาพของโมเดล มากกว่าการออกแบบส่วนเชื่อมต่อต่าง ๆ ของข้อมูล นอกจากนี้ยังพบโมเดลขนาด 30 พันล้านพารามิเตอร์ ตัวหนึ่งของ MM1 มีความสามารถในการเรียนรู้จากบริบทข้อมูลดีที่สุด รองรับการ prompt ที่ต่อเนื่องไปเรื่อย ๆ ได้

Tags:
Node Thumbnail

คณะนักวิจัยจาก University of Shanghai for Science and Technology ในประเทศจีน พัฒนาเทคนิคการเก็บข้อมูลในแผ่นดิสก์แบบแสง (optical disc) ที่มีความจุสูงถึง 100TB ต่อด้าน

เทคนิคแบบใหม่ใช้สถาปัตยกรรมที่เรียกว่า 3D planar recording เป็นฟิล์มโปร่งใส สามารถเก็บข้อมูลได้ถึง 100 เลเยอร์ต่อด้าน (Blu-ray ในปัจจุบันได้ 4 เลเยอร์) รวมแล้ว 0.8 petabits หรือ 100 terabytes ต่อข้าง

Tags:
Node Thumbnail

ทีมวิจัยจากสถาบัน Human-Centered Artificial Intelligence (HAI) ของมหาวิทยาลัยสแตนฟอร์ด รายงานถึงผลทดสอบการใช้งานปัญญาประดิษฐ์ในกลุ่ม LLM ว่าแม้จะมีข่าวว่า LLM สามารถวินิจฉัยโรคได้อย่างน่าทึ่งแต่ก็มีความผิดพลาดสูง ต้องระมัดระวัง

ทีมงานทดสอบการใช้งาน LLM โดยใช้โมเดล 4 ตัว ได้แก่ GPT-4, Claude 2.1, Mistral Medium, และ Gemini Pro เฉพาะ GPT-4 นั้นสร้างแอป retrieval augmented generation (RAG) ครอบอีกชั้นเพื่อทดสอบ โดยวัดว่าเวลาที่ LLM เหล่านี้ตอบคำถามแล้ว สามารถสร้างคำตอบโดยมีการอ้างอิงอย่างถูกต้องหรือไม่

Tags:
Node Thumbnail

ระบบภูมิคุ้มกันของมนุษย์มีความซับซ้อนอย่างมาก ข้อมูลที่เรามีเกี่ยวกับการทำงานและการตอบสนองของระบบภูมิคุ้มกันยังไม่เพียงพอและกระจัดกระจาย เริ่มต้นปีใหม่ 2024 นี้ทีมนักวิทยาศาสตร์และนักวิจัยที่นำโดย ดร. Hans Keirstead ผู้เชี่ยวชาญด้านสเต็มเซลล์ จึงได้ริเริ่มโครงการขนาดยักษ์ Human Immunome Project (HIP) เพื่อที่จะทำการทดลองเก็บตัวอย่างและรวบรวมข้อมูลเกี่ยวกับระบบภูมิคุ้มกันของมนุษย์ที่ละเอียดที่สุดและมีขนาดใหญ่ที่สุดเท่าที่เคยมีมา

Tags:
Node Thumbnail

ทีมวิจัยจาก Children’s Hospital of Philadelphia (CHOP) ประกาศความสำเร็จในการรักษาอาการหูหนวกในเด็กอายุ 11 ปี หลักจากเริ่มกระบวนการรักษาเมื่อเดือนตุลาคมที่ผ่านมา โดยตอนนี้อาการของคนไข้เหลือเพียงสูญเสียการได้ยินเล็กน้อยถึงปานกลาง คนไข้สามารถฟังเสียงพูดคุย, ได้ยินเสียงรถยนต์, หรือเสียงตัดผมของตัวเองได้

คนไข้รายนี้มีอาการหูหนวกแต่กำเนิดเนื่องจากยีน otoferlin (OTOF) กระบวนการรักษาอาศัยการผ่าตัดเข้าไปหูชั้นในรูปหอยโข่ง (cochlea) แล้วให้ยายีนบำบัด AK-OTOF เป็นการนำยีน OTOF ที่ปกติเข้าไปแทนยีนเดิมด้วยไวรัส (viral vector) เมื่อเซลล์ได้รับยีนนี้แล้วจะตอบสนองต่อเสียง และส่งสัญญาณประสาทตามที่ควรจะเป็น

Node Thumbnail

ไมโครซอฟท์ร่วมมือห้องวิจัยแห่งชาติ Pacific Northwest National Laboratory (PNNL) ใช้งาน AI ร่วมกับเครื่องมือ HPC ค้นหาวัสดุชนิดใหม่ที่มาใช้กับแบตเตอรี่

โครงการนี้เป็นการคัดกรองวัสดุอนินทรีย์ที่มีศักยภาพ มากกว่า 32 ล้านองค์ประกอบ และได้ค้นพบอิเล็กโทรไลต์แข็งชนิดใหม่สำหรับโซลูชันการจัดเก็บพลังงานที่ปลอดภัยกว่าอิเล็กโทรไลต์ที่เป็นของเหลว ซึ่งอาจลดการใช้ลิเทียมในแบตเตอรี่ได้มากถึง 70%

Tags:
Node Thumbnail

ทีมนักวิจัยจากวิทยาลัยสาธารณสุขแห่งฮาร์วาร์ด หรือ Harvard T.H. Chan School of Public Health ได้เผยแพร่งานวิจัยในวารสาร PLOS One เมื่อวันพุธที่ผ่านมา (27 ธันวาคม 2023) พบว่าโซเชียลมีเดียทำรายได้โฆษณาจากผู้ใช้เยาวชนในประเทศสหรัฐอเมริกาไปกว่า 1.1 หมื่นล้านเหรียญ

ที่มาของจำนวนรายได้ดังกล่าวมาจาก ทีมวิจัยประเมินจำนวนผู้ใช้โซเชียลมีเดียที่อายุต่ำกว่า 18 ปี ประกอบไปด้วยผู้ใช้ Facebook, Instagram, Snapchat, TikTok, Youtube และ X

Tags:
Node Thumbnail

Zotero โปรแกรมช่วยค้นงานวิจัยที่เปิดให้ใช้งานฟรีเปิดตัวแอปแอนดรอยด์แล้ว หลังจากปล่อยเวอร์ชั่น iOS มาตั้งแต่ปีที่แล้ว อย่างไรก็ดีการเปิดตัวครั้งนี้ยังเป็นการทดสอบวงปิดเท่านั้น และฟีเจอร์ยังไม่ครบถ้วนนัก

ฟีเจอร์หลักๆ เช่น การซิงก์ข้อมูลกับเซิร์ฟเวอร์ ทั้ง PDF, โน้ตต่างๆ นั้นสามารถใช้งานได้ครบ แต่ฟีเจอร์บางส่วน เช่น การเซฟไฟล์จากเบราว์เซอร์, เพิ่มข้อมูลผ่าน QR, การสร้าง citation, และการซิงก์ WebDAV นั้นยังใช้งานไม่ได้

ทางโครงการเปิดให้คนทั่วไปทดสอบได้ แต่เป็นการทดสอบจำกัด 1,000 คนเท่านั้น และทีมงานเตือนว่าโปรแกรมยังไม่เรียบร้อย อย่าใช้งานระหว่างทำงานสำคัญ หรืออยากใช้จริงๆ ก็สำรองข้อมูลให้เรียบร้อยก่อน

Tags:
Node Thumbnail

แอปเปิลเผยแพร่งานวิจัยสองฉบับผ่าน arXiv ซึ่งเป็นงานวิจัยเกี่ยวกับเทคนิคการประมวลผล AI ที่อาจถูกนำมาใช้งานกับผลิตภัณฑ์ของแอปเปิลได้ในอนาคต

งานวิจัยแรกชื่อว่า "LLM in a flash" เป็นวิธีการทำให้อุปกรณ์ซึ่งมีหน่วยความจำจำกัด เช่น สมาร์ทโฟน สามารถรันโมเดล AI LLM ที่มีพารามิเตอร์จำนวนมากได้ โดยใช้สองเทคนิคคือ windowing ใช้งานซ้ำ AI ที่ประมวลผลไปแล้วแทนที่จะต้องใช้ข้อมูลใหม่อีกรอบ และวิธี row-column bundling ใช้การอ่านข้อมูลเป็นส่วน ๆ แทนที่จะอ่านทีละคำ ซึ่งเหมาะสำหรับงาน LLM อยู่แล้ว ผลลัพธ์ที่ได้ทำให้สามารถรัน AI LLM ที่ต้องการหน่วยความจำได้สูงถึง 2 เท่า ของหน่วยความจำที่มีอยู่

Tags:
Node Thumbnail

Google DeepMind เปิดตัวปัญญาประดิษฐ์สาย deep learning ตัวใหม่ชื่อ Graph Networks for Materials Exploration (GNoME ไม่เกี่ยวอะไรกับเดสก์ท็อป GNOME) สร้างขึ้นมาเพื่อค้นพบ "คริสตัล" หรือโครงสร้างผลึกชนิดใหม่ๆ ที่เป็นไปได้ในเชิงวัสดุศาสตร์ (material)

การมองหาคริสตัลรูปแบบใหม่ๆ เกิดขึ้นมานานแล้ว การทดลองของมนุษย์สามารถค้นพบได้ราว 20,000 รูปแบบ ภายหลังเมื่อนำเทคนิคทางคอมพิวเตอร์เข้ามาช่วย (Materials Project) สามารถค้นหาได้ 48,000 รูปแบบ แต่ AI แบบเดิมก็มีข้อจำกัดเรื่องความแม่นยำอยู่พอสมควร

Tags:
Node Thumbnail

XTX Markets บริษัทเทรดหุ้นประกาศตั้งกองทุนรางวัล Artificial Intelligence Mathematical Olympiad Prize (AI-MO Prize) มอบเงิน 10 ล้านดอลลาร์ให้กับผู้ที่สร้างปัญญาประดิษฐ์ที่ชิงเหรียญทองโอลิมปิกวิชาการสาขาคณิตศาสตร์ได้สำเร็จ

ปัญญาประดิษฐ์ที่จะได้รางวัลต้องรับโจทย์รูปแบบเดียวกับผู้เข้าแข่งขันปกติ และส่งคำตอบเป็นข้อความที่อ่านโดยกรรมการตรวจข้อสอบตามเกณฑ์คณิตศาสตร์โอลิมปิกตามปกติ

รางวัล AI-MO ไม่ได้เป็นส่วนหนึ่งของคณิตศาสตร์โอลิมปิกโดยตรง แต่จะร่วมมือกับผู้จัดการแข่งขันแต่ละรอบ โดยการแข่งครั้งแรกที่จะชิงรางวัลนี้คือการแข่งที่เมือง Bath ในอังกฤษ กลางปี 2024 นี้

ที่มา - AI-MO Prize

Tags:
Topics: 
Node Thumbnail

Hiroki Takizawa จากบริษัท Preferred Networks เขียนรายงานวิจัยระบุว่าเขาสามารถแก้เกม Othello เกมกระดานยอดนิยมได้สำเร็จ แม้จะเป็นความสำเร็จอย่างอ่อน (weakly solved) เท่านั้น

Othello มีความเป็นไปได้ 1058 รูปแบบ ซึ่งยังคงมากเกินกว่าที่จะคำนวณความเป็นไปได้ทั้งหมด Takizawa คำนวณรูปแบบทั้งหมดที่เป็นไปได้ในกรณีที่มีตาเดินเหลือ 36 ตาด้วยซูเปอร์คอมพิวเตอร์ของบริษัท จากนั้นพยายามต้นหาความเป็นไปได้ทั้งหมดในกรณีที่ตารางเหลือ 50 ตาเดินด้วยการเขียนสคริปต์จำลองตัวเองเป็นผู้เล่นที่เก่งและพยายามหาทางที่ตัวเองชนะเท่านั้นโดยหาปลายทางที่ดีที่สุด

Tags:
Node Thumbnail

รัฐบาลสหราชอาณาจักร เป็นเจ้าภาพจัดงานประชุม AI Safety Summit ครั้งแรก เมื่อวันที่ 1-2 พฤศจิกายน 2023 ที่ผ่านมา มีตัวแทนจากรัฐบาล 28 ประเทศเข้าร่วม (ไม่มีไทย) และลงนามในข้อตกลง The Bletchley Declaration ว่าจะพัฒนาเทคโนโลยี AI อย่างปลอดภัย มีความรับผิดชอบ

รัฐบาลสหราชอาณาจักร เลือกจัดงาน AI Safety Summit ที่ Bletchley Park สถานที่ทางประวัติศาสตร์ของโลกคอมพิวเตอร์ เพราะเป็นที่ตั้งของหน่วยข่าวกรองของรัฐบาลอังกฤษ ที่พยายามถอดรหัสลับของฝ่ายอักษะในยุคสงครามโลกครั้งที่สอง และกลายเป็นปัจจัยสำคัญที่ทำให้ฝ่ายพันธมิตรชนะสงครามโลก มีบุคคลอย่าง Alan Turing สร้างเครื่องคำนวณ "คอมพิวเตอร์" ยุคแรกขึ้นมาที่นี่

Tags:
Node Thumbnail

ศูนย์วิจัยโมเดล AI ของมหาวิทยาลัยสแตนฟอร์ด (Center for Research on Foundation Models หรือ CRFM) ร่วมกับหน่วยงานวิจัยของ MIT Media Lab และ Princeton เปิดตัวดัชนีความโปร่งใสของโมเดล AI ที่เรียกว่า Foundation Model Transparency Index

ดัชนี Foundation Model Transparency Index ให้คะแนนโมเดล AI ขนาดใหญ่ของบริษัทต่างๆ ในเรื่องความโปร่งใสของกระบวนการสร้างโมเดล เริ่มตั้งแต่ข้อมูลที่ใช้เทรน การจ้างแรงงานเพื่อแปะป้ายให้ข้อมูลที่เทรน ความโปร่งใสของตัวโมเดล ความเสี่ยงในการใช้งาน มาตรการความปลอดภัย ฯลฯ รวม 13 หมวด

ผลออกมาว่าโมเดล Llama 2 ของ Meta ได้คะแนนอันดับหนึ่ง 54/100 จากปัจจัยการเป็นโมเดลโอเพนซอร์ส ส่วน GPT-4 ของ OpenAI อยู่อันดับสามที่คะแนน 47/100 โดยทำคะแนนหมวดความสามารถ (capabilities) ได้สูงสุด

Tags:
Node Thumbnail

ทีมวิจัยจากมหาวิทยาลัยอัมสเตอร์ดัมรายงานถึงผลการทดสอบโยนเหรียญเพื่อดูผลหัวก้อยจากกลุ่มตัวอย่างผู้โยนเหรียญ 50 คน รวมโยนเหรียญไป 350,757 ครั้ง พบว่าความน่าจะเป็นที่เหรียญจะออกข้างเดียวกับตอนเริ่มต้น คิดเป็นความน่าจะเป็น 0.508 โดยมีช่วงความเชื่อมั่น (confidence interval) 95% ที่ 0.506-0.509

การทดลองอาศัยการสุ่มเลือกหน้าเหรียญตั้งต้นครึ่งๆ และดูผลของการโยนเหรียญแต่ละครั้งว่าจะออกหน้าใด โดยถ่ายวิดีโอการโยนเหรียญไว้ทั้งหมด

Tags:
Node Thumbnail

ปัจจุบันอุตสาหกรรมเพลงกำลังเติบโต มีการเปิดตัวเพลงใหม่ขึ้นหลายหมื่นเพลง จึงเป็นเรื่องยากสำหรับบริการสตรีมมิ่งเพลงและสถานีวิทยุที่จะเพิ่มเพลงที่ผู้ฟังน่าจะชอบลงในเพลย์ลิสต์ของตน โดยปกติแล้วบริการเหล่านี้จะใช้วิธีเลือกเพิ่มเพลงโดยอาศัยรสนิยมของผู้ฟังและ ใช้ AI วิเคราะห์และช่วยเลือกเพลงให้

นักวิจัยสหรัฐฯ จึงพัฒนาโมเดล Machine Learning ที่ใช้กับการตอบสนองของระบบประสาท ของผู้ฟังกลุ่มตัวอย่างที่ถูกวัดคลื่นสมองระหว่างฟังเพลง เพื่อคาดการณ์ว่าเพลงจะฮิตหรือไม่ ด้วยความแม่นยำที่สูงถึง 97% โดยวัดจากเพลงที่มียอดสตรีมมิ่งสูง ซึ่งในอนาคตวิธีนี้อาจใช้คาดการ์ณกับความบันเทิงประเภทอื่นๆได้ เช่น ภาพยนตร์และรายการทีวี

Tags:
Node Thumbnail

ทีมวิจัยของ Meta ได้โอเพนซอร์ส MusicGen ชุดเครื่องมือ AI สำหรับสร้างดนตรีขึ้นใหม่ โดยอาศัยข้อมูล prompt ตัวหนังสืออธิบายรูปแบบเพลงที่ต้องการ หรือใช้เมโลดี้ของเพลงตั้งต้น ซึ่งได้ผลลัพธ์ออกมาเป็นดนตรีที่มีความยาวมากน้อยแล้วแต่กรณี

โค้ดเผยแพร่ภายใต้สัญญา MIT สำหรับงานวิจัย หรือเพื่อนำไปผลิตซ้ำ รายละเอียดใน GitHub ของโครงการนี้

Tags:
Node Thumbnail

หน่วยงานวิจัย Pew Research Center รายงานผลสำรวจคนอเมริกาเมื่อเดือนมีนาคมที่ผ่านเกี่ยวกับแชทบอต ChatGPT แชทบอตถามตอบพลัง AI ของ OpenAI ที่เป็นกระแสในช่วงที่ผ่านมา ได้ผลสรุปดังนี้

  • 58% ของกลุ่มตัวอย่าง บอกว่าเคยได้ยินหรือรู้จัก ChatGPT โดย 18% บอกว่ารู้จักดี
  • ในกลุ่ม 58% ที่บอกว่ารู้จัก มีเพียง 14% ที่เคยลองใช้งาน ChatGPT
  • ประมาณ 4 ใน 10 ของกลุ่มที่เคยใช้ ChatGPT บอกว่ามีประโยชน์

ที่มา: Pew Research

Tags:
Node Thumbnail

ทำเนียบขาวเริ่มออกมาแสดงท่าทีเรื่องนโยบาย AI ว่ามีผลกระทบอย่างไร โดยจะเชิญบริษัทไอทีสาย AI เข้ามาแสดงความเห็นเรื่องผลกระทบต่อ AI ในงานสัมมนาสายแฮ็กเกอร์ DEF CON 31 ช่วงเดือนสิงหาคม บริษัทที่ระบุว่าจะเข้าร่วมแล้วคือ Anthropic, Google, Hugging Face, Microsoft, NVIDIA, OpenAI, Stability AI

สหรัฐอเมริกากำลังอยู่ระหว่างการร่าง AI Bill of Rights และ AI Risk Management Framework และยังจะออกร่างกฎเกณฑ์การใช้งาน AI ของหน่วยงานภาครัฐด้วย

นอกจากนี้ National Science Foundation ของสหรัฐยังประกาศงบประมาณ 140 ล้านดอลลาร์ ตั้งศูนย์วิจัย National AI Research Institutes อีก 7 แห่งทั่วประเทศ ซึ่งจะทำให้สหรัฐอเมริกามีศูนย์วิจัย AI แห่งชาติรวมเป็น 25 แห่งแล้ว

Tags:
Node Thumbnail

Xerox ประกาศบริจาค Palo Alto Research Center (PARC) หน่วยงานปฏิบัติการวิจัยที่มีประวัติยาวนาน ให้กับสถาบันวิจัยที่ไม่แสวงหากำไร SRI International ซึ่ง Xerox บอกว่าการแยกหน่วยงานวิจัยนี้ออกไป เพื่อให้บริษัทโฟกัสกับผลิตภัณฑ์ที่เป็นธุรกิจหลัก ขณะที่ Xerox ก็ทำข้อตกลงความร่วมมือกับ SRI ในด้านงานวิจัยและพัฒนาผลิตภัณฑ์ใหม่

PARC เป็นหน่วยงานวิจัยของ Xerox ก่อตั้งในปี 1970 มีผลงานวิจัยจำนวนมาก และหลายอย่างส่งผลต่อโลกคอมพิวเตอร์จนถึงปัจจุบัน เช่น เมาส์, GUI หรือ ส่วนติดต่อผู้ใช้แบบกราฟิก, จอภาพแบบบิตแมป, ภาษาโปรแกรมเชิงวัตถุ (OOP), Ethernet, เลเซอร์พรินเตอร์ และอื่น ๆ อีกมาก

Tags:
Node Thumbnail

Meta เปิดซอร์สโค้ด DINOv2 วิธีการเทรนโมเดลปัญญาประดิษฐ์ด้านภาพ (computer vision models) แบบ self-supervision ที่มีประสิทธิภาพสูง ทำงานได้โดยไม่ต้องปรับจูน (fine-tuning) สำหรับงานเฉพาะทาง มีความยืดหยุ่นสูงนำไปใช้ต่อกับงานได้หลากหลายรูปแบบ

DINOv2 ออกแบบมาแก้ข้อจำกัดของโมเดลด้านภาพ ที่ใช้เทคนิค image-text pretraining การเทรนข้อมูลภาพแบบมีป้ายกำกับ (captions/labels) ซึ่งมีจุดอ่อนคือข้อความในป้ายกำกับอาจไม่ครอบคลุมรายละเอียดทั้งหมดในภาพ, ภาพบางประเภทไม่สามารถทำป้ายกำกับได้ (เช่น ภาพถ่ายเซลล์สิ่งมีชีวิต) และหากภาพมีจำนวนมากขึ้นเรื่อยๆ มนุษย์ก็ไม่สามารถสร้างป้ายกำกับได้ครบถ้วนอยู่ดี เรียกได้ว่าคอขวดของการพัฒนากลับไปอยู่ที่มนุษย์ซะเอง

Tags:
Node Thumbnail

ถึงแม้ OpenAI เปลี่ยนมาใช้แนวทางปิด ไม่เปิดเผยรายละเอียดของโมเดล GPT-4 และฝั่งกูเกิลเองก็ยังค่อนข้างระมัดระวังในการปล่อย Bard ทีละนิด แต่โลกเราก็ยังมีโมเดลภาษาขนาดใหญ่ (Large Language Model หรือ LLM) ตัวอื่นให้ใช้งาน โดยเฉพาะ LLaMA ของ Meta ที่เปิดตัวในเดือนกุมภาพันธ์ 2023 ซึ่งเป็นโอเพนซอร์ส ใช้สัญญาอนุญาตแบบ GPLv3 และเปิดทางให้หน่วยงานวิจัยมาขอชุดข้อมูลที่ใช้เทรนไปศึกษาได้

ตัวอย่างก่อนหน้านี้คือ Nebuly AI สร้าง ChatLLaMA แบบโอเพนซอร์ส ใช้โมเดล LLaMA ของ Meta เป็นฐาน

Tags:
Node Thumbnail

Meta เผยแพร่ชุดโมเดล AI สำหรับสร้างข้อความภาษา หรือ LLM (Large Language Model) โดยเรียกชื่อว่า LLaMA ย่อมาจาก Large Language Model Meta AI โดยมีเป้าหมายเพื่อให้องค์กรต่าง ๆ นำไปศึกษาวิจัยต่อ

LLM เป็นรูปแบบโมเดล AI สร้างข้อความ ที่ถูกนำมาใช้ในผลิตภัณฑ์แชตบอทที่เป็นกระแสในช่วงที่ผ่านมา ไม่ว่าจะเป็น ChatGPT, Bing Chat หรือ Bard ของกูเกิล และเป็นโมเดลที่มีการเปลี่ยนแปลงอย่างรวดเร็ว ต้องการทรัพยากรประมวลที่ใหญ่มาก ทำให้หลายองค์กรไม่มีโอกาสเข้าถึง โดย LLaMA ที่ Meta เผยแพร่มีหลายขนาดชุดข้อมูล ตั้งแต่ 7 พันล้านพารามิเตอร์ จนถึงชุด 65 พันล้านพารามิเตอร์

Tags:
Node Thumbnail

ช่วงนี้ AI สายตระกูล Large Language Models (LLM) กำลังโด่งดังจากกระแส ChatGPT แต่ข้อเสียของโมเดลใหญ่ขนาดนี้คือขนาดของตัวมันเองที่ใหญ่มาก มีพารามิเตอร์หลักพันล้าน ใช้ข้อมูลการเทรน ทรัพยากรเครื่องจำนวนมหาศาล

ทีมนักวิจัยของไมโครซอฟท์จึงเสนอแนวทาง Language Model ที่มีขนาดเล็กลง แต่ทำงานเฉพาะด้านแทน โดยนำเสนองานวิจัย FLAME ที่ย่อมาจาก First LAnguage Model for Excel หน้าที่ของมันตรงตามชื่อคือเป็นโมเดลภาษาสำหรับ Excel ช่วยแนะนำหรือแก้ไขสูตรในตารางสเปรดชีท

Tags:
Node Thumbnail

ทีมนักวิจัยจากมหาวิทยาลัยสแตนฟอร์ด นำโดย Eric Anthony Mitchell นักศึกษาปริญญาเอกด้าน AI ประกาศว่าประสบความสำเร็จในการดักจับข้อความที่สร้างจาก ChatGPT หรือโมเดลสร้างข้อความ large language models (LLMs) แบบเดียวกัน

อัลกอริทึมนี้ถูกตั้งชื่อว่า DetectGPT ใช้เทคนิคประเมินความเป็นไปได้ของข้อความจาก AI ว่าจะถูกสร้างขึ้นจากพื้นที่เฉพาะของโมเดล ซึ่งสามารถคำนวณได้จากฟังก์ชันคณิตศาสตร์ (log probability function)

ทีมผู้สร้างบอกว่าอัลกอริทึม DetectGPT สามารถตรวจจับข้อความจาก AI โดยไม่จำเป็นต้องถูกเทรนมาก่อนว่าข้อความจาก ChatGPT เป็นอย่างไร และไม่จำเป็นว่าข้อความจะถูกใส่เทคนิค watermark ระบุว่ามาจาก AI ด้วย

Pages