Llama

Meta เปิดตัว Llama 3.2 เพิ่มรุ่นอ่านภาพได้, มีโมเดลขนาดเล็กเน้นรันในโทรศัพท์ พร้อมชุดพัฒนาซอฟต์แวร์ของตัวเอง

By lew

on 26 September 2024 - 01:28 Tag: Meta, Llama, LLM

Meta

Meta เปิดตัว Llama 3.2 โมเดล LLM เพิ่มรุ่นรองรับอินพุตเป็นภาพ ที่มีความสามารถระดับเดียวกับ GPT-4o-mini พร้อมกับโมเดลรุ่นเล็กขนาด 1B ที่ความสามารถใกล้เคียงโมเดลกลุ่มขนาดเล็กด้วยกัน

โมเดลโอเพนซอร์ส Reflection ปรับจูนจาก Llama แต่ชนะโมเดลใหญ่ได้ทุกตัวรวม GPT-4o

By mk

on 7 September 2024 - 13:48 Tag: LLM, Llama, Open Source, Artificial Intelligence

LLM

โลก AI เมื่อคืนนี้มีการเปลี่ยนแปลงน่าสนใจ เมื่อ Matt Shumer ผู้ก่อตั้งสตาร์ตอัพ HyperWrite เปิดตัวโมเดลภาษาขนาดใหญ่ (LLM) ตัวใหม่ Reflection 70B ที่มีคะแนนเบนช์มาร์คชนะโมเดล__ทุกตัว__ในท้องตลาด ไม่ว่าจะเป็น GPT-4o, Claude 3.5, Gemini 1.5 Pro, Llama 3.1 405B

สิ่งที่น่าสนใจคือ Reflection 70B ไม่ได้พัฒนาขึ้นมาจากศูนย์ แต่ปรับจูนมาจากโมเดลโอเพนซอร์สอย่าง Llama 3.1 70B อีกทอดหนึ่ง แล้วดันเอาชนะ Llama 3.1 405B ที่ตัวใหญ่กว่ามากๆ ได้

โมเดลมหาชน Meta เผยยอดดาวน์โหลด Llama 350 ล้านครั้ง, ปี 2024 เติบโต 10 เท่า

By mk

on 30 August 2024 - 13:24 Tag: Llama, Meta, LLM, Artificial Intelligence

Llama

Meta เผยยอดดาวน์โหลดโมเดลภาษาขนาดใหญ่ตระกูล Llama ทะลุ 350 ล้านครั้ง (นับเฉพาะบน Hugging Face) และมีโมเดลเวอร์ชันพัฒนาต่อยอดมากกว่า 60,000 ตัวบน Hugging Face

Llama ถือเป็นโมเดลภาษาขนาดใหญ่ที่เป็นโอเพนซอร์สเกือบ 100% (มีเงื่อนไขการใช้งานจำกัดเฉพาะบริษัทไอทีและคลาวด์รายใหญ่เท่านั้น) เปิดตัวครั้งแรกในเดือนกุมภาพันธ์ 2023 และใช้เวลา 18 เดือน พัฒนาตัวเองกลายมาเป็นโมเดลยอดนิยม

Meta จัดแข่งขัน Llama Hackathon ระดับเอเชียแปซิฟิก คนไทยมีสิทธิสมัครแข่งด้วย

By mk

on 15 August 2024 - 22:32 Tag: Meta, Llama, Thailand, Hackathon, Artificial Intelligence

Meta

Meta จัดแข่งขัน AI Accelerator Program ปี 2024 ระดับเอเชียแปซิฟิก (รวมไทยด้วย) โดยแบ่งเป็นระดับประเทศ ที่นักพัฒนาไทยต้องส่งหัวข้อโครงการที่นำ Llama AI เข้าไปแก้ปัญหาทางเศรษฐกิจและสังคม จากนั้นผู้ผ่านการคัดเลือกจะไปแข่ง Meta Llama Hackathon ที่สิงคโปร์ในเดือนตุลาคม

การแข่งขันรอบประเทศไทย

Meta เปิด AI Studio บริการสร้างแชทบอทพลัง Llama 3.1 แบบคัสตอม เลือกบุคลิก-หัวข้อโต้ตอบได้

By mk

on 31 July 2024 - 09:31 Tag: Meta, Chatbot, Artificial Intelligence, Llama

Meta

Meta เปิดบริการ AI Studio ให้ผู้ใช้สร้างอวตาร AI ของตัวเอง มีทั้งหน้าตา และลักษณะนิสัยเพื่อพูดคุยโต้ตอบกับเราในเรื่องที่สนใจได้

รูปแบบการใช้งานคล้ายกับแชทบอท Meta AI ที่เปิดตัวเมื่อปีที่แล้ว ของเดิมเอาบุคลิกของดาราเซเล็บมาทำเป็นแชทบอท ของใหม่คือเปิดให้ปรับแต่งเองได้อิสระ สามารถแชทคุยได้ผ่าน Instagram, Messenger, WhatsApp รวมถึงแชร์ให้เพื่อนๆ คุยกับบอทของเราได้ด้วย

คลาวด์รายหลักเปิดให้บริการ Llama 3.1 โดยพร้อมเพรียง, Meta อนุญาตให้นำ output ไปฝึกโมเดลของตัวเองได้

By lew

on 24 July 2024 - 15:35 Tag: Llama, Meta, LLM

Llama

หลังจากเมื่อคืนที่ผ่านมา Meta เปิดตัว Llama 3.1 โมเดลปัญญาประดิษฐ์ บรรดาคลาวด์รายเล็กและรายใหญ่ก็ประกาศเปิดบริการ Llama 3.1 โดยพร้อมเพรียงกัน โดยบริการที่ครบถ้วนที่สุดคือ Microsoft Azure เปิดให้บริการพร้อมกับประกาศราคาออกมาพร้อมกันทั้งสามขนาด Google Cloud นั้นเปิดให้ใช้งานโมเดล 405B แล้วแต่ยังไม่ประกาศราคา ขณะที่ AWS นั้นประกาศราคาเฉพาะรุ่น 70B และ 8B โดยรุ่น 405B ต้องเปิดเคสขอใช้งาน

Meta เปิดตัว Llama 3.1 พร้อมรุ่นใหญ่สุด 405B ความสามารถใกล้เคียง GPT-4o เข้าใจภาษาไทยแล้ว

By lew

on 23 July 2024 - 23:03 Tag: Meta, Artificial Intelligence, LLM, Llama

Meta

Meta ปล่อยโมเดล Llama 3.1 โมเดล LLM รุ่นล่าสุดที่รีดความสามารถได้สูงขึ้นมาก พร้อมกับปล่อยโมเดลขนาดใหญ่ที่สุด 405B ความสามารถจากการทดสอบหลายอย่างไปอยู่ระดับเดียวกับ GPT-4o แล้ว แม้ว่ายังไม่มีความสามารถ multimodal ที่รองรับภาพและเสียงได้ก็ตาม

ผลทดสอบหลายด้านของ Llama 3.1 แสดงให้เห็นว่าทาง Meta ยังรีดความสามารถในโมเดลขนาดเล็กได้เพิ่มขึ้นเรื่อยๆ โดยผลทดสอบหลายชุด Llama 3.1 8B สามารถทำคะแนนได้ใกล้ Llama 3.0 70B มากขึ้น ขณะที่ Llama 3.1 70B นั้นทำคะแนนเพิ่มเติมได้แทบทุกชุดยกเว้นบ้างเช่นชุดทดสอบเขียนโปรแกรม HumanEval ที่คะแนนลดลง

Meta บอกโมเดล Llama ตัวใหม่ จะไม่เผยแพร่ให้ผู้ใช้งานในกลุ่มประเทศ EU เพื่อเลี่ยงปัญหาจากหน่วยงานกำกับดูแล

By arjin

on 18 July 2024 - 17:56 Tag: Llama, Meta, LLM, Artificial Intelligence, Europe, EU

Llama

Meta เปิดเผยว่าบริษัทมีแผนออกโมเดลปัญญาประดิษฐ์ Llama ที่รองรับข้อมูลผสมผสาน (Multimodal) ในอีกไม่กี่เดือนข้างหน้า แต่ประเด็นสำคัญนั้น Meta บอกว่าโมเดล Llama ตัวใหม่นี้จะไม่เผยแพร่ให้กับผู้ใช้งานในกลุ่มประเทศสหภาพยุโรปหรือ EU

โดยเหตุผลที่ Meta ตัดสินใจเช่นนั้นเป็นเพราะ Meta มองว่าทิศทางของหน่วยงานกำกับดูแลของ EU มีลักษณะที่คาดเดาได้ยาก จึงเลือกไม่เผยแพร่โมเดลไปเลยดีกว่า

Mayo Clinic พัฒนาผู้ช่วยแพทย์รักษามะเร็ง finetune จาก Llama 2 ข้อมูลไม่ออกจากโรงพยาบาลเลย

By lew

on 12 May 2024 - 15:30 Tag: Llama, Meta, LLM, Medical, Research

Llama

Mayo Clinic รายงานถึงการพัฒนา RadOnc-GPT ผู้ช่วยวิเคราะห์โรคมะเร็งที่อาศัยข้อมูลการรักษามะเร็งในโรงพยาบาล Mayo Clinic เอง นำมา finetune โมเดล Llama 2 ของ Meta กระบวนการฝึกและการใช้งานทั้งหมดอยู่ในเน็ตเวิร์คของโรงพยาบาลเอง

แชทบอต Meta AI อัปเดตรองรับ Llama 3, มี AI สร้างรูปเรียลไทม์, เพิ่มประเทศได้ใช้งาน - ไทยรอไปก่อน

By arjin

on 19 April 2024 - 06:11 Tag: Meta AI, Meta, Llama, Artificial Intelligence, LLM, WhatsApp, Facebook, Facebook Messenger, Instagram, Chatbot

Meta AI

Meta ประกาศอัปเดต Meta AI แชทบอตผู้ช่วยบน Facebook, Instagram, WhatsApp และ Messenger ที่เปิดตัวในงาน Connect เมื่อปีที่แล้ว โดยขยายประเทศที่รองรับเพิ่มเติมนอกจากสหรัฐอเมริกา ตามที่มีข่าวก่อนหน้านี้ รวมทั้งเพิ่มความสามารถด้วยโมเดล Meta Llama 3 ล่าสุดที่เพิ่งเปิดตัว

Meta ปล่อย Llama 3 เอาชนะ GPT-3.5, Claude 3 Sonnet, Gemini Pro 1.0 กำลังพัฒนารุ่น 400B

By lew

on 19 April 2024 - 00:19 Tag: Llama, Meta, Artificial Intelligence, LLM

Llama

Meta ปล่อยโมเดลปัญญาประดิษฐ์ Llama 3 สองรุ่น คือ 8B และ 70B แยกรุ่นย่อยสำหรับการทำตามคำสั่ง โดยยังมีรุ่น 400B อยู่ระหว่างการพัฒนา

รุ่น 8B นั้น Meta เทียบกับ Gemma 7B และ Mistral 7B Instruct เอาชนะได้ทุกชุดการทดสอบ บางหมวดเช่น HumanEval สำหรับการเขียนโปรแกรม และ GSM-8K สำหรับการคำนวณนั้นนำห่าง

รุ่น 70B ทาง Meta นำไปเทียบกับ Gemini Pro 1.5 ทำคะแนนนำได้บางชุดทดสอบ และเมื่อเทียบกับ Claude 3 Sonnet ก็ชนะทุกชุดทดสอบเช่นกัน

Meta โชว์คลัสเตอร์ใหม่สำหรับฝึก LLaMA 3 ชิป H100 24,576 ตัว ซื้อเพิ่มต่อเนื่องสิ้นปี 350,000 ตัว

By lew

on 13 March 2024 - 00:48 Tag: Llama, Meta, Artificial Intelligence

Llama

Meta รายงานถึงข้อมูลของคลัสเตอร์ใหม่ที่บริษัทใช้ฝึกปัญญาประดิษฐ์ โดยทำขึ้นมาเพื่อออกแบบและฝึก LLaMA 3 โดยเฉพาะ และเป็นพื้นที่ทดสอบสถาปัตยกรรมคลัสเตอร์ใหม่ที่จะขยายต่อไปในอนาคต โดยประกาศแผนว่าจะซื้อเพิ่มไปเรื่อยๆ จนสิ้นปีมีชิป H100 ประมาณ 350,000 ตัว พลังประมวลผลรวมเทียบเท่ากับชิป H100 จำนวน 600,000 ตัว

Meta ปล่อยโมเดล Code Llama ขนาด 70B คะแนนทดสอบ HumanEval แซง GPT-4, Gemini Pro

By lew

on 30 January 2024 - 00:55 Tag: Llama, Meta, LLM, Programming

Llama

Meta ปล่อยโมเดล Code Llama ขนาด 70B หลังจากปีที่แล้วปล่อยรุ่นใหญ่สุดอยู่ที่ 34B เท่านั้น โดยตอนนี้ยังไม่บอกรายละเอียดนัก นอกจากระบุว่าคะแนนทดสอบ HumanEval อยู่ที่ 67.8 แซงหน้า GPT-4 (67.0) และ Gemini Pro (67.7) โดยระบบอื่นๆ ที่ได้คะแนนสูงกว่านี้มักใช้ GPT-4/GPT-3.5 ร่วมกับเทคนิคอื่นๆ เพื่อให้ทำคะแนนได้สูงขึ้น

โมเดลที่ปล่อยออกมามี 3 รุ่นย่อย ได้แก่ รุ่นพื้นฐานสำหรับใช้งานทั่วไป, รุ่นภาษาไพธอนโดยเฉพาะ, และรุ่น Instruct สำหรับรับคำสั่งเพื่อเขียนโปรแกรมตาม รุ่นที่รายงานคะแนน HumanEval นั้นคือรุ่น Instruct

Meta เผยกำลังเทรน Llama 3, จะมีจีพียู H100 3.5 แสนตัว, เป้าหมายคือ Open Source AGI

By mk

on 19 January 2024 - 08:36 Tag: Llama, Meta, Artificial Intelligence, LLM, GPU

Llama

Mark Zuckerberg เปิดเผยว่าตอนนี้ทีม AI ของบริษัท Meta กำลังเทรนโมเดล Llama 3 บนโครงสร้างพื้นฐานคอมพิวเตอร์ขนาดใหญ่ ที่จะมีจีพียู NVIDIA H100 เพิ่มเป็น 350,000 ตัวภายในสิ้นปี 2024 และถ้านับจีพียูตัวอื่นๆ มารวมด้วย จะเทียบได้กับการมี H100 จำนวนรวม 600,000 ตัว

ตอนนี้ Meta มีทีมพัฒนา AI สองทีมคือ Fundamental AI Research (FAIR) ที่เน้นงานวิจัย และ GenAI ที่เพิ่งตั้งเมื่อต้นปี 2023 เน้นพัฒนาฟีเจอร์ AI ให้กับบริการในเครือ อย่าง WhatsApp, Messenger, Instagram

Meta เปิดตัวโครงการ Purple Llama รวมเครื่องมือด้านความปลอดภัยของ AI

By mk

on 10 December 2023 - 16:44 Tag: Llama, Meta, Artificial Intelligence

Llama

Meta เปิดตัวโครงการ Purple Llama รวมเครื่องมือด้านความปลอดภัยของ AI ที่โอเพนซอร์สให้สาธารณะใช้งาน

ตัวชื่อโครงการมาจากภาษาที่ใช้ในโลกความปลอดภัยไซเบอร์ ที่แบ่งการทดสอบออกเป็นทีมลองเจาะ (red team) และทีมป้องกัน (blue team) โครงการนี้ที่มีเครื่องมือทั้งสองฝั่งจึงเอาสองสีมารวมกันเป็นสีม่วง แล้วมารวมกับชื่อ Llama ที่เป็นโมเดล LLM ของบริษัทเอง

Google Cloud เปิดให้เช่ารันโมเดล Meta Llama 2 และ Anthropic Claude 2

By mk

on 30 August 2023 - 14:16 Tag: Google Cloud, Llama, Claude, LLM, Artificial Intelligence, Meta, Anthropic, Cloud Computing

Google Cloud

Google Cloud มีบริการเช่ารันโมเดล AI ชื่อ Vertex AI ที่ให้บริการมาสักระยะหนึ่งแล้ว และเปิดบริการโมเดล Generative AI เมื่อเดือนพฤษภาคมที่ผ่านมา โดยมีทั้งโมเดลของกูเกิลเอง และโมเดลจากบริษัทอื่นด้วย กูเกิลเรียกบริการนี้ว่า Model Garden

ล่าสุดในงาน Google Cloud Next '23 เมื่อคืนนี้ กูเกิลประกาศเพิ่มโมเดลของพาร์ทเนอร์อีกหลายตัว ได้แก่

Meta ปล่อย AI เขียนโค้ด Code Llama ความสามารถเป็นรองเพียง GPT-4, รันภายในองค์กรได้

By lew

on 25 August 2023 - 00:02 Tag: Llama, Meta, Artificial Intelligence, LLM, Programming

Llama

Meta ปล่อย Code Llama โมเดลปัญญาประดิษฐ์ที่พัฒนาต่อจาก Llama2 มาฝึกกับซอร์สโค้ดขนาด 500 ล้านโทเค็น ได้โมเดลทั้งแบบเติมโค้ดปกติ, แบบรับคำสั่ง, และโมเดลฝึกเฉพาะกับโค้ด Python

ผลทดสอบการเขียนโค้ด HumanEval นั้น Code Llama ขนาด 34B ได้คะแนนดีกว่าโมเดลอื่นๆ ทั้งหมด รวมถึง GPT-3.5 หรือ ChatGPT ด้วย เป็นรองเพียง GPT-4 เท่านั้น ขณะที่โมเดลขนาดรองลงมา เช่น 7B และ 13B ก็ยังทำคะแนนได้ดีและตอบสนองเร็วกว่ามาก

Qualcomm ประกาศร่วมมือกับ Meta ทำชิปประมวลผล Llama 2 แบบ on-device เปิดตัวปี 2024

By arjin

on 19 July 2023 - 06:46 Tag: Qualcomm, Meta, Artificial Intelligence, LLM, Llama

Qualcomm

Qualcomm ประกาศร่วมมือกับ Meta เพื่อปรับแต่งนำ Llama 2 โมเดล AI ถามตอบที่เพิ่งเปิดตัวล่าสุด ให้สามารถทำงานได้ในระดับอุปกรณ์ (on-device) โดยไม่ต้องพึ่งการประมวลผลบนคลาวด์ ช่วยให้อุปกรณ์เช่น สมาร์ทโฟน พีซี หรือเฮดเซต AR/VR สามารถตอบสนองได้รวดเร็วมากขึ้น

นอกจากนี้ Qualcomm บอกว่าการประมวลผล AI ที่ระดับอุปกรณ์ ยังช่วยให้นักพัฒนาแอปเข้าถึงการใช้งาน AI ในรูปแบบต่าง ๆ ที่หลากหลายขึ้น รวมทั้งเพิ่มความปลอดภัยและความเป็นส่วนตัวให้ผู้ใช้งาน

Meta เปิดตัว Llama 2, AI ใช้แชตถามตอบแบบโอเพนซอร์ส ใช้เพื่อการค้าก็ได้ ความสามารถใกล้ ChatGPT ตัวก่อน

By lew

on 19 July 2023 - 00:13 Tag: Llama, Meta, LLM, Artificial Intelligence

Llama

Meta เปิดตัว Llama 2 ตัวต่อจาก Llama ที่เปิดตัวไปเมื่อเดือนกุมภาพันธ์ที่ผ่านมา ตัวโมเดลมี 3 ขนาดเช่นเดิม คือ 7B, 13B, และ 70B แต่เปลี่ยนแนวทางเพิ่มการฝึกกับชุดคำถามตอบมากขึ้น โดยมีการจูนกับชุดคำถามตอบกว่าแสนรายการ และฝึกเพิ่มด้วยการให้คนมาเลือกคำตอบที่ดีที่สุดอีกกว่าล้านครั้ง

รู้จัก Alpaca และ Koala โมเดล LLM ที่พัฒนาต่อจาก LLaMA ของ Meta, ขนาดเล็กกว่า GPT แต่แข่งขันได้

By mk

on 6 April 2023 - 11:59 Tag: Llama, Artificial Intelligence, Open Source, Meta, Research, Stanford, Berkeley, LLM

Llama

ถึงแม้ OpenAI เปลี่ยนมาใช้แนวทางปิด ไม่เปิดเผยรายละเอียดของโมเดล GPT-4 และฝั่งกูเกิลเองก็ยังค่อนข้างระมัดระวังในการปล่อย Bard ทีละนิด แต่โลกเราก็ยังมีโมเดลภาษาขนาดใหญ่ (Large Language Model หรือ LLM) ตัวอื่นให้ใช้งาน โดยเฉพาะ LLaMA ของ Meta ที่เปิดตัวในเดือนกุมภาพันธ์ 2023 ซึ่งเป็นโอเพนซอร์ส ใช้สัญญาอนุญาตแบบ GPLv3 และเปิดทางให้หน่วยงานวิจัยมาขอชุดข้อมูลที่ใช้เทรนไปศึกษาได้

Subscribe to Llama