Baidu โชว์ ERNIE 3.5 เพิ่มฟีเจอร์ปลั๊กอิน แข่งภาษาจีนชนะ GPT-4, ภาษาอังกฤษใกล้เคียง GPT-3.5

By lew

on 27 June 2023 - 23:18 Tag: Baidu, LLM

Baidu

Baidu ประกาศว่าเริ่มปล่อย ERNIE 3.5 ปัญญาประดิษฐ์ภาษาขนาดใหญ่ (LLM) ให้ผู้ได้รับสิทธิ์ทดสอบได้เริ่มใช้งานแล้ว โดยผลทดสอบ AGIEval ของไมโครซอฟท์ และ C-EVAL ของนักวิจัยจีนแสดงให้เห็นว่า ERNIE 3.5 เริ่มมีประสิทธิภาพใกล้เคียง ChatGPT ที่ใช้ GPT-3.5 และเมื่อแยกเฉพาะชุดทดสอบภาษาจีนเอง ERNIE 3.5 ทำคะแนนทดสอบได้ดีกว่า GPT-4

ในแง่ฟีเจอร์ ERNIE เริ่มตาม ChatGPT มาใกล้เคียงมากขึ้น โดยรองรับระบบปลั๊กอิน เบื้องต้นมีสองตัว คือ Baidu Search สำหรับค้นข้อมูลเพิ่มเติมจากเว็บ และ ChatFile สำหรับอ่านไฟล์และถามตอบข้อมูลจากไฟล์ ในอนาคตจะเปิดให้นักพัฒนาภายนอกสร้างปลั๊กอินเข้ามามาเพิ่มเติม

ทาง Baidu ไม่ได้เปิดเผยสถาปัตยกรรมภายในของ ERNIE แต่ก็บอกว่าในรุ่นนี้ปรับปรุงการเทรนให้เร็วขึ้น การคำนวณใช้ mixed-precision ที่ผสมชนิดข้อมูลในโมเดล ตลอดจนโครงสร้างภายในของ ERNIE สามารถต้นหาข้อมูลก่อนตอบได้

ตอนนี้ ERNIE ยังจำกัดเฉพาะบริษัทที่ได้สิทธิทดสอบเท่านั้น ยังไม่เปิดให้คนทั่วไปใช้งาน

ที่มา - Baidu Research

Hiring! บริษัทที่น่าสนใจ

Carmen Software

Hotel Financial Solutions

Next Innovation (Thailand) Co., Ltd.

We are web design with consulting & engineering services driven the future stronger and flexibility.

KKP Dime

KKP Dime บริษัทในเครือเกียรตินาคินภัทร

Kiatnakin Phatra Financial Group

Financial Service

Fastwork Technologies

Fastwork.co เว็บไซต์ที่รวบรวม ฟรีแลนซ์ มืออาชีพจากหลากหลายสายงานไว้ในที่เดียวกัน

Thoughtworks Thailand

Thoughtworks เป็นบริษัทที่ปรึกษาด้านเทคโนโยลีระดับโลกที่คว้า Great Place to Work 3 ปีซ้อน

Iron Software

Iron Software is an American company providing a suite of .NET libraries by engineer for engineers.

CLEVERSE

Cleverse is a Venture Builder. Our team builds several tech companies.

Nipa Cloud

#1 OpenStack cloud provider in Thailand with our own data center and software platform.

Bangmod Enterprise

The leader in Cloud Server and Hosting in Thailand.

CIMB THAI Bank

MOVING FORWARD WITH YOU - CIMB is the leading ASEAN Bank

Bangkok Bank

Bangkok Bank is one of Southeast Asia's largest regional banks, a market leader in business banking

MuvMi (Urban Mobility Tech Co.,Ltd.)

Shape the future of urban mobility towards affordable, clean, and safe solutions

T.N. Digital Solution Co., Ltd.

TNDS has been involving in every first move of banking’s major digital transformation.

KBTG - KASIKORN Business-Technology Group

KBTG - "The Technology Company for Digital Business Innovation"

Siam Commercial Bank Public Company Limited

"Let's start a brighter career future together"

Icon Framework co.,Ltd.

Global Standard Platform for Real Estate แพลตฟอร์มสำหรับธุรกิจอสังหาริมทรัพย์ครบวงจร มาตรฐานระดับโลก

REFINITIV

The Financial and Risk business of Thomson Reuters is now Refinitiv

H LAB

Re-engineering healthcare systems through intelligent platforms and system design.

The Gang Technology Co., Ltd.

We're a Digital Agency that helps our customers transform their business into digital with ease.

LTMH

LTMH มุ่งเน้นการพัฒนาผลิตภัณฑ์ที่สามารถช่วยพันธมิตรของเราให้บรรลุเป้าหมาย

Seven Peaks

We Drive Digital Transformation

Wisesight (Thailand) Co., Ltd.

The Best Choice For Handling Social Media · High Expertise in Social Data · Most Advanced and Secure

MOLOG Tech

We are Modern Logistic Platform, Specialize in WMS, OMS and TMS.

Data Wow Co.,Ltd

We enable our clients to realize increased productivity by solving their most complex issues by Data

LINE Company Thailand

LINE, the world's hottest mobile messaging platform, offers free text and voice messaging + Call

LINE MAN Wongnai

Join our journey to becoming No.1 food platform in Thailand

อยากรู้อย่างเดียวเลยคือ

Mediumrare Wed, 28/06/2023 - 09:34

อยากรู้อย่างเดียวเลยคือ ถ้าถามถึง "เรื่องนั้น" มันจะตอบว่าอะไร

มันก็ตอบตามข้อมูลสถิตินั่นแหล

akira Wed, 28/06/2023 - 12:15

มันก็ตอบตามข้อมูลสถิตินั่นแหล่ะ ถึงข้อมูลที่ AI เรียนรู้จะเป็น Text แต่ในทางการพิจารณาหรือตัดสินใจก็ยังใช้คณิตศาสตร์ ด้านสถิติอยู่ดี

เช่น
สิ่งของ A -> หาข้อมูลคำอธิบายหลักจากเว็บไซต์ที่น่าเชื่อถือ
นำสิ่งของ A ไปหาว่าเจอข้อมูลที่ไหนบ้าง แนวโน้มข้อมูลส่วนใหญ่มีทิศทางในทางใด ความสนใจในสิ่งของ A เป็นเช่นไร เพื่อเลือกทิศทางคำขยายความ ถ้าพบว่าสิ่งของ A เป็นของที่มีประโยชน์ มีคนชื่นชอบ มันก็จะไปหารายละเอียดในกลุ่มข้อมูลประโยชน์ของของชิ้นนั้นมาให้ เพื่อขยายข้ออธิบายหลักอีกที ลองไปหาต้นฉบับข่าว

ป๊อป ปองกูล เป็นสมาชิกวง BNK48 -> เหตุผลเพราะช่วงเวลาที่ ChatGPT รวบรวมข้อมูลมีข่าวป๊อป กับวง BNK48 เยอะ
หลอก ChatGPT ให้หาคีย์แท้ Windows 10 ให้ -> เขาหลอก ChatGPT โดยใช้จิตสำนึกพื้นฐานของมนุษย์ในการตอบสนองกับความผิดชอบชั่วดี ทางนักวิทยาศาสตร์คงใส่ไว้ในการจำแนก input เพื่อไปเข้าสมการ แต่ปัญหาคือ มี Bug ไม่ได้ตรวจสอบ output

คุณก็จะพอรู้วิธีการที่นักวิทยาศาสตร์ข้อมูลใช้สร้างข้อมูลออกมา วิทยาศาสตร์ข้อมูลไม่ใช่ไสยศาสตร์เขาคาดคะเนพฤติกรรมของมันได้ เรื่องภาษาศาสตร์ และสถิติล้วนๆ เลยล่ะ ChatGPT เนี่ย สิ่งที่นักวิทยาศาตร์ข้อมูลสนใจไม่ใช่คำอธิบาย แต่เป็นการจำแนกวัตถุทางภาษาศาสตร์ได้อย่างถูกต้องมากกว่า

ขอบคุณสำรับคำตอบสาระจริงจังคร

varshard Wed, 28/06/2023 - 12:43

ขอบคุณสำรับคำตอบสาระจริงจังครับ

เรื่องนั้นที่เขาพูดถึงน่าจะหมายถึงเรื่องจตุรัสเทียนอันเหมิน หรือเรื่องอื่นที่อาจมีการปิดกั้นโดยรัฐบาล

ถ้าเป็นเรื่องที่ต้องการ censor มันก็ทำได้อยู่ดีนี่ครับ ตั้งแต่เรื่องข้อมูลที่เอามา train หรือแม้แต่การดัก keyword ในคำถาม
แต่ที่เหลือก็ตามที่คุณตอบมาเลยครับ

ผมว่าไม่น่าเทียนอันเหมิน

akira Wed, 28/06/2023 - 16:15

ผมว่าไม่น่าเทียนอันเหมิน น่าจะ 112 มากกว่าถึงไม่กล้าระบุหัวข้อผมเลยต้องเลี่ยงยกตัวอย่างเป็นสิ่งของไปถ้าเขาเข้าใจหลักการเขาก็จะรู้เองว่ามันน่าจะได้ผลประมาณไหน ส่วนเรื่อง censor มันดัก input ได้ก็จริงแต่พอเข้า neural network เราคาดเดา route ที่มันวิ่งไม่ได้หรอกครับมันมหาศาล แต่เราพอคาดเดาผลลัพธ์ได้ กรณีคีย์ windows 10 ถ้าคุณเคยอ่านต้นฉบับมาก่อนจะเห็นวิธีการเลี่ยงการตรวจจับ input ของเขา

ไม่ว่าของจีน หรือของเมกา ไส้ในก็ core เดียวกันต่างแค่ภาษาที่ใช้ train ดังนั้นหลักการนี้ใช้คาดเดาผลเพื่อเปรียบเทียบได้ครับไมว่าจะเทียนอันเหมิน หรือ 112