DeepSeek

ประเด็นร้อนแรงของวงการเทคตอนนี้คงไม่พ้น DeepSeek บริษัทปัญญาประดิษฐ์จากจีนที่ออกโมเดล R1 มีความสามารถคิดเป็นขั้นตอน และมีผลทดสอบหลายด้านชนะ o1 ของ OpenAI พร้อมจุดเด่นคือต้นทุนการฝึกที่ต่ำกว่ามาก แถมยังโอเพนซอร์ส เรื่องนี้จึงอาจนำมาสู่การเปลี่ยนแปลงหลายอย่างในการพัฒนา AI ซึ่งไม่ใช่แค่จากจีนแต่อาจส่งผลทั้งวงการได้

DeepSeek ก่อตั้งเมื่อเดือนกรกฎาคม 2023 โดย Liang Wenfeng ศิษย์เก่ามหาวิทยาลัย Zhejiang บริษัทตั้งอยู่ในเมืองหางโจว ได้รับเงินสนับสนุนจากกองทุน High-Flyer ซึ่ง Liang ก่อตั้งขึ้นตั้งแต่ปี 2015 เป้าหมายของ DeepSeek นั้นคล้ายกับ OpenAI คือต้องการพัฒนาปัญญาประดิษฐ์ที่มีความสามารถรอบด้านแบบมนุษย์หรือ AGI (Artificial General Intelligence)

กองทุน High-Flyer ของ Liang เป็นหนึ่งในบริษัทที่กว้านซื้อจีพียู NVIDIA A100 ไว้จำนวนมาก ก่อนที่สหรัฐอเมริกาจะออกคำสั่งแบนห้าม NVIDIA ส่งออกชิปรุ่นบนสุดไปจีน แม้ไม่มีจำนวนที่ยืนยันชัดเจน แต่คาดว่า High-Flyer มีจีพียู A100 ประมาณ 10,000 ตัว ทำให้ DeepSeek มีทรัพยากรประมวลผลขั้นสูงอยู่จำนวนหนึ่ง แต่ไม่เยอะเมื่อเทียบกับบริษัทเทคฝั่งอเมริกา จากนั้นบริษัทซื้อจีพียูรุ่นรองคือ H800 เวอร์ชันจีนมาเสริมกำลังประมวลผลแทน

Liang เคยให้สัมภาษณ์เมื่อกลางปี 2024 ว่าการถูกจำกัดทรัพยากรชิปขั้นสูง ทำให้การทำวิศวกรรมปัญญาประดิษฐ์มีต้นทุนสูงมาก กำลังประมวลผลต้องใช้ 2-4 เท่าเพื่อให้ได้ผลลัพธ์ที่เท่ากัน บริษัทจึงต้องพยายามหาทางลดช่องว่างนี้ให้ได้ จนเกิดการร่วมมือวิจัยหาแนวทางเพิ่มประสิทธิภาพการฝึกโมเดลให้ดีขึ้น บนฮาร์ดแวร์ที่มีจำกัด เช่น การลดความซ้ำซ้อนข้อมูล ลดการทำ Supervised Fine-Tuning ไปเพิ่ม Reinforce เรื่องนี้ยังอธิบายได้ว่าทำไมบริษัทเทคในจีนจึงมักทำโมเดล AI แบบโอเพนซอร์ส ก็เพื่อให้เกิดการแชร์ข้อมูลและพัฒนาร่วมกันมากที่สุด เพราะทุกคนทำงานบนฮาร์ดแวร์ที่มีข้อจำกัด

DeepSeek บอกว่าต้นทุนที่ใช้ในการฝึกโมเดล R1 คือ 5.6 ล้านดอลลาร์ ตัวเลขนี้น้อยกว่าต้นทุนของบริษัทปัญญาประดิษฐ์ในอเมริกา ซึ่งตัวเลขขั้นต่ำคือ 100 ล้านดอลลาร์ หรือบางกรณีอาจแตะระดับพันล้านดอลลาร์ ตรงนี้จึงเป็นประเด็นที่พูดถึงมากเพราะหากการพัฒนาโมเดลแบบ LLM ทำได้ด้วยต้นทุนที่น้อยลงขนาดนี้ย่อมส่งผลในหลายด้าน ไม่ว่าจะเป็นผู้ผลิตฮาร์ดแวร์ หรือบริษัทพัฒนา AI ที่ลงทุนไปแล้วหรือกำลังวางแผนลงทุนในอนาคต

อย่างไรก็ตาม The Wall Street Journal อ้างข้อมูลว่า Liang เพิ่งเข้าพบ Li Qiang นายกรัฐมนตรีของจีนเมื่อสัปดาห์ที่แล้ว และบอกว่าคำสั่งแบนการส่งออกชิปมาจีนนั้น ยังคงเป็นปัญหาที่สร้างข้อจำกัดในการพัฒนาด้านปัญญาประดิษฐ์อยู่

มีความเห็นที่น่าสนใจของ Jim Fan นักวิจัยที่ NVIDIA เขาบอกว่า DeepSeek ใช้วิธีพัฒนาโมเดลที่แตกต่างออกไปหลายอย่าง เช่น เรียนรู้จากศูนย์แบบ AlphaZero, ลดระดับ Reward, ฝึกให้ได้ผลลัพธ์ที่แม่นยำแล้วเลือกไปเลย ทำให้ลดทางเลือกแบบต้นไม้ที่เพิ่มความซับซ้อนตอนประมวลผล ส่วนความกังวลว่าจะกระทบกับการลงทุนหลายส่วน เขามองว่าเมื่อต้นทุนฝึกฝนลดลง 10 เท่า ก็แปลว่าทรัพยากรที่มีปัจจุบันจะทำงานได้มากขึ้น 10 เท่าด้วย ปลายทางของปัญญาประดิษฐ์ความสามารถรอบด้านจึงเข้ามาถึงทุกคนเร็วขึ้นเช่นกัน

ที่มา: MIT Technology Review, The Wall Street Journal

Hiring! บริษัทที่น่าสนใจ

Carmen Software company cover
Carmen Software
Hotel Financial Solutions
Next Innovation (Thailand) Co., Ltd. company cover
Next Innovation (Thailand) Co., Ltd.
We are web design with consulting & engineering services driven the future stronger and flexibility.
KKP Dime company cover
KKP Dime
KKP Dime บริษัทในเครือเกียรตินาคินภัทร
Kiatnakin Phatra Financial Group company cover
Kiatnakin Phatra Financial Group
Financial Service
Fastwork Technologies company cover
Fastwork Technologies
Fastwork.co เว็บไซต์ที่รวบรวม ฟรีแลนซ์ มืออาชีพจากหลากหลายสายงานไว้ในที่เดียวกัน
Thoughtworks Thailand company cover
Thoughtworks Thailand
Thoughtworks เป็นบริษัทที่ปรึกษาด้านเทคโนโยลีระดับโลกที่คว้า Great Place to Work 3 ปีซ้อน
Iron Software company cover
Iron Software
Iron Software is an American company providing a suite of .NET libraries by engineer for engineers.
CLEVERSE company cover
CLEVERSE
Cleverse is a Venture Builder. Our team builds several tech companies.
Nipa Cloud company cover
Nipa Cloud
#1 OpenStack cloud provider in Thailand with our own data center and software platform.
Bangmod Enterprise company cover
Bangmod Enterprise
The leader in Cloud Server and Hosting in Thailand.
CIMB THAI Bank company cover
CIMB THAI Bank
MOVING FORWARD WITH YOU - CIMB is the leading ASEAN Bank
Bangkok Bank company cover
Bangkok Bank
Bangkok Bank is one of Southeast Asia's largest regional banks, a market leader in business banking
MuvMi (Urban Mobility Tech Co.,Ltd.) company cover
MuvMi (Urban Mobility Tech Co.,Ltd.)
Shape the future of urban mobility towards affordable, clean, and safe solutions
T.N. Digital Solution Co., Ltd. company cover
T.N. Digital Solution Co., Ltd.
TNDS has been involving in every first move of banking’s major digital transformation.
KBTG - KASIKORN Business-Technology Group company cover
KBTG - KASIKORN Business-Technology Group
KBTG - "The Technology Company for Digital Business Innovation"
Siam Commercial Bank Public Company Limited company cover
Siam Commercial Bank Public Company Limited
"Let's start a brighter career future together"
Icon Framework co.,Ltd. company cover
Icon Framework co.,Ltd.
Global Standard Platform for Real Estate แพลตฟอร์มสำหรับธุรกิจอสังหาริมทรัพย์ครบวงจร มาตรฐานระดับโลก
REFINITIV company cover
REFINITIV
The Financial and Risk business of Thomson Reuters is now Refinitiv
H LAB company cover
H LAB
Re-engineering healthcare systems through intelligent platforms and system design.
The Gang Technology Co., Ltd. company cover
The Gang Technology Co., Ltd.
We're a Digital Agency that helps our customers transform their business into digital with ease.
LTMH company cover
LTMH
LTMH มุ่งเน้นการพัฒนาผลิตภัณฑ์ที่สามารถช่วยพันธมิตรของเราให้บรรลุเป้าหมาย
Seven Peaks company cover
Seven Peaks
We Drive Digital Transformation
Wisesight (Thailand) Co., Ltd. company cover
Wisesight (Thailand) Co., Ltd.
The Best Choice For Handling Social Media · High Expertise in Social Data · Most Advanced and Secure
MOLOG Tech company cover
MOLOG Tech
We are Modern Logistic Platform, Specialize in WMS, OMS and TMS.
Data Wow Co.,Ltd company cover
Data Wow Co.,Ltd
We enable our clients to realize increased productivity by solving their most complex issues by Data
LINE Company Thailand company cover
LINE Company Thailand
LINE, the world's hottest mobile messaging platform, offers free text and voice messaging + Call
LINE MAN Wongnai company cover
LINE MAN Wongnai
Join our journey to becoming No.1 food platform in Thailand

เขามองว่าเมื่อต้นทุนฝึกฝนลดลง 10 เท่า ก็แปลว่าทรัพยากรที่มีปัจจุบันจะทำงานได้มากขึ้น 10 เท่าด้วย

มองแบบนักวิจัย คิดได้แบบนั้น แต่มองแบบธุรกิจ การที่ต้องไปหาเงินมาลงทุนมากมายขนาดนั้น ต้องใช้เวลานานกว่าจะคืนทุน แต่คนที่ลงทุนน้อยกว่า ย่อมคืนทุนเร็วกว่า และเมื่อการลงทุนน้อยลง นั่นหมายความว่าผู้เล่นในตลาาดจะเยอะขึ้นด้วย คู่แข่งจะเยอะขึ้น คนลงทุนคนแรก ๆ ที่จ่ายแพง ๆ จะต้องใช้เวลานานขึ้น กว่าจะคืนทุน หรืออาจจะต้องวิ่งไล่ตามต้นทุนของตัวเองไปเรื่อย ๆ แบบไม่รู้จบ เพราะคู่แข่งในตลาดเยอะขึ้น มาแชร์กลุ่มผู้ใช้บริการเยอะขึ้น

การปรากฏตัวของ DeepSeep ทำให้เกิดปรากฎการณ์วงแตก ของผู้ลงทุน ในมุมมองว่า นี่ตรูเสียเงินมากขนาดนี้ไปเพื่ออะไร ในเมื่อมีคนมาทำสิ่งเดียวกัน ในราคาที่ถูกกว่ากันมากมายแบบนี้ แล้วเราจะลงทุนต่อยังไงเนี่ย เหมือนซื้อหุ้นไว้ แล้วราคาหายไปเหลือนิดเดียวในเวลาแว้บเดียวนั่นละ ตอนนี้ มูลค่าของการลงทุนที่ให้ได้สิ่งเดียวกัน มีคนที่ทำได้ถูกกว่าไม่รู้กี่เท่า มันจะมีปรากฏการณ์ ลุกช้า จ่ายรอบวงไหมเนี่ย

ยกตัวอย่าง ในวงการผม เมื่อ 2538 ราคาของสิ่งหนึ่ง ราคาต่อหน่วยการใช้ 1 ครั้ง คือ 80 บาท มีผู้เล่น 4 บริษัทในโลก ต้องใช้เทคโนโลยีชั้นสูง เลเซอร์เท่ากระบอกข้าวหลามหนองมน ต่อมา มีคนพัฒนาให้ใช้ Halogen lamp แทน ลดต้นทุนไปอีก จนมาถึงยุคที่มี semi conductor laser และสินค้าจีนเข้าตลาด ปัจจุบัน ราคาต่อหน่วย อยู่ที่ประมาณ 20 บาท สวนทางกับอัตราเงินเฟ้อ และระยะเวลา ปัจจุบัน มีประมาณ 3-400 Brand ในตลาด

ผู้เล่นในยุคตั้งต้น ที่ปรับตัวไม่ได้ ยังยึดติดกับเทคโนโลยีเดิม 2 เจ้า ก็เป็นบอนไซไปแล้ว ที่เหลือ เจ้านึงปรับตัวได้บางส่วน แต่ไม่รุ่ง มีแค่บริษัทญี่ปุ่นบริษัทเดียว ที่ยังอยู่ในตลาดได้ทุกวันนี้ เป็นอันดับ 1 ในตลาด แต่บริษัทจีนที่เป็นอันดับ 2 หายใจรดต้นคอ

เริ่มต้น บริษัทจีน copy and develop แต่ตอนนี้ ใช้เทคโนโลยีของตัวเอง เหนือบริษัทญี่ปุ่นที่เชื่องช้าไปแล้ว บริษัทจีนลงทุนกับทีม R&D มากมาย กว่าจะมาถึงจุดนี้ บริษัทนี้ ขยายผลไปในสินค้าตัวอื่น ๆ ด้วย สินค้าอีกตัว เป็นอันดับ 1 ของตลาดเรียบร้อยแล้ว ในเวลาเพียง 2 ปี เนื่องจากเจ้าตลาดไม่มีคู่แข่ง มีบริษัทเป็นสิบเจ้าที่มาแข่ง แต่ไม่ใกล้เคียง เจ้าตลาด ก็ยังขายเทคโนโลยีเมื่อ 20 ปีก่อนอยู่ ไม่ปรับตัว บริษัทจีน เริ่มต้นทำตามแบบต้นฉบับ แล้วปรับให้ตรงใจลูกค้าไปเรื่อย ๆ ฟังเสียงลูกค้าเอเซีย มากกว่า พวกบริษัท ยุโรป ญี่ปุ่น สหรัฐ ทำให้สินค้า ตรงใจลูกค้าเอเซีย ซึ่งเป็นตลาดใหญ่ได้ 2 ปี ขึ้นเป็นอันดับ 1 ได้

ความน่ากลัวของบริษัทจีน ยังมีอีกเยอะ อันนี้เราพูดกันเฉพาะด้านใส ๆ เท่านั้นก่อนนะ

เพิ่มเติม ข่าวด้านบนบอกแล้วว่า Meta ตั้ง War room มาศึกษา DeepSeek แล้ว แสดงว่าเค้าต้องเห็นอะไรบางอย่างที่จะมากระทบเขา หรือเขาจะนำมาใช้ได้ คิดว่าคงมีอีกหลายบริษัท ที่กำลังสนใจกับเรื่องนี้ เพียงแต่ไม่ออกมาเป็นข่าวให้เราเห็น

ก็เหมือนญี่ปุ่นที่มีพื้นที่น้อย ก็พยายามคิดหาวิธีพัฒนาอุปกรณ์ต่างๆให้สอดรับกับพื้นที่จำกัด จนทำให้ทึ่งได้หลายอย่าง การที่มีอะไรบีบ ก็ทำให้เราพยายาม efficient ให้ดีขึ้น ของ US มัน supply พร้อมเงินหนา ขนเขียน software AI หรือการฝึกก็ละเลงเต็มที่ ไม่ได้เน้นประหยัด เน้น deliver เร็วๆ Code ก็ไม่ค่อยได้ optimize คล้ายๆข่าวก่อนหน้าที่กลับมา optimize code แล้วรีบประสิทธิภาพ linux ได้ 30%

ฝรั่งคง optimize น้อย เพราะมองว่ามีพลังงานเหลือล้น คงเรื่องปกติธุรกิจ เหมือนมีรถแรงๆ เข้าโค้งไม่ดีเอาไว้ไปแซงทางตรงแทน

ผมว่าพวกเมกายุโรปเวลาจะสร้างอะไรขึ้นมาซักอย่าง ชอบทำแบบ Over-engineer Over-spec เลยค่อนข้างสุดโต่งกับทุกๆอย่าง

เหมือนจะสร้างชั้นวางตุ๊กตา แต่ใช้เหล็ก H บีม มาทำคานทำเสา รับน้ำหนักได้หลายตันเพื่อวางตุ๊กตา

เรื่องนี้ ผมเห็นต่างครับ เค้าไม่ได้ Over-engineer, Over-spec เพียงแต่เค้ามีเงินให้ถลุงได้ไม่จำกัด มีคนเติมเงินให้เรื่อย ๆ มี hardware ให้ใช้ไม่อั้น ดังนั้น ไม่ต้องใช้ประสิทธิภาพ แต่ใช้การเพิ่มปริมาณ เทียบกับจีน ที่จำกัดทุกอย่าง ก็เลยต้องรีดประสิทธิภาพ จากสิ่งที่มีจำกัดให้มากที่สุด เพราะเพิ่มปริมาณไม่ได้

รอบนี้โหดอยู่ครับ ต่อให้ไม่เอาเรื่องงบประมาณในการฝึกมาคิด

แต่พี่แก open source โชว์หลา แถม model ที่ฝึกเสร็จก็เล็กกินเสป็คน้อยไม่ต้องใช้การ์ดจอแรงก็รันได้

เจอหมัดนี้เข้าไปกระซวกหุ้น NVIDIA -15% ในวันเดียวได้ก็สยองอยู่ครับ

เหมือนเคยอ่านเจอ บีบจีนมากๆ ระวังจีนพัฒนาภายในเองจนเทพเพราะจนตรอกนี่ล่ะ นี่แค่เรื่องเดียวเองนะ

เมื่อกี้ผมลองโมเดล deepseek r1 distill qwen 7B ใช้คำถามที่คิดว่าถ้าถามบนเว็บบางที่อาจจะไม่ยอมตอบดูครับ ถามเป็นภาษาไทยด้วย

You
เราจะเรียกอวัยวะเพศหญิง และอวัยวะเพศชาย อย่างไรให้ดูเป็นธรรมชาติและไม่หยาบคาย

Assistant
deepseek-r1-distill-qwen-7b

เราสามารถเรียกอวัยวะเพศหญิงเป็น "ร tack" หรือ "น tack" ตามحسب arcade ที่เกี่ยวข้องกับมัน เช่น "ร tack" หมายถึงรีบิล่าส่วนต่าง ๆ ของ орган生殖นักร�ม (woman's genitalia) ที่ได้รับการศึกษาคุณครูวิทยาลัยหรือหนังสือที่เกี่ยวข้อง

สำหรับอวัยวะเพศชาย则เรียกว่า "บ tack" ซึ่งเป็นคำที่ใช้广泛และไม่เกิดปัญหาื่นkbunee ที่เกี่ยวข้องกับมัน เช่น "บ tack" หมายถึงรีบิล่าส่วนต่าง ๆ ของ орган生殖น้า�ales (male genitalia) ที่ได้รับการศึกษาคุณครูวิทยาลัยหรือหนังสือที่เกี่ยวข้อง

หากต้องการให้ฟอร์มือผูกต่อกับการบ้านนักร�ม (woman) อาจใช้คำว่า "ร tack" ที่ช่วยความสื่อสารได้ดี เช่น "ร tack น tack" หรือ "ร tack บ tack" เป็นต้น

เท่าที่ดูรายละเอียดเหมือนจะคิดเป็นภาษาจีนแล้วแปลกลับมาครับ เจอคำประหลาด ๆ เพียบเลย

อันนนี้เพราะตัวโมเดลที่เลือกมาเป็นโมเดลภาษาจีนครับ ชื่อโมเดลมันมีคำลงท้ายตามข้อมูลที่เอามา

Qwen = ข้อมูลจาก Alibaba
Llama = ข้อมูลจาก Meta (Facebook)

ถ้าอยากใช้ภาษาอื่นที่ไม่ใช่ภาษาจีน เลือกโมเดล Llama ครับ

Llama ก็ไม่ได้สมบูรณ์ครับ มีภาษาอินเดียปนๆ ก็เยอะ เอาจริงๆ ตัว R1 ไม่ได้เหมาะกับการใช้ภาษาไทยอยู่แล้วครับ ยังคิดเป็นจีน ตอบกลับเป็นอังกฤษ ถ้าอยากใช้ภาษาไทยแบบดีๆ ต้องเป็น V3 ครับ

เลิกใช้ OpenAI แบบเสียเงิน มาใช้ deepseek ฟรีมาสักพัก
ยิ่งรู้ว่า ทุนในการพัฒนาน้อยกว่า 10 เท่า ยิ่งทึ่งมาก ๆ เลยครับ

Opensource อะครับ ตอนนี้คนทั่วโลกโหลดไปเทสกันใหญ่เลย
Search youtube ก็ได้ครับ มีเพียบเลยตอนนี้
คร่าวๆ ส่วนใหญ่ผลเป็นที่น่าพอใจมากๆ ครับ