Elon Musk และผู้เชี่ยวชาญด้าน AI คนอื่นๆ มองว่าข้อมูลในโลกจริง (real-world data) สำหรับการฝึกอบรมโมเดล AI เหลือให้ใช้ไม่มากแล้ว เพราะความรู้ของมนุษย์ที่สะสมมา ถูกนำมาใช้ในการฝึกอบรม AI หมดแล้ว
เหมือนกับที่ Ilya Sutskever อดีตหัวหน้านักวิทยาศาสตร์ของ OpenAI ที่เคยบอกว่าอุตสาหกรรม AI เข้าถึงจุดที่พีกของข้อมูล (peak data) แล้ว ซึ่งคาดว่าข้อมูลการฝึกอบรมที่มีน้อยลง จะทำให้ต้องเปลี่ยนวิธีการฝึกอบรมโมเดลในปัจจุบัน
แนวทางแก้ไขที่ Musk เสนอคือการใช้ข้อมูลสังเคราะห์ (synthetic data) หรือข้อมูลที่สร้างโดยโมเดล AI เอง บริษัทต่างๆ เช่น Microsoft, Meta, OpenAI และ Anthropic ได้นำแนวทางนี้ไปใช้แล้ว
ตรงกับที่ Gartner ประมาณการว่า 60% ของข้อมูลที่ใช้สำหรับการฝึกอบรม และวิเคราะห์โมเดล AI ในปี 2024 ถูกสร้างขึ้นแบบสังเคราะห์
แม้ว่าข้อมูลสังเคราะห์จะช่วยประหยัดต้นทุน และทำให้โมเดลเรียนรู้ด้วยตนเองได้อย่างต่อเนื่อง แต่ก็ทำให้โมเดลมีความคิดสร้างสรรค์น้อยลง และมีอคติมากขึ้น เนื่องจากข้อมูลสังเคราะห์ซึมซับอคติจากข้อมูลต้นแบบที่ถูกใช้ในการสังเคราะห์ข้อมูลใหม่ขึ้นมา
ที่มา: TechCrunch

on
นี่คือแนวคิดจากคนที่บอกว่ากลั
KuLiKo Fri, 10/01/2025 - 17:49
นี่คือแนวคิดจากคนที่บอกว่ากลัว AI ก่อนหน้านี้รึ
อันที่จริงที่บอกว่าหมดเป็นข้อ
tomyum Fri, 10/01/2025 - 17:53
อันที่จริงที่บอกว่าหมดเป็นข้อมูลตัวหนังสือ และภาพถ่าย และคลิปวีดีโอเป็นส่วนใหญ่แต่ยังมีข้อมูล spatial data หรือข้อมูลเชิงภูมิศาสตร์อีกมากที่เรายังไม่ได้โหลดเข้าระบบ หรือยังไม่อัพเดทให้ทันสมัยหรือละเอียดเพียงพอให้ AI เรียนรู้
แน่รึ
freeriod Fri, 10/01/2025 - 18:02
แน่รึ
ดูดทุกหยด ซดทุกเม็ด ..
tontpong Fri, 10/01/2025 - 18:17
ดูดทุกหยด ซดทุกเม็ด .. คุยกับเพื่อนบางเรื่องแบบลอยๆ , แป็บๆ โฆษณา มาละ 🥹
ไม่หมดครับ
tontan Fri, 10/01/2025 - 18:30
ไม่หมดครับ ภาษาไทยอีกหนึ่งอยู่ในเอกสารกระดาษจำนวนมาก แถมไม่แม้แต่จะเป็น PDF หรือ PDF สแกน 😔
ข้อมูลในโลกเท่าที่หาได้
raindrop Fri, 10/01/2025 - 18:47
ข้อมูลในโลกเท่าที่หาได้ และเท่าที่รู้สินะ เพราะผมเชื่อว่ามนุษย์ยังมีอะไรที่ไม่รู้อะไรอีกเยอะมาก
เขาเอาข้อมูลจากไหนมาเทรนมันกั
ponghahaha Fri, 10/01/2025 - 19:48
เขาเอาข้อมูลจากไหนมาเทรนมันกัน
ผมเองก็อยากรู้
sMaliHug Fri, 10/01/2025 - 22:04
ผมเองก็อยากรู้ จนตอนนี้มนุษยชาติไม่มีอะไรจะสอน Ai แล้ว เพราะที่สั่งสมแต่บรรพกาลมาก็สอนหมดแล้ว จนตอนนี้ทำไมยัง hashtags คำที่เว้นวรรคไม่ได้
ต้องส่งไปเทรนจากสถานการณ์จริง
TeamKiller Fri, 10/01/2025 - 23:37
ต้องส่งไปเทรนจากสถานการณ์จริงไหมนะ
ถ้าส่องข้อมูลทั้งหมดในอินเตอร
tgtong44 Sat, 11/01/2025 - 00:48
ถ้าส่องข้อมูลทั้งหมดในอินเตอร์เน็ตได้ การเทรดหุ้นคือสบายเลยแทบจะเป็นวงในของทุกบริษัทในโลก
นึกถึงฉากหนังเรื่องเครื่องบิน
wisidsak Sat, 11/01/2025 - 11:48
นึกถึงฉากหนังเรื่องเครื่องบิน Steal ดูดข้อมูลจาก internet
นึกถึงตอน AlphaGO
Hoo Sat, 11/01/2025 - 20:13
นึกถึงตอน AlphaGO
ตอนแรกก็เอาบันทึกหมากที่มนุษย์เดินให้มันเรียน
พอ AlphaGO Zero คือเดินกับตัวเองเพียวๆ
ไม่มี data จากคนเลย ดันโหดกว่า+โหดได้เร็วกว่าเดิมอีก 😱
ต่อไปหน้าที่มนุษย์คิด
may2190 Fri, 24/01/2025 - 17:23
ต่อไปหน้าที่มนุษย์คือ สร้างข้อมูล เพื่อไปเทรน AI 555