OpenAI

Chris Lehane ผู้บริหารด้านความสัมพันธ์ระหว่างประเทศของ OpenAI เปิดเผยว่าบริษัทเตรียมเปิดตัวฮาร์ดแวร์ AI ตัวแรกของบริษัทภายในครึ่งหลังของปี 2026 โดยทุกอย่างยังเป็นไปตามแผน

เมื่อปีที่แล้ว OpenAI ได้ซื้อกิจการ io Products บริษัทพัฒนาฮาร์ดแวร์ของ Jonathan Ive อดีตหัวหน้าฝ่ายออกแบบของแอปเปิล เพื่อร่วมกันพัฒนาฮาร์ดแวร์ AI ในรูปแบบใหม่ แต่ไม่มีรายละเอียดเปิดเผยออกมามากนัก

Lehane ปฏิเสธที่จะให้ข้อมูลฮาร์ดแวร์นี้เพิ่มเติมเช่นกัน รายงานที่เคยมีออกมาก่อนหน้านี้บอกเพียงฮาร์ดแวร์นี้จะมาในรูปแบบอุปกรณ์สวมใส่ เรียบง่าย ไม่มีหน้าจอ

ที่มา: Axios

Hiring! บริษัทที่น่าสนใจ

Carmen Software company cover
Carmen Software
Hotel Financial Solutions
Next Innovation (Thailand) Co., Ltd. company cover
Next Innovation (Thailand) Co., Ltd.
We are web design with consulting & engineering services driven the future stronger and flexibility.
KKP Dime company cover
KKP Dime
KKP Dime บริษัทในเครือเกียรตินาคินภัทร
Kiatnakin Phatra Financial Group company cover
Kiatnakin Phatra Financial Group
Financial Service
Fastwork Technologies company cover
Fastwork Technologies
Fastwork.co เว็บไซต์ที่รวบรวม ฟรีแลนซ์ มืออาชีพจากหลากหลายสายงานไว้ในที่เดียวกัน
Thoughtworks Thailand company cover
Thoughtworks Thailand
Thoughtworks เป็นบริษัทที่ปรึกษาด้านเทคโนโยลีระดับโลกที่คว้า Great Place to Work 3 ปีซ้อน
Iron Software company cover
Iron Software
Iron Software is an American company providing a suite of .NET libraries by engineer for engineers.
CLEVERSE company cover
CLEVERSE
Cleverse is a Venture Builder. Our team builds several tech companies.
Nipa Cloud company cover
Nipa Cloud
#1 OpenStack cloud provider in Thailand with our own data center and software platform.
Bangmod Enterprise company cover
Bangmod Enterprise
The leader in Cloud Server and Hosting in Thailand.
CIMB THAI Bank company cover
CIMB THAI Bank
MOVING FORWARD WITH YOU - CIMB is the leading ASEAN Bank
Bangkok Bank company cover
Bangkok Bank
Bangkok Bank is one of Southeast Asia's largest regional banks, a market leader in business banking
MuvMi (Urban Mobility Tech Co.,Ltd.) company cover
MuvMi (Urban Mobility Tech Co.,Ltd.)
Shape the future of urban mobility towards affordable, clean, and safe solutions
T.N. Digital Solution Co., Ltd. company cover
T.N. Digital Solution Co., Ltd.
TNDS has been involving in every first move of banking’s major digital transformation.
KBTG - KASIKORN Business-Technology Group company cover
KBTG - KASIKORN Business-Technology Group
KBTG - "The Technology Company for Digital Business Innovation"
Siam Commercial Bank Public Company Limited company cover
Siam Commercial Bank Public Company Limited
"Let's start a brighter career future together"
Icon Framework co.,Ltd. company cover
Icon Framework co.,Ltd.
Global Standard Platform for Real Estate แพลตฟอร์มสำหรับธุรกิจอสังหาริมทรัพย์ครบวงจร มาตรฐานระดับโลก
REFINITIV company cover
REFINITIV
The Financial and Risk business of Thomson Reuters is now Refinitiv
H LAB company cover
H LAB
Re-engineering healthcare systems through intelligent platforms and system design.
The Gang Technology Co., Ltd. company cover
The Gang Technology Co., Ltd.
We're a Digital Agency that helps our customers transform their business into digital with ease.
LTMH company cover
LTMH
LTMH มุ่งเน้นการพัฒนาผลิตภัณฑ์ที่สามารถช่วยพันธมิตรของเราให้บรรลุเป้าหมาย
Seven Peaks company cover
Seven Peaks
We Drive Digital Transformation
Wisesight (Thailand) Co., Ltd. company cover
Wisesight (Thailand) Co., Ltd.
The Best Choice For Handling Social Media · High Expertise in Social Data · Most Advanced and Secure
MOLOG Tech company cover
MOLOG Tech
We are Modern Logistic Platform, Specialize in WMS, OMS and TMS.
Data Wow Co.,Ltd company cover
Data Wow Co.,Ltd
We enable our clients to realize increased productivity by solving their most complex issues by Data
LINE Company Thailand company cover
LINE Company Thailand
LINE, the world's hottest mobile messaging platform, offers free text and voice messaging + Call
LINE MAN Wongnai company cover
LINE MAN Wongnai
Join our journey to becoming No.1 food platform in Thailand

ยากแล้วมั้งเนี่ย โดนบี้ซะเหลือทางแคบเลย แถมเผาแบงก์ไปไม่รู้เท่าไร แต่เชียร์ให้รอดนะ ไม่งั้นพี่กูครองโลกแน่

อีกค่อนปี , นานไปมั้ย .. มั่นใจแค่ไหน , ว่าข้อมูลจะไม่หลุด หรือกุเกิลไม่ทำตามแน่ๆ

กุเกิล มี เชื้อเพลิงเต็มกระเป๋า .. เผาเพื่อเร่งเครื่อง ได้เสมอ , รอแค่ รุ้พิกัดจุดหมาย

ถ้าไม่มีหน้าจอก็ลาก่อย

เพราะมนุษย์ยังไงก็ไว้ใจสิ่งที่ตาเห็นมากกว่า
ถ้าไม่มีหน้าจอเพื่อยืนยันตัวเลือก การใช้เสียงอย่างเดียวหรือการสั่น ต้องสั่งซ้ำหรือทวนคำตอบจนไม่ practical แน่ๆ

โดน ive ขายฝัน minimal อะดิ
แต่งาน ive ที่ไม่ผ่าน Steve Jobs กรอง ก็ไม่ต่างจากงานออกแบบนามธรรมที่มาก่อนฟังชั่น

ผมขอเห็นต่างนิดนึงนะ ถ้า OpenAI สามารถสร้าง AI ที่ปฏิสัมพันธ์กับเราโดยไม่ต้องใช้หน้าจอ ใช้เพียงบทสนทนาอย่างเดียว เหมือนที่มนุษย์คุยกันก็น่าสนใจดีนะครับ ส่วนการแสดงผลอาจใช้มือถือเป็นตัวแสดงผลก็ได้นิ ตัว HW ของ OpenAI ก็อาจเป็นแค่ตัวแปลความหมายประโยค แยก Entity และ relationship ของแต่ละ Entity จากนั้นก็หาสิ่งที่เราต้องการ แล้วส่งไปให้ Application บนมือถือ เพื่อให้เราโต้ตอบผ่านทั้งคำพูด และการใช้หน้าจอก็ได้ อันนี้ผมโลกสวยให้สุดแล้วนะ แต่ในทางกลับกัน OpenAI ก็ต้องตอบคำถามให้่ได้ก่อนว่าจะทำอย่างไรกับ AI ที่ออกแบบมาใช้สำหรับการสร้างประโยค และข้อมูล มากกว่าการควบคุมเครื่องมือแบบทาง Google รวมถึง platform และอุปกรณ์ที่รองรับ

จริงๆ ผมมีคำตอบในใจอยู่แล้วแหล่ะ เพียงแต่มันเหมาะกับการทำงานกับทีมเล็ก ที่เราควบคุมได้ตั้งแต่เริ่มต้น ระดับการออกแบบ ไม่ใช่การจับทีมขนาดใหญ่หันซ้ายหันขวา มันมีวิธีทำอยู่ ซึ่งผมว่าคนทำได้ก่อนน่าจะเป็น Google ซะมากกว่า ส่วนตัวผมมองว่า OpenAI มักคิดแบบรวมศูนย์ แต่ทาง Google มักคิดแบบแยกโหนดประมวลผล ซึ่งแบบหลังมันทำให้ยืดหยุ่นต่อการตัดต่อ ดัดแปลงพันธุกรรมมากกว่า

ตอนนี้ผมฟุ้งไปถึง AI จะมีภาษาที่ใช้พูดคุยระหว่างกันได้โดยไม่ต้องใช้ JSON แล้วล่ะ แบบสนทนากันแบบปรกติ โดยมันมองอุปกรณ์ต่างๆ ที่มีตัว interpreter ของภาษานี้คอยรับคำสั่ง อาจเป็นภาษาใหม่ที่มีโครงสร้างแบบภาษามนุษย์ แต่ทำให้ระบบคอมพิวเตอร์สามารถแยกองค์ประกอบของประโยคได้ง่ายกว่าการใช้่ภาษา programming ปรกติ ซึ่งคนเราก็อาจเรียนรู้ภาษาพวกนี้เพื่อสั่งงานมันได้ โดยไม่จำเป็นต้องไปรู้เรื่องการประกาศตัวแปร การ control flow การตั้งค่าอะไร เลยด้วยซ้ำ แต่อย่าคิดตามผมนะ 555 ผมก็เพ้อเจ้อไปเรื่อยๆ ตามแบบของผมนั่นแหล่ะ เหมือนผมจะเคยเขียนแนวคิดนี้ไว้ที่นี่ เมื่อหลายปีก่อนนี้แล้ว แต่ใช้คนละ account กับชื่อ account ปัจจุบัน

ปัญหาคือปัจจุบันนี้ Model speech to text ที่ใช้งานได้แบบถูกต้องจริง ๆ แบบไม่ต้องแก้เลย มันยังไม่พร้อมน่ะสิครับ

แล้วถ้าคุณไม่ใช่ภาษาหลักอย่าง อังกฤษ ฝรั่งเศส สเปน เค้าก็ไม่ได้ทุ่มพัฒนาให้คุณมาก
มาเจอภาษาไทย นี่ก็งานยากแล้ว แถม Ai ชอบตีความเอง บนหน้าจอถูกแล้ว Ai เปลี่ยนคำพูดใหม่ให้ผิดก็มี

เรื่องเทคโนโลยีของ OpenAi อันนั้นเชื่อว่าทำได้ ไม่มีอะไรต่างจากเดิม แต่ Speech to text ที่แม่นแบบไว้ใจได้จริง ๆ ยังไม่ถึงจุดนั้นครับ

ผมคิดว่าอุปกรณ์ชิ้นนี้ เป็นแค่ตัวรับ input แล้วส่งไปประมวลผลบนมือถืออยู่ดี ข้อดีคือ ยกข้อมือมาใกล้ปากแล้วพูด เสียงชัดขึ้น การทำนายคำถูกต้องแม่นยำขึ้น เดาล้วน ๆ แบบมีหลักการ

แต่ไม่มีหน้าจอ คุณจะรู้ว่า input ของคุณคืออะไรได้อย่างไร ถูกต้องหรือเปล่า คุณก็ต้องยก device อื่นมาดู แล้วเราจะมี device ตัวนี้ไปเพื่ออะไรละครับ เรายังฝันเหมือนนิยายวิทยาศาสตร์ไม่ได้ ที่สั่งงานคอมผ่านเสียงแล้วถูกต้องตรงเป๊ะขนาดนั้น

แล้วเวลาคุณคุยกับคนแปลกหน้าคุณได้รับ output เป็นข้อความบนหน้าจอมือถือหรือ ? สมองมันไม่ได้ Text to speech ทุกตัวอักษร แล้วแปลให้ถูกต้อง 100% เพื่อมาแสดงผล มันแค่จำแนกองค์ประกอบ และหาความสัมพันธ์ จากปัจจัยที่ประสาทสัมผัสได้รับ รวมถึงประสบการณ์ (data) ที่เคยได้จากคนที่พบ แล้วเอามาแปลความหมาย เพื่อตอบสนองต่อสิ่งเร้าตรงหน้า อันไหนไม่เคลียร์หรือไม่ชัดเจน มันก็จะถามกลับเพื่อให้เราให้ข้อมูลเพิ่มเติม เวลาคุณคุยกับคนตรงหน้า มันมี Speech Bubble ลอยเหนือหัวเขาหรือ ? (อันนี้ก็ไม่แน่ถ้าแว่นตา AR พัฒนาถึงจุดหนึ่งก็น่าจะมีใช้กันในอีกไม่นาน)

ไม่ได้จะขัดแต่คนแบบคุณผมเจอมาพอสมควร คือ อะไรก็ทำไม่ได้ ติดนู่น ติดนี่ไปหมด แล้วผมบอกเหรอว่าเขาใช้แค่อุปกรณ์ใหม่แค่ตัวเดียว การรับรู้ของมนุษย์มันประกอบด้วยประสาทสัมผัสมากมายเพื่อนำมาแปลผลลัพธ์สุดท้าย มันไม่ใช่อุปกรณ์วิเศษที่จะรู้ทุกอย่าง ถ้าคุณอ่านข้อความผมเข้าใจผมไม่ได้หมายความถึงแบบนั้นเลย แต่ถ้าอ่านไม่เข้าใจก็ไม่แปลกอะไรหรอก เพราะก็มีน้อยคนที่จะเข้าใจมัน เพราะเรามองกันคนละมุมมองกัน คุณมองเชิงเทคนิค และความเป็นไปได้ ผมมองถึงอนาคตที่มันควรจะเป็น มันยากที่จะ tune เข้ากันได้

Human–computer interaction เฉพาะเสียงยังมีปัญหาจริง ๆ นะครับ และยังไม่มีใครแก้ได้ เป็นข้อจำกัดในตอนนี้ ซึ่งอันนี้มันจริงครับ นอกจากนั้นมีประเด็นใหญ่อีกอัน มันดีกว่ายกทุกอย่างไปอยู่บนมือถืออย่างไร มือถือตอนนี้ OP มาก ๆ นะครับ ถ้าเราอยากได้ human-like ที่เป็นผู้ช่วย ขณะที่ทุกอย่างตอนนี้มันเพิ่งเริ่มต้นและยังไม่ได้เหมาะกับใช้งานจริงครับ (ออกจากห้องแล็บไม่นานเอามาโชว์แล้ว) ถ้าทำตอนนี้ ผมไม่เห็นทางเลยว่า OpenAI จะสามารถทำได้ ถ้าทำได้คงเป็น Google / Apple / samsung ครับ

จุดแข็งของ transformer คือ การ predict ประโยคล่วงหน้าก่อนที่เราจะพูดประโยคถัดไปด้วยซ้ำ ยิ่งคุณให้ข้อมูลเยอะ มันก็จะสามารถเข้าใจในสิ่งที่เราต้องการ คำว่าให้ข้อมูลเยอะ ไม่ได้หมายถึงเราจะต้องบอกเป็นคำพูด มันอาจจะมาจากประสาทสัมผัสอื่นๆ ที่เป็น sensor บนอุปกรณ์พกพาอื่น ประกอบกันด้วย

ส่วนตัวผมมองว่าอุปกรณ์ตัวนี้ น่าจะมี sensor อย่างน้อยก็คือ กล้อง ไมค์บันทึกเสียง และก็ลำโพง เป็นอย่างน้อย อาจมีระบบสัมผัสร่วมด้วยเพื่อใช้ในการตอบรับหากอยู่ในสถานะการณ์ที่ไม่ต้องการใช้เสียง ซึ่งอาจอยู่ในรูปเข็มกลัดขนาดเล็ก เอาแค่ขนาดเล็กก็ยากแล้ว แต่อันนี้ผมยืนยันว่าทำได้ เพราะมีอุปกรณ์ในจีนบางตัวทำได้อยู่แล้ว ตามที่ผมระบุ ในขนาดที่เล็กขนาดใกล้เคียงเข็มกลัดด้วย เพียงแต่ปัจจุบันมันมีน้ำหนักค่อนข้างมาก ต้องออกแบบเลือกใช้วัสดุเพื่อลดน้ำหนัก เพราะมันต้องเบาติดที่กระเป๋าเสื้อ หรือใช้แผ่นแม่เหล็กติดที่กระดุมเสื้อ โดยไม่ห้อยน่าเกลียด ฃ

ส่วนวิธีการ ถ้าเขาใช้วิธีการ stream เสียงเพื่อประมวลผลโดยตรง แล้วจับเอาเฉพาะรูปประโยค ไม่ใช้ทั้งประโยค โดยไม่ Speech to text ทุกคำพูด อาศัยการ predict จากคลังข้อมูลทางภาษาขนาดใหญ่ แล้วสรุปเป็นผลลัพท์ออกมาเลยว่าเราต้องการให้ทำอะไร ดังนั้นที่คุณบอกว่ามีปัญหาในการจัดการเสียง ผมก็ยังเชื่อว่าเขาจัดการได้ เพราะถ้า LLM ตัวไหนใช้พื้นฐานเป็น Transformer ผมก็ยังเชื่อว่าด้วยพื้นฐานของมันสามารถ predict ประโยคที่เราพูดได้แม่นยำ ใกล้กับที่เราต้องการ แล้วแยกตัวแประกอบเพื่อหาความเชื่อมโยงกับ data กลางใน cloud ไม่ใช่การทำ Speech to text ทุกตัวอักษรแน่นอน

และที่สำคัญถ้าคุณอาจ comments ตั้งแต่ต้นของผม ผมบอกไว้ตั้งแรกแล้วว่าคนที่จะทำได้คนแรกน่าจะเป็น Google มากกว่า ด้วยความพร้อมด้านองค์ประกอบต่างๆ แต่ OpenAI อาจอะไรสร้างบางอย่างขึ้นมาจาก project นี้ก็ได้ โดยเฉพาะในด้าน software เพียงแต่เวอร์ชั่นแรกกยังคงไม่ประสบความสำเร็จอย่างมีนัยสำคัญแน่นอน ผมมักเชียร์คนที่มีความตั้งใจเสมอแหล่ะ ถึงแม้จะรู้ว่าผลลัพธ์สุดท้ายเขาอาจไม่ได้อยางหวัง แต่อย่างน้อยเขาก็ยังได้ทำ

จุดแข็ง transformer จริง ๆ มันก็เป็นจุดอ่อนของ transformer เองนะครับ ไม่น่าจะถือว่าดีกว่าโมเดล architecture อื่น ๆ ด้วยซ้ำ ถ้าพวก multimodal model ที่มาจาก transformer ไม่สามารถเอา encoder ออกไปได้ (เอา voice encoder ออกจากโมเดล LLM ออกไป ให้เป็นก้อนเดียวกันทั้งหมดที่ใช้ได้จริง) ผมว่าอีกห่างไกล เรายังต้องการ architecture อื่นที่จะมาตอบโจทย์ gap ความฉลาดตรงนี้นะครับ นี่พวกนี้ไม่จำเป็นต้องเป็น speech recognition ด้วยซ้ำ ไม่ต้องแปลงเป็นข้อความก่อน แต่ก็จะเจอกำแพงนี้อยู่ดีครับ แนะนำอ่านเพิ่มเติมที่ Yann LeCun พูดถึง transformer ดูนะครับ ยังไงกำแพงดังกล่าวก็ยังคงอยู่ ถ้าไม่มี architecture ใหม่ สุดท้ายมันอาจจะตันแค่นี้ก็ได้ครับ

ประโยคส่งท้าย transformer ไม่ได้ทำแค่ predict ประโยคล่วงหน้าก่อนนะครับ

ปล2. เผื่อมีผู้รู้มาอ่าน คือ ผมย่อยคำกับเทคนิคให้คนสายอื่น ๆ อ่านได้เข้าใจง่าย ๆ ดังนั้นคอมเม้นนี้คำอธิบายเชิงเทคนิคกับของบางอย่างถูกย่อย ถูกข้าม ถูกเปลี่ยนชื่อ เพื่อให้คนนอกสายเข้าใจนะครับ แต่อาจไม่ได้ถูกต้องทั้งหมดแต่เพื่อการสื่อสาร

อ่อ นิดนึง เดี๋ยวจะเข้าใจคนละอย่างแบบอีกท่านนึง หากคุณคิดว่าต้อง Speed to text เป็น Text ทุกตัวอักษรก่อน แล้วจึงค่อยไปแปลความต้่องการ อันนี้คุณไปคนละทางกับผมแล้ว

แต่ถ้าคุณคิดว่า ระหว่างที่คุณกำลังพูด ระบบมันจะ predict ไปล่วงหน้าว่ามีความน่าจะเป็นว่าประโยคต่อไปคุณจะพูดอะไร ซึ่งจะได้ชุดข้อมูลออกมาชุดนึงมาเป็นตัวเลือกในสมองของ AI จากนั้นดูข้อมูลจาก sensor และ data ของสิ่งที่มันเห็นตรงหน้าจากกล้อง แล้วตัดความน่าจะเป็นที่ไม่ใช่ทิ้่งไป เรื่อยๆ ตามรูปประโยคที่คุณพูดเพิ่ม แล้วรับข้อมูลไปเรื่อยๆ จนสุดท้ายได้ความน่าจะเป็นสุดท้ายมาใช้เพื่อยืนยันกับคุณเมื่อคุณพูดจบประโยค นั่นแหล่ะคือสิ่งที่ผมต้องการจะสื่อ แต่บอกไว้ก่อนนะว่ายังไม่มีระบบที่ไหนในโลกทำได้แบบนี้ที่จับต้องได้ แต่ถ้ามองจากเทคโนโลยีที่มีอยู่ หาคนเก่งๆ ที่รวมกันในจุดหนึ่งมาประกอบร่างเทคโนโลยีนี้ มันก็มีความเป็นไปได้ ซึ่งวิธีนี้ผมเลียนแบบจากพฤติกรรมของมนุษย์ ไม่ได้มาจากเทคโนโลยีที่มีในปัจจุบัน ต้องเข้าใจตรงนี้ก่อน ถึงจะคุยกับผมรู้เรื่อง เพราะโดยปรกติผมจะพูดกับคนทั่วไปไม่ค่อยจะมีใครเข้าใจสิ่งที่ผมพูดหรอก ดังนั้นถ้าคุณเคยพบตัวผม จะพบว่าผมจะไม่พูดอะไร แต่จะนั่งฟังคุณพูด ถ้าถูกใจจะถาม ถ้าไม่ถูกใจผมก็จะลุกเดินออกไปจากที่นั้นก็แค่นั้น

*** แก้ไขหน่อย ตรงไหนที่ผมอ้างอิงถึง TTS ไม่ใช่นะ ผมหมายถึง Speech to text ไม่ได้เขียนโปรแกรมนานสับสนในศัพท์เทคนิคนิดหน่อย

ผมไม่ได้หมายถึง Speed to text เป็น Text ทุกตัวอักษรก่อน สักหน่อยนะครับ ถ้าคุณอ่านแบบดู user นะครับ

ระบบมันจะ predict ไปล่วงหน้าว่ามีความน่าจะเป็นว่าประโยคต่อไปคุณจะพูดอะไร

ไม่ใช่กับทุกโมเดลนะครับ

ผมหมายถึง Human–computer interaction (HCI) เฉพาะเสียงทั้งก้อนเลยครับ ที่คอมพิวเตอร์โต้ตอบกับมนุษย์ด้วยเสียงที่เป็นแกนกลางเลยครับ

อันนี้เป็นคำถามนะ ไม่ได้เกี่ยวอะไรกับ thread ที่คุยมา หรือจะกวนประสาทอ่ะไร เพราะโดยธรรมชาติผมไม่ได้ลงลึกทางเทคนิคอะไรมาก มันคือ ความไม่รู้ส่วนตัวของผม

ถ้าเสียงยังไม่ใช่คำตอบของวิธีการ หากเราใช้วิธีจับจากข้อความที่พิมพ์ลงไปเพื่อสื่อสารกับ AI จะดีกว่าหรือไม่ ?

ผมกำลังพยายามทำความเข้าใจว่า ปัญหาอยู่ตรงไหน ระหว่างการแปลข้อความเสียง กับวิธีการเลือกเส้นทางการตัดสินใจด้วย input แบบอื่น หรือทั้งสองอย่างก็มีปัญหาทั้งคู่ จากข้อจำกัดของเทคโนโลยีปัจจุบัน

ผมไม่รู้นะ ว่าคุณเก่งมาจากไหน

แต่ผมใช้อยู่ทุกวัน ผมรู้ข้อจำกัดมันดี เวลาเรา input ข้อความด้วยเสียง แล้วมันแปลข้อความเสียงผิด แล้วข้อความที่มันเอาไปประมวลผลต่อมันเละไปหมด มันผิดเรื่องไปเลย แล้วผมก็บอกว่า ผมเดาอย่างมีเหตุผล ผมคิดว่า hardware มันเอาไว้รับเสียง ส่งไปประมวลผลต่อบน Ai ซึ่งมันคือสิ่งที่ผมเจอปัญหาทุกวันนี้

แล้วนี่ หลงไปไหนแล้ว เราพูดถึงอุปกรณ์เชื่อมต่อกับ Ai ไปลากอะไร คุยกับคนแปลกหน้ามาเกี่ยว นี่พูดถึงการ input Ai เกี่ยวอะไรกับสมองคน

ผมชักงงแล้วว่า คุณเป็นคนเก่งมาก ๆ หรือคุณไม่เคยใช้งานจริงกันแน่ ถึงไม่รู้ว่าทุกวันนี้ ปัญหามันอยู่ตรงไหน

โอเค ผมไม่คุยกับคุณแล้วแหล่ะ เสียเวลา คุยกับคุณก็คงไม่ได้ความรู้อะไรเพิ่มเติม คุณยังเอาเทคนิคในปัจจุบัน ไปบรรยายสิ่งที่จะเกิดขึ้นในอนาคต ซึ่งมันเกิดจากการที่ระบบต้องเรียนรู้จากพฤติกรรมของมนุษย์ ไม่ใช่เอาเทคโนโลยีในปัจจุบันไปบรรยายว่ามันควรทำไม่ได้เพราะปัจจุบันมันทำไม่ได้

อุปกรณ์ที่มีหน้าจอและพกพาได้มีแค่แว่นกับมือถือเท่านั้นถ้ามีอีกอย่างมันไม่สะดวกที่จะพกพาแล้ว(นอกจากจะออกแบบได้เทพจริงจนต้องทิ้งมือถือ)
แต่แว่นต้องมาพร้อมแหวนหรือ gesture ต้นทุนสูงเทคโนโลยียังไม่พร้อม
ดังนั้นต้องเป็นอุปกรณ์ไม่มีหน้าจอที่ทำงานร่วมกับมือถือ รับinputเป็นเสียงกับกล้องรับภาพ+วีดีโอoutputเป็นเสียงกับแอพในมือถือน่าจะลงตัวที่สุดเพราะขนาดเล็กน้ำหนักเบาไม่มีต้นทุนส่วนแสดงผลมีโอกาสจะmassได้มากกว่า