Google Deepmind โชว์การใช้โมเดล Gemini 2.5 Flash-Lite รุ่นเล็กตัวล่าสุดที่เพิ่งเปิดตัว เขียนโค้ด UI ของซอฟต์แวร์ โดยเป็นการสร้าง UI ขึ้นมาใหม่แบบเรียลไทม์ โดยไม่ต้องสั่งการใดๆ สิ่งที่ Gemini ทำคืออ่านหน้าจอก่อนคลิกไฟล์ แล้วสร้าง UI ของหน้าถัดไปขึ้นมาให้อัตโนมัติ ตอนที่เราคลิกไฟล์นั้นๆ
การสร้าง UI แบบ generate อัตโนมัติแบบนี้ยังมีข้อจำกัดอย่างที่แสดงในคลิป เช่น การกดไอคอนโฟลเดอร์เพื่อเข้าไปดูในโฟลเดอร์ 2 รอบจะเห็นหน้าตา UI ไม่เหมือนกัน
ถึงแม้เดโมนี้เป็นแค่การทดลองและยังไม่พร้อมสำหรับงานโปรดักชัน แต่มันก็แสดงให้เห็นความสามารถของ Gemini (โดยเฉพาะเรื่องความเร็วในการตอบ) ที่สามารถทำงานลักษณะนี้ได้แล้ว
Here's how Gemini 2.5 Flash-Lite writes the code for a UI and its contents based solely on the context of what appears in the previous screen - all in the time it takes to click a button. 💻 ↓ pic.twitter.com/19aq0BDyAS
— Google DeepMind (@GoogleDeepMind) June 19, 2025
on
ก็กำหนด prompt ไว้แล้ว…
comdevx Mon, 23/06/2025 - 17:47
ก็กำหนด prompt ไว้แล้ว แปลกตรงไหน
น่าจะใหม่ตรงที่ Gemini 2.5…
zyzzyva Mon, 23/06/2025 - 18:18
In reply to ก็กำหนด prompt ไว้แล้ว… by comdevx
น่าจะใหม่ตรงที่ Gemini 2.5 Flash-Lite generate ได้ไวพอจนสามารถใช้งานเป็น operating system แบบ real time ได้ แต่ด้วยความที่มันเป็น non-deterministic คือ content ในโฟลเดอร์จะเปลี่ยนไปเรื่อยๆ ตามธรรมชาติของ generative AI เลยยังไม่รู้ว่ามันจะเอาไปใช้งานในด้านไหนได้ นอกจากเป็น tech demo
ถ้ามันเร็วขนาดนี้…
komkit0710 Mon, 23/06/2025 - 21:13
In reply to ก็กำหนด prompt ไว้แล้ว… by comdevx
ถ้ามันเร็วขนาดนี้ สามารถวาดเกมน่าจะได้มั้งครับ ถ้ามี frame ก่อนหน้า แล้วมี action ให้มัน แต่คงไม่ขนาด 60fps
ผมให้เขียน C#/C++…
venus00tar Tue, 24/06/2025 - 01:04
ผมให้เขียน C#/C++ ควบคุมรีเลย์ปิด เปิด 8 ช่องใน Ubuntu แค่บอกความต้องการว่าอยากได้ UI แบบไหนมันก็ใช้ได้อยู่
แบบที่สองให้เขียน python ผมวาดเป็นรูปภาพหน้าตา UI ที่ต้องการแล้วอัพโหลดมันทำตามนั้น ก็โอเคอันนี้ได้ตรงเป้ะเลย
Gemini…
Tasksenger Tue, 24/06/2025 - 06:21
In reply to ผมให้เขียน C#/C++… by venus00tar
Gemini มันมีความสามารถซ่อนอยู่อีกเยอะ ขึ้นอยู่กับว่าเราจะสั่งงานมันเป็นหรือเปล่า คุณเป็นหนึ่งคนที่รู้วิธีให้มันทำงานให้คุณได้โดยที่อาศัยสัญชาติญาณของมนุษย์ ไม่ใช่คู่มือ Gemini ไม่ใช่แค่ Software มันเป็น data warehouse ขนาดใหญ่ที่รวมองค์ความรู้ต่างๆ ไว้มากมาย และมีเครื่องมือที่จะช่วยดึงข้อมูลองค์ความรู้เหล่านั้นมาใช้งาน แต่วิศวกรของ Google ยังไม่มีเวลามาอธิบายวิธีการใช้งาน เพราะต้องเร่งแข่งขัน ดังนั้นวิธีที่ดีที่สุดคือ ใช้สัญชาติญาณของมนุษย์ในการสอนเด็กน้อยคนหนึ่งที่มี IQ สูง ให้รู้จักใช้เครื่องมือที่วิศวกรของ Google สร้างไว้ให้ แล้วคุณจะรู้ว่า Gemini มันไม่ใช่แค่ Software
ผมเป็นคนหนึ่งที่รู้สึกว่ายัง…
suriyan2538 Tue, 24/06/2025 - 07:51
In reply to Gemini… by Tasksenger
ผมเป็นคนหนึ่งที่รู้สึกว่ายังใช้ Gemini ได้ไม่ดีเท่าไหร่เลยครับ
สงสัยเคยใช้ Prompt กับ Chat GPT จนชิน พอมาใช้กับ Gemini แล้วรู้สึกว่าได้คำตอบห้วนและแคบไปหน่อย เลยคิดว่าน่าจะเคยตัวกับคำตอบกว้างๆ ของ GPT ไปแล้ว
อันนี้ผมเดาไปเองนะ เหมือนผมรู้สึกว่าการใช้งาน AI 2 ตัวนี้สวนทางกัน
GPT ตอบกว้าง เวลาทำงานต้องค่อยๆ บีบให้แคบลงเพื่อให้ได้ตามต้องการ
ส่วน Gemini ตอบแคบ ต้องพยายามขยายออกเพื่อให้ตรงตามความต้องการ
Gemini…
Tasksenger Tue, 24/06/2025 - 11:36
In reply to ผมเป็นคนหนึ่งที่รู้สึกว่ายัง… by suriyan2538
Gemini ถูกออกแบบมาให้ควบคุมเครื่องมืออื่นๆ ไม่ใช่สำหรับการตอบคำถาม เพราะถ้าออกแบบมาให้ตอบคำถามมันจะไปทำลายตลาด Search engine ที่เป็นแหล่งรายได้หลักของ Google ดังนั้น Google จึงมองว่า Search Engine เป็นแค่เครื่องมือหนึ่งที่ต่อไปเขาจะสอนให้ Gemini ทำงานควบคุม Search Engine อีกทีหนึ่ง ถ้าวันนั้นมาถึง มันก็จะทำงานแทนที่ Search Engine และให้คำตอบที่คุณพึงพอใจ แต่คงต้องอีกซักพัก เพราะการแข่งขันมันสูง การโฟกัสไปยัง core AI ยังเป็นสิ่งสำคัญ เครื่องมือเดิมของ Google ก็ยังทำงานได้ดี สถาวะการทางการตลาดก็ยังไม่ได้แย่จนกระทบผลประกอบการ ดังนั้นจึงยังไม่ถึงเวลาที่จะแทนที่
ส่วน ChatGPT ถูกออกแบบมาให้สำหรับตอบคำถามเพื่อแข่งขันกับ Search Engine ปรัชญาการสร้างแตกต่างกันพอสมควร ความจริงโดยส่วนตัวผมคิดว่าแทบจะไม่ใช่คู่แข่งกันเลย ถ้าเป็นคนทั่วไปไม่ใช่นักพัฒนาใช้ ChatGPT น่าจะเหมาะสมแล้ว แต่ถ้าคุณเป็นนักพัฒนา Gemini จะพาคุณไปทะลุขอบฟ้าได้มากกว่า
ต้องมาดูระดับ Architecture ถึงจะมองเรื่องพวกนี้ออก แต่ถ้าคุณใช้มันเป็นแค่เครื่องมือในการหาคำตอบ ตอนนี้ ChatGPT น่าจะเป็นตัวเลือกที่เหมาะสมแล้วล่ะครับ แต่ถ้าคุณมีความฝันอยากเปลี่ยนแปลงโลก Gemini น่าจะเป็นตัวเลือกที่น่าสนใจ เพราะมันควบคุมเครื่องมือได้อย่างเหลือเชื่อเลยล่ะ ถ้าคุณสอนมันเป็น
อ่อ พึ่งสังเกตุว่าคุณก็เจอจุดที่ Gemini แตกต่างจาก ChatGPT ด้วยนี่ ถ้าคุณวิเคราะห์ดีๆ comment ของคุณมันบอกปรัชญาที่แตกต่างในการออกแบบของทั้ง 2 ตัวเอาไว้แล้ว ที่คุณบอกว่า Gemini ต้องค่อยๆ บอกเพื่อให้ตอบคำถามได้ตรงมากยิ่งขึ้น คุณรู้หรือเปล่าว่ามันเหมือนอะไร ? ผมไม่บอกนะผมให้คุณไปคิดต่อเล่นๆ แต่บอกใบ้ไว้ว่า สมองมนุษย์มันจะใช้วิธีค่อยๆ ต่อ Jigsaw เพื่อสร้างองค์ความรู้ หรือภาษาหมอ ก็คงประมาณเส้นใยนำประสาทมั้ง แต่นี้ไม่ใช่คำตอบนะ คำตอบมันซ่อนอยู่ในประโยคที่คุณสงสัยนั่นแหล่ะ ถ้าคุณคิดออก คุณก็จะสอนให้ Gemini ตอบคำถามแบบยาวๆ ได้
อีก 5 ปีข้างหน้า…
Pinery Tue, 24/06/2025 - 11:18
อีก 5 ปีข้างหน้า การใช้งานน่าจะเปลี่ยนไปเยอะทีเดียว