Image
By mk Founder on Tag: Gemini, Google, Artificial Intelligence, Image Editing
Gemini

แอพ Gemini เพิ่มฟีเจอร์การตกแต่งภาพเวอร์ชันอัพเกรดใหม่ ด้วยโมเดลตัวใหม่ Gemini 2.5 Flash Image ที่เปิดตัวมาพร้อมกัน ที่สำคัญคือเปิดให้ทุกคนใช้งานฟรี

เนื่องจากการอธิบายฟีเจอร์แต่งภาพด้วยตัวอักษรทำได้ยาก (ดูคลิปตัวอย่างท้ายข่าวดีกว่านะครับ) แต่ฟีเจอร์ใหม่ที่สำคัญได้แก่

By mk Founder on Tag: Nano Banana, Gemini, Google, LLM, Artificial Intelligence
Nano Banana

ข่าวโมเดลใหม่รายวัน วันนี้ขอเสนอ Gemini 2.5 Flash Image (โค้ดเนมภายใน nano-banana) โมเดลสร้างและแก้ไขภาพตัวใหม่ของกูเกิล สามารถนำภาพหลายๆ ภาพมารวมกันเป็นภาพเดียว และอัพเกรดความสามารถทั้งการสั่งแก้ไข-ดัดแปลงภาพด้วยภาษาธรรมชาติ และการรักษาคาแรกเตอร์ในภาพให้คงเส้นคงวา

จากภาพตัวอย่างของกูเกิล เห็นการรวม 3 ภาพเข้าด้วยกันคือ ใบหน้าผู้หญิง ตัวเครื่องโทรศัพท์มือถือ และบันไดทางเดิน รวมแล้วได้ภาพผู้หญิงคนเดียวกันกำลังคุยโทรศัพท์ (แต่มีร่างกายครึ่งตัว ไม่ได้มีเฉพาะใบหน้า) อยู่ในฉากบันไดที่เตรียมไว้ให้

By mk Founder on Tag: Siri, Gemini, Google, Apple, Rumors
Siri

Mark Gurman แห่ง Bloomberg รายงานว่า แอปเปิลกำลังเจรจากับกูเกิลเพื่อนำ Gemini มาใช้ในบริการ Siri เวอร์ชันอัพเกรดใหม่ โดยระบุว่าแอปเปิลเป็นฝ่ายเข้าไปหากูเกิลก่อน เพื่อสร้างโมเดล Gemini เวอร์ชันคัสตอมสำหรับ Siri เวอร์ชันของปีหน้า 2026

ช่วงหลังมีข่าวว่า แอปเปิลอาจไม่ทำโมเดลเองแล้ว และจะหันไปใช้โมเดลภายนอก โดยก่อนหน้านี้มีชื่อของ OpenAI และ Anthropic โผล่มา แต่นี่เป็นครั้งแรกที่มีชื่อของกูเกิลโผล่มาด้วย (สตีฟ จ็อบส์ ต้องภูมิใจกับสิ่งนี้!)

By arjin Writer on Tag: Gemini, Google, Environment, Energy, Data Center, Artificial Intelligence
Gemini

ประเด็นที่ผู้อ่าน Blognone คงเคยได้ยินกันมาบ้างคือ การใช้งาน AI หนึ่งครั้ง เท่ากับการใช้พลังงานไฟฟ้าที่เยอะมาก เพื่อตอบคำถามนี้กูเกิลเลยออกรายงานผลกระทบด้านสิ่งแวดล้อม จากการใช้งาน AI ในขั้นตอน Inference ซึ่งกูเกิลก็มีเป้าหมายให้เกิดการใช้พลังงานอย่างมีประสิทธิภาพมากที่สุดเช่นกัน

กูเกิลบอกว่าการคำนวณพลังงานที่ใช้แบบทางทฤษฎีเช่น TPU, GPU ใช้พลังงานเท่าใดต่อหนึ่งคำสั่ง ยังไม่สะท้อนภาพความจริง สูตรที่กูเกิลคำนวณจึงใส่ปัจจัยทั้ง อัตราการใช้งานชิปจริง (Utilization), อัตราที่ฮาร์ดแวร์ว่างไม่มีการประมวลผล (Idle), การประมวลผลที่เกิดกับ CPU และ RAM, ไฟฟ้าที่ใช้ในระบบทำความเย็น, ไฟฟ้าที่ใช้ในส่วนสนับสนุนของศูนย์ข้อมูล เข้ามาด้วย

By mk Founder on Tag: Gemini, Google Assistant, Google Home, Google
Gemini

กูเกิลประกาศข่าวว่า Gemini จะมาแทน Google Assistant บนแพลตฟอร์สมาร์ทโฮม Google Home โดยการเปลี่ยนผ่านจะค่อยๆ เริ่มขึ้นในช่วงเดือนตุลาคมนี้ แต่ยังไม่บอกว่าฮาร์ดแวร์รุ่นใดจะได้ Gemini ก่อน

การเปลี่ยนจาก Google Assistant มาเป็น Gemini ช่วยให้การสนทนาไหลลื่น เข้าใจภาษามนุษย์และบริบทต่างๆ มากขึ้น รองรับคำสั่งที่ซับซ้อนกว่าเดิม (เช่น turn off the lights everywhere except my bedroom) โดยเป็นโมเดล Gemini ตัวเดียวกับบนแพลตฟอร์มอื่นๆ แต่ปรับแต่งให้เหมาะกับการใช้งานบนสมาร์ทโฮมด้วย ผู้ใช้ยังสามารถเรียก Hey Google ได้เหมือนเดิม

By mk Founder on Tag: Google Docs, Gemini, Text-to-Speech, Google Workspace, Google
Google Docs

Google Docs เพิ่มฟีเจอร์ "อ่านเอกสารให้ฟัง" (listen to your document) โดยอาศัยพลังของ Gemini แล้ว

ฟีเจอร์นี้ต่างจาก การแปลงไฟล์เอกสารเป็นไฟล์เสียง หรือ audio overview คือเป็นการอ่านเอกสารให้ฟังสดๆ ทีละตัวในหน้า Google Docs เลย ไม่ได้แปลงเป็นไฟล์เสียงแยกแต่อย่างใด

ผู้ใช้สามารถสั่งให้อ่านเอกสารได้จากเมนู Tools > Audio และสามารถใส่ปุ่ม "Listen to this tab" ฝังลงในเอกสารให้กดปุ่มแล้วอ่านได้ทันทีได้เช่นกัน

By mk Founder on Tag: Oracle, Gemini, Google Cloud, Google, Enterprise
Oracle

คนที่ทัน คดีมหากาพย์ Oracle vs Google เรื่อง Java คงไม่คุ้นเคยกับการที่สองบริษัทนี้มาทำอะไรร่วมกันนัก แต่คดีจบไปแล้ว ผลประโยชน์สำคัญกว่า เราจึงเห็น Oracle กับ Google Cloud เริ่มเป็นพันธมิตรเชิงธุรกิจกันมาตั้งแต่ปี 2024

ล่าสุด Oracle ประกาศช่วยขาย Gemini 2.5 ให้กูเกิล โดยบริการคลาวด์ Oracle Cloud Infrastructure (OCI) Generative AI service เพิ่มโมเดล Gemini 2.5 ให้ลูกค้า (ซึ่งมักเป็นลูกค้าองค์กรขนาดใหญ่)

By arjin Writer on Tag: Gemini, Google, Artificial Intelligence
Gemini

กูเกิลเพิ่มของใหม่ให้ Gemini สองอย่าง แม้ไม่ใช่ของใหม่เสียทีเดียวในวงการแชทบอต AI แต่ก็น่าจะเป็นสิ่งที่ผู้ใช้งาน Gemini ต้องการเช่นกัน

  • Personal Context สามารถย้อนแชทในอดีต เพื่อให้จดจำรายละเอียดข้อมูลส่วนตัว ทำให้คำตอบตรงตามสิ่งที่ชอบหรือสนใจมากขึ้น
  • Temporary Chat เปิดการทำงานแชทที่ไม่อิงข้อมูลในอดีต โดยแชทจะบันทึกให้เรียกคืนได้ใน 72 ชั่วโมง
By mk Founder on Tag: Gemini, Education, Google
Gemini

Gemini เพิ่มโหมดเพื่อการเรียนรู้ Guided Learning ลักษณะคล้ายกับ ChatGPT เปิด Study Mode ไปไม่กี่วันก่อนหน้านี้

กูเกิลนิยามว่าโหมด Guided Learning คือเพื่อน AI ร่วมการเรียนรู้เฉพาะบุคคล (your personal AI learning companion) จะช่วยแก้โจทย์เป็นขั้นตอน และช่วยเพิ่มคำอธิบายเรื่อง how กับ why ด้วยการใช้ภาพและวิดีโอเพื่อให้เข้าใจง่ายขึ้น

By lew Founder on Tag: Jules, Gemini, Google, Programming
Jules

เมื่อเดือนพฤษภาคมที่ผ่านมากูเกิลเปิดตัว Jules บริการปัญญาประดิษฐ์ช่วยเขียนโค้ดแบบทำงานเหมือนโปรแกรมเมอร์แยก จากเดิมอยู่ในสถานะเบต้า ตอนนี้เปิดให้ใช้งานจริงแล้วโดยขายอยู่ในแพ็กเกจ Google AI

ผู้ที่ใช้งานฟรียังคงสามารถใช้ Jules ต่อไปได้วันละ 15 งานต่อวัน รันพร้อมกันได้ไม่เกิน 3 งาน แต่ผู้ที่สมัคร Google AI Pro จะขยายเป็น 100 งานต่อวัน รันพร้อมกันได้ 15 งาน และผู้สมัคร Google AI Ultra จะสามารถรันได้ถึง 300 งานต่อวัน ขนานได้ 60 งาน

By lew Founder on Tag: Gemini, Programming
Gemini

กูเกิลเพิ่มฟีเจอร์ให้กับ Gemini CLI สามารถทำงานใน GitHub Actions ได้เพิ่มเติม โดยฝังตัวเองอยู่ใน workflow เพื่อทำงานตามเงื่อนไขที่ระบุไว้ล่วงหน้า เช่น มีการเปิด issue ใหม่, มีเมนชั่นถึงใน issue, ตลอดจนมี pull request เข้ามาใหม่

ผู้ใช้ Gemini CLI ทั้งแบบใช้ API key ส่วนตัว และแบบใช้งานผ่าน Gemini Code Assist สามารถใช้งานบริการนี้ได้ กูเกิลมีตัวอย่าง workflow ให้สามารถใช้งานได้

By arjin Writer on Tag: Gemini, Google, Artificial Intelligence, LLM
Gemini

กูเกิลเพิ่มความสามารถให้ Gemini ในการสร้างหนังสือนิทาน (Storybook) จากเรื่องราวที่ผู้ใช้งานอธิบายเข้าไป ซึ่งผลลัพธ์จะได้เป็นหนังสือนิทานตามเรื่องที่ระบุ พร้อมกับภาพวาดประกอบ

Storybook ที่ได้จะเป็นหนังสือ 10 หน้า มีภาพประกอบ และเสียงบรรยาย สามารถใส่อินพุทรูปภาพหรือเอกสารของผู้ใช้งานเองเพื่อให้ได้ผลลัพธ์ตรงตามต้องการมากขึ้นได้ ภาพประกอบในหนังสือยังสามารถกำหนดสไตล์ไม่ว่าจะเป็น รูปพิกเซล การ์ตูน ภาพปั้นนูน ไปจนถึงหนังสือภาพวาดสำหรับระบายสี

By mk Founder on Tag: Gemini, Google, LLM, Mathematics
Gemini

กูเกิลเริ่มเปิดบริการ Gemini 2.5 Deep Think กับลูกค้าแพ็กเกจ Google AI Ultra หลังส่งโมเดลเวอร์ชันใกล้เคียงกันไปสอบคณิตศาสตร์โอลิมปิกแล้วได้เหรียญทอง

โมเดลกลุ่ม Deep Think คือการเปิดโอกาสให้ AI คิดคำตอบได้หลายแนวทาง ถึงแม้ใช้เวลามากกว่า แต่โมเดลมีเวลาสอบทาน ตรวจสอบแนวทางต่างๆ เพื่อให้ตอบคำถามที่ซับซ้อนได้ กูเกิลโชว์ตัวเลขการทดสอบว่า Gemini 2.5 Deep Think ทำผลงานเบนช์มาร์คได้ดีกว่า Gemini 2.5 Pro มาก รวมถึงเอาชนะโมเดลยี่ห้ออื่นๆ เช่น OpenAI o3 และ Grok 4 ได้ทั้งหมด

By arjin Writer on Tag: Google, Gemini, Artificial Intelligence, Waymo, YouTube, Google Cloud
Google

Sundar Pichai ซีอีโอกูเกิลและ Alphabet ให้ข้อมูลตัวเลขที่น่าสนใจในการแถลงผลประกอบการไตรมาสล่าสุด ที่บริษัทมีรายได้เติบโต 14% และธุรกิจคลาวด์เติบโตถึง 32% มีตัวเลขสำคัญดังนี้

  • AI Overviews มีผู้ใช้งานเป็นประจำทุกเดือนมากกว่า 2 พันล้านคนใน 200 ประเทศ มากกว่า 40 ภาษา
  • ครีเอเตอร์ในอเมริกาทำเงินจาก Shorts ได้มากกว่าวิดีโอแบบเดิม เมื่อเทียบจำนวนชั่วโมงรับชม ในบางประเทศ Shorts เป็นรายได้หลักครีเอเตอร์แทนที่วิดีโอเดิมแล้ว
  • ธุรกิจคลาวด์ยังเติบโตด้วยแนวโน้มรายได้มากกว่า 5 หมื่นล้านดอลลาร์ต่อปี
By mk Founder on Tag: Gemini, Google, LLM
Gemini

กูเกิลปรับสถานะโมเดลรุ่นมหาชน Gemini 2.5 Flash-Lite ที่เปิดตัวช่วงกลางเดือนมิถุนายน จากสถานะ Preview มาเป็น General Available (GA) พร้อมใช้งานในระดับโปรดักชันเต็มตัว

By mk Founder on Tag: DeepMind, Gemini, Mathematics, LLM, Artificial Intelligence, Google
DeepMind

การสอบคณิตศาสตร์โอลิมปิก (International Mathematical Olympiad) กลายเป็นสมรภูมิใหม่ของวงการ LLM ไปแล้ว หลัง OpenAI ประกาศว่าโมเดลของตัวเองสอบได้เหรียญทอง ฝั่ง Google DeepMind ก็ประกาศความสำเร็จแบบเดียวกัน

By mk Founder on Tag: Gemini, Programming, Google, IDE, Artificial Intelligence
Gemini

สงคราม IDE พลัง AI ปี 2025 เริ่มเข้าสู่ยุค Agent เต็มตัว ผู้เล่นหลายรายเข้าสู่สนามกันพร้อมหน้า ทั้งฝั่งสตาร์ตอัพ Cursor, Windsurf ที่เพิ่งเปลี่ยนผ่านครั้งใหญ่ หรือฝั่งบ้านใหญ่ Claude Code ที่เพิ่มฟีเจอร์ Agentic เมื่อเดือนกุมภาพันธ์, OpenAI Codex เดือนพฤษภาคม, GitHub Copilot Coding Agent ตามมาเดือนพฤษภาคม

By mk Founder on Tag: Veo, Gemini, Google, LLM
Veo

กูเกิลเปิดใช้เช่าใช้งานโมเดลสร้างวิดีโอ Veo 3 ผ่าน Gemini API โดยยังมีสถานะเป็นพรีวิว และใช้คู่กับ Veo 2 ของเดิม

สิ่งที่ทุกคนสนใจที่สุดคงเป็น "ราคา"

  • Veo 3 แบบมีเสียงประกอบ วินาทีละ 0.75 ดอลลาร์
  • Veo 3 แบบไม่มีมีเสียงประกอบ วินาทีละ 0.50 ดอลลาร์
  • Veo 2 ไม่มีมีเสียงประกอบอยู่แล้ว วินาทีละ 0.35 ดอลลาร์

จะเห็นว่าราคา Veo 3 แพงขึ้นมากว่า Veo 2 อยู่พอสมควร ซึ่งกูเกิลบอกว่าจะออก Veo 3 Fast ที่ทำงานเร็วขึ้น ราคาถูกลง ตามมา

By mk Founder on Tag: Gemini, Samsung, Android, Google
Gemini

ข่าวเล็กๆ ที่น่าสนใจจากงานเปิดตัว Galaxy Z Fold/Flip 7 ของซัมซุงคือ กูเกิลประกาศว่าแอพ Gemini Live รองรับการเชื่อมต่อกับแอพของซัมซุง เช่น Samsung Calendar, Reminder, Samsung Notes เพิ่มเติมจากที่รองรับแอพของกูเกิลเอง ไปก่อนหน้านี้

เท่ากับว่าเราสามารถเปิดโหมด Gemini Live ถ่ายภาพโปสเตอร์คอนเสิร์ตที่อยู่ตรงหน้า แล้วเช็คกับปฏิทิน Samsung Calendar ได้เลยว่าเราว่างวันนั้นหรือไม่ ลงนัดหมายให้ได้เลย

ที่มา - Google

Subscribe to Gemini