Gemini

แอพ Gemini เพิ่มฟีเจอร์แต่งภาพด้วย AI เปลี่ยนชุด เปลี่ยนท่า เปลี่ยนฉาก ได้ตามใจชอบ

By mk

on 26 August 2025 - 22:16 Tag: Gemini, Google, Artificial Intelligence, Image Editing

Gemini

แอพ Gemini เพิ่มฟีเจอร์การตกแต่งภาพเวอร์ชันอัพเกรดใหม่ ด้วยโมเดลตัวใหม่ Gemini 2.5 Flash Image ที่เปิดตัวมาพร้อมกัน ที่สำคัญคือเปิดให้ทุกคนใช้งานฟรี

เนื่องจากการอธิบายฟีเจอร์แต่งภาพด้วยตัวอักษรทำได้ยาก (ดูคลิปตัวอย่างท้ายข่าวดีกว่านะครับ) แต่ฟีเจอร์ใหม่ที่สำคัญได้แก่

กูเกิลออกโมเดลสร้างภาพ Gemini 2.5 Flash Image รวมหลายภาพเป็นภาพเดียวกันได้

By mk

on 26 August 2025 - 22:02 Tag: Nano Banana, Gemini, Google, LLM, Artificial Intelligence

Nano Banana

ข่าวโมเดลใหม่รายวัน วันนี้ขอเสนอ Gemini 2.5 Flash Image (โค้ดเนมภายใน nano-banana) โมเดลสร้างและแก้ไขภาพตัวใหม่ของกูเกิล สามารถนำภาพหลายๆ ภาพมารวมกันเป็นภาพเดียว และอัพเกรดความสามารถทั้งการสั่งแก้ไข-ดัดแปลงภาพด้วยภาษาธรรมชาติ และการรักษาคาแรกเตอร์ในภาพให้คงเส้นคงวา

จากภาพตัวอย่างของกูเกิล เห็นการรวม 3 ภาพเข้าด้วยกันคือ ใบหน้าผู้หญิง ตัวเครื่องโทรศัพท์มือถือ และบันไดทางเดิน รวมแล้วได้ภาพผู้หญิงคนเดียวกันกำลังคุยโทรศัพท์ (แต่มีร่างกายครึ่งตัว ไม่ได้มีเฉพาะใบหน้า) อยู่ในฉากบันไดที่เตรียมไว้ให้

[ลือ] แอปเปิลเจรจากูเกิล ทดสอบใช้โมเดล Gemini คัสตอมกับ Siri เวอร์ชันใหม่

By mk

on 23 August 2025 - 08:11 Tag: Siri, Gemini, Google, Apple, Rumors

Siri

Mark Gurman แห่ง Bloomberg รายงานว่า แอปเปิลกำลังเจรจากับกูเกิลเพื่อนำ Gemini มาใช้ในบริการ Siri เวอร์ชันอัพเกรดใหม่ โดยระบุว่าแอปเปิลเป็นฝ่ายเข้าไปหากูเกิลก่อน เพื่อสร้างโมเดล Gemini เวอร์ชันคัสตอมสำหรับ Siri เวอร์ชันของปีหน้า 2026

ช่วงหลังมีข่าวว่า แอปเปิลอาจไม่ทำโมเดลเองแล้ว และจะหันไปใช้โมเดลภายนอก โดยก่อนหน้านี้มีชื่อของ OpenAI และ Anthropic โผล่มา แต่นี่เป็นครั้งแรกที่มีชื่อของกูเกิลโผล่มาด้วย (สตีฟ จ็อบส์ ต้องภูมิใจกับสิ่งนี้!)

Google ออกรายงานผลกระทบสิ่งแวดล้อมของ AI Gemini - หนึ่งคำสั่งใช้ไฟฟ้า 0.24Wh ปล่อยคาร์บอนไดออกไซด์ 0.03 กรัม

By arjin

on 22 August 2025 - 10:11 Tag: Gemini, Google, Environment, Energy, Data Center, Artificial Intelligence

Gemini

ประเด็นที่ผู้อ่าน Blognone คงเคยได้ยินกันมาบ้างคือ การใช้งาน AI หนึ่งครั้ง เท่ากับการใช้พลังงานไฟฟ้าที่เยอะมาก เพื่อตอบคำถามนี้กูเกิลเลยออกรายงานผลกระทบด้านสิ่งแวดล้อม จากการใช้งาน AI ในขั้นตอน Inference ซึ่งกูเกิลก็มีเป้าหมายให้เกิดการใช้พลังงานอย่างมีประสิทธิภาพมากที่สุดเช่นกัน

กูเกิลบอกว่าการคำนวณพลังงานที่ใช้แบบทางทฤษฎีเช่น TPU, GPU ใช้พลังงานเท่าใดต่อหนึ่งคำสั่ง ยังไม่สะท้อนภาพความจริง สูตรที่กูเกิลคำนวณจึงใส่ปัจจัยทั้ง อัตราการใช้งานชิปจริง (Utilization), อัตราที่ฮาร์ดแวร์ว่างไม่มีการประมวลผล (Idle), การประมวลผลที่เกิดกับ CPU และ RAM, ไฟฟ้าที่ใช้ในระบบทำความเย็น, ไฟฟ้าที่ใช้ในส่วนสนับสนุนของศูนย์ข้อมูล เข้ามาด้วย

Gemini จะมาแทน Google Assistant บนแพลตฟอร์ม Google Home

By mk

on 21 August 2025 - 16:49 Tag: Gemini, Google Assistant, Google Home, Google

Gemini

กูเกิลประกาศข่าวว่า Gemini จะมาแทน Google Assistant บนแพลตฟอร์สมาร์ทโฮม Google Home โดยการเปลี่ยนผ่านจะค่อยๆ เริ่มขึ้นในช่วงเดือนตุลาคมนี้ แต่ยังไม่บอกว่าฮาร์ดแวร์รุ่นใดจะได้ Gemini ก่อน

การเปลี่ยนจาก Google Assistant มาเป็น Gemini ช่วยให้การสนทนาไหลลื่น เข้าใจภาษามนุษย์และบริบทต่างๆ มากขึ้น รองรับคำสั่งที่ซับซ้อนกว่าเดิม (เช่น turn off the lights everywhere except my bedroom) โดยเป็นโมเดล Gemini ตัวเดียวกับบนแพลตฟอร์มอื่นๆ แต่ปรับแต่งให้เหมาะกับการใช้งานบนสมาร์ทโฮมด้วย ผู้ใช้ยังสามารถเรียก Hey Google ได้เหมือนเดิม

Google Docs เพิ่มฟีเจอร์อ่านออกเสียงไฟล์เอกสารด้วยพลัง Gemini

By mk

on 20 August 2025 - 21:32 Tag: Google Docs, Gemini, Text-to-Speech, Google Workspace, Google

Google Docs

Google Docs เพิ่มฟีเจอร์ "อ่านเอกสารให้ฟัง" (listen to your document) โดยอาศัยพลังของ Gemini แล้ว

ฟีเจอร์นี้ต่างจาก การแปลงไฟล์เอกสารเป็นไฟล์เสียง หรือ audio overview คือเป็นการอ่านเอกสารให้ฟังสดๆ ทีละตัวในหน้า Google Docs เลย ไม่ได้แปลงเป็นไฟล์เสียงแยกแต่อย่างใด

ผู้ใช้สามารถสั่งให้อ่านเอกสารได้จากเมนู Tools > Audio และสามารถใส่ปุ่ม "Listen to this tab" ฝังลงในเอกสารให้กดปุ่มแล้วอ่านได้ทันทีได้เช่นกัน

ไม่มีแล้วศัตรู มีแต่พันธมิตร Oracle ช่วยขายโมเดล Gemini เปิดให้ใช้บน OCI

By mk

on 15 August 2025 - 07:39 Tag: Oracle, Gemini, Google Cloud, Google, Enterprise

Oracle

คนที่ทัน คดีมหากาพย์ Oracle vs Google เรื่อง Java คงไม่คุ้นเคยกับการที่สองบริษัทนี้มาทำอะไรร่วมกันนัก แต่คดีจบไปแล้ว ผลประโยชน์สำคัญกว่า เราจึงเห็น Oracle กับ Google Cloud เริ่มเป็นพันธมิตรเชิงธุรกิจกันมาตั้งแต่ปี 2024

ล่าสุด Oracle ประกาศช่วยขาย Gemini 2.5 ให้กูเกิล โดยบริการคลาวด์ Oracle Cloud Infrastructure (OCI) Generative AI service เพิ่มโมเดล Gemini 2.5 ให้ลูกค้า (ซึ่งมักเป็นลูกค้าองค์กรขนาดใหญ่)

Gemini เพิ่มความสามารถย้อนแชทในอดีตได้ และ Temporary Chat ที่ไม่จดจำข้อมูล

By arjin

on 14 August 2025 - 06:14 Tag: Gemini, Google, Artificial Intelligence

Gemini

กูเกิลเพิ่มของใหม่ให้ Gemini สองอย่าง แม้ไม่ใช่ของใหม่เสียทีเดียวในวงการแชทบอต AI แต่ก็น่าจะเป็นสิ่งที่ผู้ใช้งาน Gemini ต้องการเช่นกัน

Personal Context สามารถย้อนแชทในอดีต เพื่อให้จดจำรายละเอียดข้อมูลส่วนตัว ทำให้คำตอบตรงตามสิ่งที่ชอบหรือสนใจมากขึ้น
Temporary Chat เปิดการทำงานแชทที่ไม่อิงข้อมูลในอดีต โดยแชทจะบันทึกให้เรียกคืนได้ใน 72 ชั่วโมง

Gemini เพิ่ม Guided Learning โหมดช่วยเรียน อธิบายเป็นขั้นตอน, สร้างโจทย์ให้ซ้อมทำก่อนสอบได้

By mk

on 7 August 2025 - 21:37 Tag: Gemini, Education, Google

Gemini

Gemini เพิ่มโหมดเพื่อการเรียนรู้ Guided Learning ลักษณะคล้ายกับ ChatGPT เปิด Study Mode ไปไม่กี่วันก่อนหน้านี้

กูเกิลนิยามว่าโหมด Guided Learning คือเพื่อน AI ร่วมการเรียนรู้เฉพาะบุคคล (your personal AI learning companion) จะช่วยแก้โจทย์เป็นขั้นตอน และช่วยเพิ่มคำอธิบายเรื่อง how กับ why ด้วยการใช้ภาพและวิดีโอเพื่อให้เข้าใจง่ายขึ้น

กูเกิลปรับ Jules ผู้ช่วยเขียนโค้ดแบบ Agentic เป็นบริการเต็มรูปแบบ ขายพ่วงแพ็กเกจ AI

By lew

on 7 August 2025 - 08:05 Tag: Jules, Gemini, Google, Programming

Jules

เมื่อเดือนพฤษภาคมที่ผ่านมากูเกิลเปิดตัว Jules บริการปัญญาประดิษฐ์ช่วยเขียนโค้ดแบบทำงานเหมือนโปรแกรมเมอร์แยก จากเดิมอยู่ในสถานะเบต้า ตอนนี้เปิดให้ใช้งานจริงแล้วโดยขายอยู่ในแพ็กเกจ Google AI

ผู้ที่ใช้งานฟรียังคงสามารถใช้ Jules ต่อไปได้วันละ 15 งานต่อวัน รันพร้อมกันได้ไม่เกิน 3 งาน แต่ผู้ที่สมัคร Google AI Pro จะขยายเป็น 100 งานต่อวัน รันพร้อมกันได้ 15 งาน และผู้สมัคร Google AI Ultra จะสามารถรันได้ถึง 300 งานต่อวัน ขนานได้ 60 งาน

กูเกิลเพิ่มฟีเจอร์ Gemini CLI GitHub Actions เปิด issue สั่งงาน Gemini มาแก้ได้ทันที

By lew

on 7 August 2025 - 00:23 Tag: Gemini, Programming

Gemini

กูเกิลเพิ่มฟีเจอร์ให้กับ Gemini CLI สามารถทำงานใน GitHub Actions ได้เพิ่มเติม โดยฝังตัวเองอยู่ใน workflow เพื่อทำงานตามเงื่อนไขที่ระบุไว้ล่วงหน้า เช่น มีการเปิด issue ใหม่, มีเมนชั่นถึงใน issue, ตลอดจนมี pull request เข้ามาใหม่

ผู้ใช้ Gemini CLI ทั้งแบบใช้ API key ส่วนตัว และแบบใช้งานผ่าน Gemini Code Assist สามารถใช้งานบริการนี้ได้ กูเกิลมีตัวอย่าง workflow ให้สามารถใช้งานได้

Gemini เพิ่มของใหม่ สร้างหนังสือนิทาน (Storybook) เป็นเรื่องราวพร้อมภาพประกอบ

By arjin

on 6 August 2025 - 18:11 Tag: Gemini, Google, Artificial Intelligence, LLM

Gemini

กูเกิลเพิ่มความสามารถให้ Gemini ในการสร้างหนังสือนิทาน (Storybook) จากเรื่องราวที่ผู้ใช้งานอธิบายเข้าไป ซึ่งผลลัพธ์จะได้เป็นหนังสือนิทานตามเรื่องที่ระบุ พร้อมกับภาพวาดประกอบ

Storybook ที่ได้จะเป็นหนังสือ 10 หน้า มีภาพประกอบ และเสียงบรรยาย สามารถใส่อินพุทรูปภาพหรือเอกสารของผู้ใช้งานเองเพื่อให้ได้ผลลัพธ์ตรงตามต้องการมากขึ้นได้ ภาพประกอบในหนังสือยังสามารถกำหนดสไตล์ไม่ว่าจะเป็น รูปพิกเซล การ์ตูน ภาพปั้นนูน ไปจนถึงหนังสือภาพวาดสำหรับระบายสี

กูเกิลเปิดบริการ Gemini 2.5 Deep Think ให้ใช้ สอบคณิตศาสตร์โอลิมปิกได้เหรียญทองแดง

By mk

on 2 August 2025 - 20:25 Tag: Gemini, Google, LLM, Mathematics

Gemini

กูเกิลเริ่มเปิดบริการ Gemini 2.5 Deep Think กับลูกค้าแพ็กเกจ Google AI Ultra หลังส่งโมเดลเวอร์ชันใกล้เคียงกันไปสอบคณิตศาสตร์โอลิมปิกแล้วได้เหรียญทอง

โมเดลกลุ่ม Deep Think คือการเปิดโอกาสให้ AI คิดคำตอบได้หลายแนวทาง ถึงแม้ใช้เวลามากกว่า แต่โมเดลมีเวลาสอบทาน ตรวจสอบแนวทางต่างๆ เพื่อให้ตอบคำถามที่ซับซ้อนได้ กูเกิลโชว์ตัวเลขการทดสอบว่า Gemini 2.5 Deep Think ทำผลงานเบนช์มาร์คได้ดีกว่า Gemini 2.5 Pro มาก รวมถึงเอาชนะโมเดลยี่ห้ออื่นๆ เช่น OpenAI o3 และ Grok 4 ได้ทั้งหมด

Google Search AI Mode รองรับการอัพโหลด PDF, Canvas, เปิดกล้องถาม AI

By mk

on 30 July 2025 - 09:27 Tag: Google Search, Gemini, Google, Artificial Intelligence

Google Search

กูเกิลยังเดินหน้าผลักดัน AI Mode ใน Google Search อย่างต่อเนื่อง (คนละอันกับ AI Overview และยังใช้ในไทยไม่ได้) โดยเพิ่มฟีเจอร์อีกชุดใหญ่จาก Gemini เข้ามาใน AI Mode ดังนี้

Google เผยสถิติ Gemini App มีคนใช้งานมากกว่า 450 ล้าน, AI Overviews มีการใช้งานกว่า 2 พันล้านคน

By arjin

on 24 July 2025 - 08:12 Tag: Google, Gemini, Artificial Intelligence, Waymo, YouTube, Google Cloud

Google

Sundar Pichai ซีอีโอกูเกิลและ Alphabet ให้ข้อมูลตัวเลขที่น่าสนใจในการแถลงผลประกอบการไตรมาสล่าสุด ที่บริษัทมีรายได้เติบโต 14% และธุรกิจคลาวด์เติบโตถึง 32% มีตัวเลขสำคัญดังนี้

AI Overviews มีผู้ใช้งานเป็นประจำทุกเดือนมากกว่า 2 พันล้านคนใน 200 ประเทศ มากกว่า 40 ภาษา
ครีเอเตอร์ในอเมริกาทำเงินจาก Shorts ได้มากกว่าวิดีโอแบบเดิม เมื่อเทียบจำนวนชั่วโมงรับชม ในบางประเทศ Shorts เป็นรายได้หลักครีเอเตอร์แทนที่วิดีโอเดิมแล้ว
ธุรกิจคลาวด์ยังเติบโตด้วยแนวโน้มรายได้มากกว่า 5 หมื่นล้านดอลลาร์ต่อปี

โมเดล Gemini 2.5 Flash-Lite เข้าสถานะ GA, ราคาถูกที่สุดในตระกูล Gemini 2.5

By mk

on 23 July 2025 - 11:05 Tag: Gemini, Google, LLM

Gemini

กูเกิลปรับสถานะโมเดลรุ่นมหาชน Gemini 2.5 Flash-Lite ที่เปิดตัวช่วงกลางเดือนมิถุนายน จากสถานะ Preview มาเป็น General Available (GA) พร้อมใช้งานในระดับโปรดักชันเต็มตัว

นี่ก็เหรียญทอง DeepMind ส่ง Gemini สอบคณิตศาสตร์โอลิมปิก ได้เหรียญทอง

By mk

on 22 July 2025 - 06:30 Tag: DeepMind, Gemini, Mathematics, LLM, Artificial Intelligence, Google

DeepMind

การสอบคณิตศาสตร์โอลิมปิก (International Mathematical Olympiad) กลายเป็นสมรภูมิใหม่ของวงการ LLM ไปแล้ว หลัง OpenAI ประกาศว่าโมเดลของตัวเองสอบได้เหรียญทอง ฝั่ง Google DeepMind ก็ประกาศความสำเร็จแบบเดียวกัน

Gemini Code Assist เพิ่ม AI Mode เป็นเพื่อนคู่คิด Pair Programmer

By mk

on 18 July 2025 - 10:26 Tag: Gemini, Programming, Google, IDE, Artificial Intelligence

Gemini

สงคราม IDE พลัง AI ปี 2025 เริ่มเข้าสู่ยุค Agent เต็มตัว ผู้เล่นหลายรายเข้าสู่สนามกันพร้อมหน้า ทั้งฝั่งสตาร์ตอัพ Cursor, Windsurf ที่เพิ่งเปลี่ยนผ่านครั้งใหญ่ หรือฝั่งบ้านใหญ่ Claude Code ที่เพิ่มฟีเจอร์ Agentic เมื่อเดือนกุมภาพันธ์, OpenAI Codex เดือนพฤษภาคม, GitHub Copilot Coding Agent ตามมาเดือนพฤษภาคม

Veo 3 เปิดให้ใช้ผ่าน Gemini API, สร้างคลิปแบบมีเสียง วินาทีละ 0.75 ดอลลาร์

By mk

on 18 July 2025 - 06:32 Tag: Veo, Gemini, Google, LLM

Veo

กูเกิลเปิดใช้เช่าใช้งานโมเดลสร้างวิดีโอ Veo 3 ผ่าน Gemini API โดยยังมีสถานะเป็นพรีวิว และใช้คู่กับ Veo 2 ของเดิม

สิ่งที่ทุกคนสนใจที่สุดคงเป็น "ราคา"

Veo 3 แบบมีเสียงประกอบ วินาทีละ 0.75 ดอลลาร์
Veo 3 แบบไม่มีมีเสียงประกอบ วินาทีละ 0.50 ดอลลาร์
Veo 2 ไม่มีมีเสียงประกอบอยู่แล้ว วินาทีละ 0.35 ดอลลาร์

จะเห็นว่าราคา Veo 3 แพงขึ้นมากว่า Veo 2 อยู่พอสมควร ซึ่งกูเกิลบอกว่าจะออก Veo 3 Fast ที่ทำงานเร็วขึ้น ราคาถูกลง ตามมา

Gemini Live สั่งงานแอพซัมซุง เช่น Samsung Calendar, Reminder, Notes ได้แล้ว

By mk

on 12 July 2025 - 20:11 Tag: Gemini, Samsung, Android, Google

Gemini

ข่าวเล็กๆ ที่น่าสนใจจากงานเปิดตัว Galaxy Z Fold/Flip 7 ของซัมซุงคือ กูเกิลประกาศว่าแอพ Gemini Live รองรับการเชื่อมต่อกับแอพของซัมซุง เช่น Samsung Calendar, Reminder, Samsung Notes เพิ่มเติมจากที่รองรับแอพของกูเกิลเอง ไปก่อนหน้านี้

เท่ากับว่าเราสามารถเปิดโหมด Gemini Live ถ่ายภาพโปสเตอร์คอนเสิร์ตที่อยู่ตรงหน้า แล้วเช็คกับปฏิทิน Samsung Calendar ได้เลยว่าเราว่างวันนั้นหรือไม่ ลงนัดหมายให้ได้เลย

ที่มา - Google

Subscribe to Gemini