Tags:
Node Thumbnail

กูเกิลออกคำชี้แจง หลังจากมีรายงานพบว่า Gemini AI สร้างรูปภาพ ทำงานไม่ถูกต้องเมื่อได้รับคำสั่งให้สร้างรูปภาพบุคคลที่มีจริงในประวัติศาสตร์ ผิดเพี้ยนออกไปจากความจริง เช่น ภาพโป๊ปเป็นคนดำ หรือผู้ก่อตั้งกูเกิลเป็นคนเอเชีย ซึ่งทำให้กูเกิลต้องประกาศปิดการทำงานคำสั่งสร้างรูปภาพบุคคลชั่วคราว

ฟีเจอร์สร้างรูปภาพใน Gemini มีออกมาตั้งแต่ต้นเดือนกุมภาพันธ์ที่ผ่านมา โดยใช้ Imagen 2 โมเดลสำหรับการสร้างรูปภาพ

Tags:
Node Thumbnail

MediaTek ประกาศความสำเร็จในการปรับแต่งโมเดล Google Gemini Nano และ Meta Llama 2 7B ให้รันบนชิป Dimensity 9300 และ 8300 เปิดทางให้ใช้งานฟีเจอร์ Generative AI แบบออฟไลน์ ไม่ต้องผ่านคลาวด์

การรันโมเดลเหล่านี้บนชิป เกิดขึ้นได้เพราะใช้ APU (AI processing unit ตามภาษาของ MediaTek) รุ่นใหม่ที่มีประสิทธิภาพสูงขึ้น

MediaTek ประกาศว่าจะร่วมมือกับกูเกิลเปิดตัวแอพ APK ที่ช่วยให้นักพัฒนาและแบรนด์ OEM รันโมเดล Gemini Nano ของตัวเองบนชิป Dimensity ในเร็วๆ นี้

Tags:
Node Thumbnail

หลังมีกระแสใน X เรื่องการเจนภาพของ Gemini ที่มีความ Woke มากเกินไปจนผิดเพี้ยนไปจากประวัติศาสตร์หรือความเป็นจริง เช่นภาพโป๊ปเป็นคนดำ, ผู้ก่อตั้งสหรัฐอเมริกา เป็นคนดำและเอเชีย

ล่าสุด Google เผยว่ารับทราบเรื่องนี้และจะแก้ไขปัญหานี้แล้ว โดยระหว่างนี้จะระงับการให้บริการเจนภาพไปก่อน และจะกลับมาให้บริการในเวอร์ชันที่ถูกปรับปรุงแล้ว

ปัญหาของ Gemini ที่หลายคนโพสต์บน X ไม่ได้มีแค่เรื่องของการเจนภาพจาก prompt กลางๆ แต่ยังมีปัญหากับ prompt บางคำ เช่น หากกำหนดว่าเป็นผิวขาว "white" ตัว Gemini จะตอบกลับว่าทำให้ไม่ได้ เพราะอาจส่งผลให้เกิดการอคติหรือเหมารวม (stereotype) ต่อบางชาติพันธุ์ ขณะที่หาก prompt เป็นคำอย่าง "Asian", "Jewish" กลับสามารถเจนภาพออกมาได้ตามปกติ

Tags:
Node Thumbnail

Chrome 122 เพิ่มฟีเจอร์ Help Me Write ที่ประกาศไว้ก่อนหน้านี้ โดยยังรองรับเฉพาะภาษาอังกฤษสำหรับผู้ใช้งานในสหรัฐ และมีเฉพาะบนวินโดวส์และแมค

ฟีเจอร์ Help Me Write ของ Chrome เป็นการนำโมเดล Gemini มาช่วยเขียนหรือปรับแก้ข้อความใน textbox บนหน้าเว็บ เช่น รีวิวร้านอาหาร ประกาศขายสินค้าออนไลน์ สอบถามข้อมูลจากโรงแรมที่จะเข้าพัก ฯลฯ โดย Gemini จะเข้าใจบริบทของหน้าเว็บที่เราเปิดอยู่ตอนนั้น และช่วยแนะนำเนื้อหาที่เราต้องการเขียนได้

การใช้งานจำเป็นต้องเปิดใช้ใน Settings > Experimental AI แล้วคลิกขวาที่กล่องข้อความเพื่อเลือกเมนู Help me write

Tags:
Node Thumbnail

กูเกิลประกาศปิดการทำงานฟีเจอร์สร้างรูปภาพด้วย AI ของ Gemini ชั่วคราว มีผลเฉพาะการสร้างรูปภาพบุคคล โดยจะเปิดให้ใช้งานอีกครั้งในภายหลัง เนื่องจากพบปัญหาในการสร้างรูปภาพประเภทดังกล่าว

ผู้ใช้งาน Gemini ที่ให้คำสั่งสร้างรูปภาพที่มีบุคคล ตอนนี้จะได้คำตอบว่าตอนนี้ระบบกำลังปรับปรุงแก้ไขอยู่

Tags:
Node Thumbnail

กูเกิลประกาศนำโมเดล Gemini เข้ามาใช้งานในแอพชุด Google Workspace ได้แก่ Gmail, Docs, Sheets, Slides, Meet

ในแง่ฟีเจอร์ไม่ต่างอะไรจากฟีเจอร์กลุ่ม Duet AI ใน Workspace ที่เคยเปิดตัวมาก่อน แต่คราวนี้คือรีแบรนด์มาใช้ชื่อ Gemini และอัพเกรดมาใช้โมเดลเวอร์ชันใหม่ที่ทรงพลังกว่าเดิม

การใช้งาน Gemini ใน Google Workspace จำเป็นต้องซื้อแพ็กเกจ Google One AI Premium ราคา 19.99 ดอลลาร์ต่อเดือน ซึ่งจะได้สิทธิใช้งาน Gemini Advanced ที่เป็นโมเดล Ultra 1.0 ด้วย

Tags:
Node Thumbnail

กูเกิลเปิดตัว Gemma โมเดลภาษาแบบโอเพนซอร์ส ที่ได้แรงบันดาลใจมาจาก Gemini โมเดลเชิงพาณิชย์ของตัวเอง และพัฒนาโดยทีม Google DeepMind เหมือนกัน มีโครงสร้างทางเทคนิคบางส่วนเหมือนกัน

กูเกิลปล่อย Gemma ออกมา 2 ขนาดคือ 2B และ 7B (ดาวน์โหลดได้จาก Kaggle หรือ Hugging Face) โดยระบุว่าโมเดลขนาด 7B สามารถเอาชนะคู่แข่งที่ระดับเดียวกันคือ Llama 7B ในเบนช์มาร์คต่างๆ ได้ค่อนข้างทิ้งห่าง และเอาชนะได้แม้กระทั่ง Llama 13B ที่มีขนาดใหญ่กว่าได้ด้วยซ้ำ

Tags:
Node Thumbnail

กูเกิลอัพเดตบริการ Gemini Advanced (ที่ตอนนี้น่าจะยังอยู่ในช่วงทดสอบฟรีกันทุกคน) ให้สามารถรันโค้ดภาษา Python ได้ในเว็บ เป็นฟีเจอร์สำหรับผู้ใช้ที่สมัครแพ็กเกจจ่ายเงินเท่านั้น

แนวทางนี้ทำให้ผู้ใช้สามารถกดรันโค้ดและดูผลลัพธ์ได้ทันที โดยเมื่อผู้ใช้กดรันโค้ดบนหน้าเว็บแล้วเว็บ Gemini จะส่งโค้ดไปรันบนเซิร์ฟเวอร์เพื่อแสดงผล โดยตัว Gemini นั้นไม่ได้อ่านผลการรันด้วยตัวเองแต่อย่างใด ทำให้บางคำถาม ตัว Gemini จะตอบผลที่ผิดแม้จะเขียนโค้ดถูกและเมื่อรันโค้ดแล้วได้ผลลัพธ์ที่ถูกต้องก็ตาม

Tags:
Node Thumbnail

Dylan Roussel นักแกะฟีเจอร์ใหม่ Android โพสต์ข้อมูลที่เขาพบในบัญชี X เกี่ยวกับฟีเจอร์ใหม่ที่เตรียมประกาศของ Gemini สำหรับลูกค้า Google Workspace เพื่อนำ Gemini มาใช้ภายในองค์กร ที่ต้องการความสามารถปกป้องข้อมูลเพิ่มเติม

แผนที่กูเกิลเปิดให้สมัครได้แก่ Gemini Business และ Gemini Enterprise สามารถใช้งานโมเดล Gemini Ultra 1.0 โดยกูเกิลจะไม่นำข้อมูลในการสนทนาไปใช้ในการเทรน AI รองรับเฉพาะภาษาอังกฤษสำหรับลูกค้าใน 150 ประเทศ ทั้งนี้รายละเอียดและราคาต้องรอประกาศทางการอีกครั้ง

Tags:
Node Thumbnail

กูเกิลมีเครื่องมือ IDE ผ่านเบราว์เซอร์ชื่อ IDX เปิดตัวมาตั้งแต่กลางปี 2023 รากฐานของมันคือ VS Code เวอร์ชันรันผ่านเบราว์เซอร์ แล้วเพิ่มฟีเจอร์การใช้ AI ช่วยเขียนโค้ดเข้ามา ลักษณะเดียวกับ GitHub Copilot

ในช่วงแรก โมเดล AI ที่ช่วยเขียนโค้ดยังเป็น Codey ที่พัฒนาต่อจากโมเดลภาษา PaLM 2 แต่เมื่อกูเกิลอัพเกรดโมเดลเป็น Gemini เรียบร้อยแล้ว ทำให้ IDX เปลี่ยนมาใช้ Gemini ตามมาด้วย

Tags:
Node Thumbnail

นอกจากเปิดตัว Gemini 1.5 Pro แล้ว กูเกิลยังประกาศว่าโมเดล AI ทั้ง Gemini 1.0 Pro และ Gemini 1.0 Ultra ที่เปิดตัวเมื่อสัปดาห์ที่แล้ว ตอนนี้เปิดให้นักพัฒนาสามารถใช้งานได้แล้วผ่าน Vertex AI

โดย Gemini 1.0 Pro สามารถใช้งานได้แล้วสำหรับลูกค้า Vertex AI ทุกคน ส่วน Gemini 1.0 Ultra โมเดลรุ่นใหญ่ที่สุดในตระกูล Gemini ที่กูเกิลบอกว่าคะแนนทดสอบสูงกว่า GPT-4 ตอนนี้เปิดให้ใช้งานสำหรับลูกค้า Vertex AI ที่อยู่ใน allowlist

ที่มา: กูเกิล

Tags:
Node Thumbnail

กูเกิลเพิ่งเปิดตัว Gemini Ultra ไปหมาดๆ วันนี้ปล่อยของต่อเนื่องด้วยโมเดลเวอร์ชันอัพเดต Gemini 1.5 Pro ซึ่งเป็นการอัพเกรดโมเดลระดับกลาง (Pro) ที่มีความสามารถระดับเดียวกับ Gemini 1.0 Ultra แต่ใช้พลังประมวลผลน้อยกว่า

ฟีเจอร์เด่นของ Gemini 1.5 Pro ที่น่าสนใจคือการรองรับอินพุตขนาดใหญ่ถึง 1 ล้านโทเคน ซึ่งถือว่ามากที่สุดในบรรดาโมเดลภาษาขนาดใหญ่ทุกวันนี้ (Anthropic Claude 2.1 รองรับ 2 แสนโทเคน) เปิดโอกาสให้ใช้งานโมเดล LLM กับงานที่หลากหลายขึ้นอีกมาก กูเกิลเทียบให้เห็นภาพว่าเท่ากับคลิปเสียงยาว 11 ชั่วโมง, วิดีโอ 1 ชั่วโมง, เอกสาร 700,000 คำ, โค้ด 30,000 บรรทัด

Tags:
Node Thumbnail

Sundar Pichai ซีอีโอกูเกิลให้สัมภาษณ์กับ Wired เนื่องในโอกาสเปิดตัว Gemini Advanced ซึ่งเป็นโมเดลปัญญาประดิษฐ์ที่เก่งที่สุดของกูเกิลในตอนนี้

Pichai บอกว่าจุดเด่นที่สุดของ Gemini คือความเป็น multimodal หรือการเทรนด้วยข้อมูลหลากหลายประเภท เช่น ข้อความ รูปภาพ เสียง โค้ดโปรแกรม ทำให้ Gemini รองรับอินพุตหลากหลายตั้งแต่ต้น มนุษย์สามารถสั่งงาน Gemini ได้ผ่านข้อความ เสียง หรือรูปภาพ แบบไม่ต้องแปลงฟอร์แมตก่อน ตรงนี้เป็นสิ่งที่ Gemini แตกต่างจากคู่แข่งฝั่ง OpenAI/Microsoft ที่โมเดลแต่ละตัวทำงานแยกจากกัน

Tags:
Node Thumbnail

หลังจากกูเกิลเริ่มปล่อยโมเดล Gemini Ultra ให้ใช้งานกันเมื่อคืนนี้ ก็เริ่มมีการเปรียบเทียบกับโมเดลอื่นในท้องตลาด โดยเฉพาะ GPT-4 ที่ยังเป็นผู้นำตลาดอยู่ในตอนนี้

Ethan Mollick อาจารย์ที่ Wharton School of the University of Pennsylvania ซึ่งมีโอกาสได้ลองใช้งาน Gemini Ultra ก่อนคนทั่วไปมาราวหนึ่งเดือน ได้โพสต์แสดงความเห็นในฐานะคนที่ลองใช้งานมาแล้วอย่างจริงจัง ระบุว่า โมเดล Gemini Ultra (ให้บริการภายใต้ชื่อ Gemini Advanced) ถือเป็นโมเดลระดับเดียวกับ GPT-4 อย่างชัดเจน ทำให้ตอนนี้วงการ AI มีโมเดลชั้นนำ 2 ตัว จากเดิมที่มีแค่ GPT-4 ตัวเดียว

Tags:
Node Thumbnail

กูเกิลรวมบริการด้าน LLM ที่เคยมีหลายชื่อ เช่น Bard, Duet AI เข้าเป็นชื่อ Gemini พร้อมกับปล่อยแอป Gemini เฉพาะบนแอนดรอยด์ และใส่ฟีเจอร์ Gemini ในแอป Google บน iOS

บริการ LLM บน Google Workspace จะเปลี่ยนชื่อเป็น Gemini for Workspace, บริการ Duet AI ใน Google Cloud จะเปลี่ยนชื่อเป็น Gemini เช่นเดียวกับบริการ Bard ก็เปลี่ยนชื่อเป็น Gemini เช่นกัน

Tags:
Node Thumbnail

กูเกิลปล่อย Gemini Ultra 1.0 โมเดลรุ่นใหญ่ที่สุดในตระกูล Gemini ที่กูเกิลระบุว่าคะแนนทดสอบสูงกว่า GPT-4 โดยเปิดบริการ Gemini Advanced ให้ผู้ใช้ Google One แพ็กเกจระดับ AI Premium ที่มาพร้อมพื้นที่เก็บข้อมูล 2TB ราคาเดือนละ 750 บาท พร้อมช่วงทดสอบฟรีสองเดือน

ราคานี้ใกล้เคียงกับ Copilot Pro ของไมโครซอฟท์ที่เปิดให้ผู้ใช้ทั่วไปซื้อแพ็กเกจ GPT-4 ใช้งาน แต่ถูกกว่า Copilot for Microsoft 365 สำหรับลูกค้าองค์กรที่ราคา 30 ดอลลาร์ต่อเดือน

Tags:
Node Thumbnail

เมื่อไม่นานมานี้เพิ่งมีข่าวว่า กูเกิลจะเลิกใช้ชื่อ Assistant with Bard เปลี่ยนมาใช้ชื่อ Bard แต่ล่าสุดเหมือนคดีพลิกอีกแล้ว เพราะมีหลักฐานใหม่ว่ากูเกิลจะเลิกใช้ชื่อ Bard และเปลี่ยนมาใช้ชื่อ Gemini แทนทั้งหมด

ข้อมูลนี้มาจากผู้ใช้ทวิตเตอร์ชื่อ @evowizz ที่พบภาพหน้าจอของเว็บ Bard ระบุว่า Bard is now Gemini ส่วน 9to5google ลองแกะไฟล์ APK ของแอพ Google Assistant และพบว่าข้อความ Bard ถูกเปลี่ยนเป็น Gemini แล้วเช่นกัน

ที่มา - 9to5google

Tags:
Node Thumbnail

กูเกิลปล่อย Gemini Pro ใน Bard ทุกภาษาแล้ว หลังจากเมื่อปีที่แล้วจำกัดเฉพาะภาษาอังกฤษ ส่วนภาษาอื่นๆ ยังใช้ PaLM-2 มาตลอด การเปลี่ยนแปลงครั้งนี้ทำให้ Bard สามารถสรุป, ทำความเข้าใจ, และให้เหตุผลได้ดีขึ้น

นอกจากการเปลี่ยนโมเดลด้านหลังแล้ว Bard ยังเพิ่มอีกสองฟีเจอร์ ได้แก่

  • สร้างภาพด้วย Imagen2 ในตัว ด้วยการพิมพ์ลงพรอมพ์แชตตามปกติ ภาพที่สร้างขึ้นจะถูกฝังลายน้ำ SynthID เอาไว้ ตอนนี้ยังสั่งได้เฉพาะภาษาอังกฤษเท่านั้น
  • ตรวจคำตอบด้วย Google Search รองรับภาษาเพิ่มเติม

กูเกิลชูประเด็นที่ Bard ได้คะแนนสูงใน LMSYS ว่ายืนยันผลทดสอบที่กูเกิลจ้างบริษัทภายนอกมาสำรวจก่อนหน้านี้

Tags:
Node Thumbnail

LMSYS ผู้จัดอันดับแชตบอทโดยอาศัย Chatbot Arena เป็นการ "ต่อสู้" ระหว่างแชตบอทสองตัวให้ตอบคำถามเดียวกันแล้วให้ผู้ใช้เลือกว่าชอบคำตอบฝั่งใด รายงานผลรอบล่าสุดวันที่ 26 มกราคม 2024 และพบว่า Bard รุ่นที่ใช้ Gemini Pro นั้นแซงหน้า GPT-4 ขึ้นมาเป็นรองเพียง GPT-4 Turbo เท่านั้น

กูเกิลเปิดตัว Gemini โดยระบุว่าทดสอบวงปิดกับผู้ทดอบแล้วว่า Bard รุ่นใหม่นี้เป็นแชตบอทฟรีที่คุณภาพสูงสุดในตลาด ผลการทดลองนี้ก็ดูจะสนับสนุนว่า Gemini ให้ผลโดยรวมที่ดีในภาพรวมจริงๆ

Tags:
Node Thumbnail

กูเกิลประกาศนำโมเดลภาษา Gemini เข้ามาใช้งานใน Google Ads เพื่อช่วยเขียนข้อความโฆษณาได้สะดวกสบายกว่าเดิม ฟีเจอร์นี้เปิดตัวมาตั้งแต่ Google I/O 2023 แต่เพิ่งเริ่มปล่อยให้ใช้งานจริง

บริการนี้จะเพิ่มหน้าต่างแชทลักษณะเดียวกับ Bard หรือใน Google Workspace เข้ามาด้านข้าง เราสามารถใส่ลิงก์เว็บของเราเอง แล้วสั่งให้ Gemini เข้าไปอ่านข้อมูลบนหน้าเว็บ เพื่อร่างข้อความโฆษณามาให้เราตรวจก่อนได้ (ตอนนี้ยังรองรับเฉพาะภาษาอังกฤษ) ผลจากการทดลองกับผู้ใช้บางกลุ่มพบว่าโฆษณามีคุณภาพ (ตามมาตรฐาน Ad Strength ของกูเกิลเอง) ดีขึ้นมาก

Tags:
Node Thumbnail

Galaxy s24 ที่โฆษณาว่าเป็น AI Phone มีฟีเจอร์หลายอย่างที่ซัมซุงร่วมพัฒนากับกูเกิล เช่น Circle to Search

ฝั่งกูเกิลเองออกมาเปิดเผยว่าพลัง AI ของ Galaxy S24 ใช้โมเดล Gemini ตัวใหม่ที่เพิ่งเปิดตัวเมื่อเดือนธันวาคม 2023 โดยมีทั้ง Gemini Pro รุ่นมาตรฐานทำงานฝั่งเซิร์ฟเวอร์ และ Gemini Nano โมเดลขนาดเล็กที่รันในเครื่อง ไม่ต้องต่อเน็ต

Tags:
Node Thumbnail

หลัง Google เปิดตัว Gemini 1.0 โดยมี 3 เวอร์ชันคือ Nano ที่ใช้ใน Pixel แล้ว, Pro ที่ใช้ใน Bard และ Ultra ที่กำลังจะใช้บน Bard Advanced และจะเปิดตัวในปีนี้

ล่าสุดมีนักพัฒนาค้นพบว่า Bard Advanced จะเป็นแบบเสียเงิน (แบบเดียวกับ GPT Plus) โดยจะผูกอยู่กับบริการ Google One ซึ่งช่วงแรกจะเป็นการให้ทดลองใช้ฟรี 3 เดือน

ที่มา - @bedros_p, @evowizz

Tags:
Node Thumbnail

มีรายงานจาก The Information ถึงแผนการพัฒนาสมาร์ทโฟน Pixel 9 และ Pixel 9 Pro ของกูเกิล โดยจะเน้นฟีเจอร์ด้าน AI มากขึ้นกว่าเดิม และเอ็กคลูซีฟสำหรับ Pixel เท่านั้นด้วย

โดยคาดว่า Pixel 9 จะมี AI ผู้ช่วยที่พัฒนาบน Gemini ชื่อเรียกว่า Pixie อาศัยข้อมูลของบริการกูเกิลที่อยู่ในโทรศัพท์ ทำให้การทำงานถูกปรับแต่งค่าสำหรับบุคคล (personalized) มากขึ้นกว่า Google Assistant

Tags:
Node Thumbnail

กูเกิลเปิดให้นักพัฒนาใช้งานโมเดลปัญญาประดิษฐ์ Gemini Pro รุ่นกลางที่ใช้งานใน Bard ตั้งแต่สัปดาห์ที่แล้ว โดยนักพัฒนาสามารถใช้งานได้ฟรีทุกคนในช่วงทดสอบ จำกัดเพียงแค่ห้ามคิวรีเกิน 60 ครั้งต่อนาทีเท่านั้น

โมเดลที่ปล่อยให้ใช้งาน มีทั้ง Gemini Pro ตัวปกติรองรับเฉพาะข้อความ รองรับ context ขนาด 32K และ Gemini Pro Vision ใส่ภาพประกอบได้ด้วย ความพิเศษของ Gemini Pro ที่ปล่อยให้ใช้งานผ่าน API คือมันรองรับภาษาอื่นๆ นอกจากภาษาอังกฤษ รวมทั้งหมด 38 ภาษา

SDK ที่ปล่อยออกมานั้นเปิดให้นักพัฒนาสามารถใช้งานแบบ Generate Content ที่สร้างข้อความต่อจากข้อความที่ผู้ใช้ใส่ลงไป หรือแบบ Chat ที่เป็นการพูดคุยต่อๆ กัน โดยยังไม่มี API แบบ Agent แบบเดียวกับ Assistant API ของ OpenAI

Pages