Tags:
Node Thumbnail

ซัมซุงออกอัพเดตใหญ่ให้ Bixby ผู้ช่วยส่วนตัวบนอุปกรณ์ตระกูล Galaxy ของใหม่ที่สำคัญคือฟีเจอร์ Text Call ที่เคยเปิดตัวในเกาหลีเมื่อเดือนธันวาคม 2022 ตอนนี้ออกเวอร์ชันภาษาอังกฤษแล้ว

Text Call คือการให้ Bixby สนทนาด้วยเสียงทางโทรศัพท์แทนผู้ใช้ (ที่อาจไม่สะดวกรับสาย เช่น กำลังประชุมอยู่) โดยผู้ใช้มีหน้าที่พิมพ์ข้อความที่อยากตอบ จากนั้น Bixby จะแปลงเป็นเสียงพูดแล้วไปคุยกับคนที่โทรมาให้แทน ฟีเจอร์ใหม่ที่เพิ่มเข้ามาคือ Custom Voice Creato ผู้ใช้สามารถอัดเสียงตัวเองเป็นตัวอย่างฝาก Bixby เอาไว้ แล้วแปลงเป็นเสียงพูดที่คล้ายๆ กับเสียงเราได้ ตอนนี้ฟีเจอร์นี้ยังใช้ได้เฉพาะภาษาเกาหลีเท่านั้น

Tags:
Node Thumbnail

Microsoft เปิดตัวปัญญาประดิษฐ์ใหม่ใช้ชื่อว่า VALL-E ที่สามารถเลียนเสียงมนุษย์ได้เพียงแค่ป้อนเสียงตัวอย่างที่มีความยาว 3 วินาที จุดที่น่าสนใจ คือ VALL-E สามารถเลียนน้ำเสียงและอารมณ์ของเสียงต้นแบบและปรับได้ตามโหมดต่าง ๆ ได้ ทำให้แตกต่างจากโมเดลอื่น ๆ นอกจากนี้ ยังสามารถพูดในสิ่งที่เสียงต้นแบบไม่ได้พูดได้ด้วย

Microsoft ใช้เสียงภาษาอังกฤษ 60,000 ชั่วโมงในการเทรนปัญญาประดิษฐ์ อย่างไรก็ตาม เสียงที่สร้างจาก VALL-E บางครั้งก็ดูธรรมชาติ แต่บางครั้งก็ยังเป็นเสียงที่ไม่เหมือนมนุษย์อยู่ดีซึ่งต้องพัฒนาต่อไปในอนาคต

Tags:
Node Thumbnail

Apple Books เปิดตัวบริการออดิโอบุ๊คของตัวเอง โดยใช้ปัญญาประดิษฐ์สังเคราะห์เสียงจากอีบุ๊คที่มีอยู่แล้วในระบบ ไม่ได้ใช้คนมาอ่านเหมือนออดิโอบุ๊คเจ้าอื่น และอีบุ๊คที่มีออดิโอ จะมีแท็ก Narrated by Apple Books อยู่เป็น subtitle ของชื่อหนังสือ

ช่วงแรกหนังสือที่รองรับการสร้างเป็นเสียงอ่านรองรับเฉพาะหนังสือกลุ่มนิยายและโรแมนติก ที่จะมีเสียงอ่านของ Madison (ญ) และ Jackson (ช) กำหนดเอาไว้ในหมวดนี้ และ Helena (ญ) and “Mitchell (ช) สำหรับหมวดพัฒนาตนเองและ non-fiction

เจ้าของหนังสือหรือสำนักพิมพ์ที่วางขายบน Apple Books และสนใจ จะยื่นเรื่องให้ Apple พิจารณาและตรวจสอบเงื่อนไขต่างๆ ก่อน และการแปลงเป็นออดิโอบุ๊ค จะผ่านพาร์ทเนอร์ของ Apple

Tags:
Node Thumbnail

นัดแสดงชาวอเมริกัน James Earl Jones เป็นเจ้าของเสียงพากย์ Darth Vader อันเป็นเอกลักษณ์ มาตั้งแต่ภาพยนตร์ภาคแรกในปี 1977 และยังให้เสียง Darth Vader ต่อเรื่อยมาในภาพยนตร์ยุคหลังๆ เช่น Rogue One ที่ฉายในปี 2016 และ The Rise of Skywalker ในปี 2019

แต่ Jones ปัจจุบันมีอายุ 91 ปีแล้ว เสียงเขาเปลี่ยนไปจากเดิมมาก ในซีรีส์ Obi-Wan Kenobi ที่ฉายในปี 2022 นี้จึงไม่ใช่เสียงที่แท้จริงของเขาอีกต่อไป แต่เป็นเสียงที่ใช้ AI สร้างขึ้นมาจากคลังเสียงเดิม โดยที่ Jones เซ็นยินยอมให้ใช้งาน (แต่เครดิตท้ายเรื่องยังเป็นชื่อของ Jones ในฐานะเจ้าของเสียง)

Node Thumbnail

ที่งาน LINE Developer Day 2018 บริษัท LINE เปิดตัวบริการ Chatbot Engine เครื่องมือสำหรับสร้างแชทบ็อต

ก่อนหน้านี้ LINE เปิดให้ทำแชทบ็อตอยู่แล้ว แต่กระบวนการยังค่อนข้างยุ่งยากและนักพัฒนาต้องทำงาน manual เยอะ แต่ด้วย Chatbot Engine ทำให้การสร้างแชทบ็อตง่ายขึ้น มี GUI ให้พร้อมสรรพสำหรับการกำหนดคำถาม-คำตอบของบ็อตด้วย

ทีมพัฒนาของ LINE ระบุว่าเบื้องต้นยังรองรับบ็อตที่แชทแบบข้อความเท่านั้น แต่ในอนาคตจะทำให้รองรับการคุยด้วยเสียงเช่นกัน

Tags:
Node Thumbnail

Amazon ได้เปิดตัว Speech Synthesis Markup Language (SSML) ไปแล้วในช่วงก่อนหน้านี้ไม่กี่วัน และตอนนี้ Amazon ก็ได้ใช้ประโยชน์จากเทคโนโลยีนี้ในการเพิ่มความสามารถให้ Alexa พูดได้เหมือนมนุษย์มากขึ้น คือมีลูกเล่นในการพูดเยอะ และไม่ทำให้เสียงเป็นหุ่นยนต์มากจนเกินไป

Tags:
Node Thumbnail

แอปเปิลอัพเดต VoiceOver Kit 1.4 สำหรับ iPod shuffle และ iPod nano ซึ่งใช้ในการอ่านออกเสียงชื่อเพลงและชื่ออัลบัม โดยในเวอร์ชันนี้มีการปรับปรุงการออกเสียงภาษาเกาหลี เยอรมัน และรัสเซีย และทำให้ iPod shuffle รุ่นล่าสุดรองรับภาษาเพิ่มคือภาษาอังกาเรียน โรมาเนีย สโลวัก และไทย

ป.ล. iPod nano รุ่นล่าสุดรองรับภาษาไทยอยู่แล้ว เช่นเดียวกับ iPhone และ iPod touch แต่ต้องเปิดโหมดสำหรับผู้พิการก่อน

ที่มา: iLounge ผ่าน iClarified

Tags:
Node Thumbnail

แม้จะยังซื้อ Groupon ไม่สำเร็จ แต่วันนี้กูเกิลประกาศการซื้อกิจการ 2 บริษัทรวด

บริษัทแรกชื่อ Widevine ให้บริการเผยแพร่วิดีโอออนไลน์แก่บริษัทขนาดใหญ่อื่นๆ บริษัทนี้มีเทคโนโลยีด้าน DRM (ดูภาพประกอบ) และการปรับปรุงวิดีโอให้เหมาะสมกับอุปกรณ์ปลายทาง กูเกิลสัญญาว่าจะดูแลลูกค้าเดิม (และลูกค้าใหม่) ของ Widevine อย่างดี แต่ก็บอกว่าจะนำเทคโนโลยีของ Widevine ไปใช้ต่อ

No Description