Text-to-Speech

ทีมวิจัยไมโครซอฟท์สร้างปัญญาประดิษฐ์แปลงเสียงเป็นข้อความ ใช้เสียงพูดพร้อมข้อความแค่ 20 นาที ระบบอ่านฟังออก 99.84%

By lew

on 27 May 2019 - 13:03 Tag: Artificial Intelligence, Microsoft, Text-to-Speech

Artificial Intelligence

ทีมวิจัยร่วมระหว่างไมโครซอฟท์และมหาวิทยาลัยเจ้อเจียง (Zhejiang University) รายงานความสำเร็จในการออกแบบปัญญาประดิษฐ์ที่สามารถแปลงข้อความเป็นเสียงพูด (text-to-speech - TTS) และแปลงเสียงพูดเป็นข้อความ (automatic speech recognition - ASR) โดยใช้ข้อมูลปริมาณน้อยมาก คิดเป็นเสียงพูดประมาณ 20 นาทีเท่านั้น แต่ยังความแม่นยำของการสร้างเสียงพูดที่ฟังออก (intelligible rate) สูงถึง 99.84%

กูเกิลเปิดตัว Cloud Text-to-Speech บริการสร้างเสียงพูดเหมือนมนุษย์ ใช้เทคโนโลยีเดียวกับ Assistant

By lew

on 28 March 2018 - 09:00 Tag: Google Cloud, Text-to-Speech, Artificial Intelligence

Google Cloud

DeepMind นำเสนองานวิจัย WaveNet โมเดลปัญญาประดิษฐ์ deep learning สำหรับสร้างเสียงพูดและเสียงดนตรีมาตั้งแต่ปี 2016 และนำมาใช้กับ Google Assistant เมื่อปีที่แล้ว ตอนนี้มันก็กลายเป็นสินค้าบน Google Cloud Platform แล้ว แต่ยังไม่รองรับภาษาไทย

กูเกิลระบุว่ามีจำนวนเสียงให้เลือกกว่า 30 เสียงแล้วแต่ภาษา เช่น ภาษาอังกฤษแบบสหรัฐฯ มี 6 เสียง บริการรองรับภาษา SSML (Speech Synthesis Markup Language) สำหรับการกำหนดจังหวะหายใจ การเน้นเสียง หรือการปรับความเร็วในบางช่วง เพื่อความสมจริงยิ่งขึ้นด้วย

พบกับ Tacotron 2 ระบบสร้างเสียงพูดด้วย AI ที่เหมือนเสียงมนุษย์มากจนแยกแทบไม่ออก

By BlackMiracle

on 1 January 2018 - 00:33 Tag: Google, Text-to-Speech, Artificial Intelligence

Google

เรื่องเสียงพูดจากคอมพิวเตอร์ก็เป็นอีกประเด็นที่หลายเจ้าพยายามทำให้เหมือนเสียงมนุษย์มากที่สุด ล่าสุดวิศวกรของกูเกิลทีมหนึ่งได้ตีพิมพ์เอกสารนำเสนอระบบสร้างเสียงพูดตัวใหม่ในชื่อ Tacotron 2 ที่ฟังแล้วแยกแทบไม่ออกว่าเป็นเสียงมนุษย์หรือเสียงจากระบบนี้

Tacotron 2 จะสร้าง spectrogram หรือรูปที่แสดงให้เห็นว่าคำพูดควรจะมีเสียงอย่างไร แล้วเอารูปนี้ไปผ่านอัลกอริทึม WaveNet ของกูเกิลเอง ทำให้ได้เสียงพูดที่เหมือนมนุษย์มาก

งานวิจัย AI ตรวจสอบการปลอมลายมือได้ แต่มันเองก็ปลอมลายมือได้ด้วยเช่นกัน

By ตะโร่งโต้ง

on 17 August 2016 - 11:42 Tag: Text-to-Speech, Font, Artificial Intelligence

Text-to-Speech

งานวิจัยชื่อ My Text in Your Handwriting จาก University College London สามารถเรียนรู้รูปแบบลายมือการเขียนข้อความของคนจนสามารถแยกแยะข้อความของคนอื่นที่พยายามเลียนแบบเพื่อปลอมลายมือนั้นได้ และที่สำคัญตัวโปรแกรมเองสามารถสังเคราะห์ข้อความที่กำหนดขึ้นมาโดยใช้ลายมือดังกล่าวได้เองด้วย

Kindle Audio Adapter คินเดิลกลับมาอ่านหนังสือให้กับผู้พิการฟังได้แล้ว

By tekkasit

on 11 May 2016 - 23:34 Tag: Kindle Paperwhite, Text-to-Speech, E-book, Accessibility

Kindle Paperwhite

หลังจากสี่ปีก่อนที่อเมซอนเปิดตัว Kindle Touch ซึ่งเป็นคินเดิลรุ่นสุดท้ายที่ยังมีฟีเจอร์อ่านออกเสียง นับแต่นั้นเป็นต้นมาอเมซอนก็เดินหน้าตัดช่องเสียบหูฟัง ตัดลำโพงออก และตัดฟีเจอร์อ่านออกเสียงออก (Text-to-Speech) หลังจากนั้นก็เดินหน้าขายหนังสือเสียงผ่าน Audible เต็มที่ ทำให้ผู้ที่มีปัญหาทางสายตาไม่มีทางเลือกมากนักในการใช้งานอุปกรณ์คินเดิล

ลำโพง Amazon Echo อ่านหนังสือจาก Kindle ให้เราฟังได้แล้ว

By mk

on 16 January 2016 - 21:01 Tag: Amazon, E-book, Kindle, Text-to-Speech, Amazon Echo

Amazon

ลำโพงอัจฉริยะ Amazon Echo ได้ฟีเจอร์ใหม่ชื่อ Kindle Books by Alexa ให้ผู้ช่วยส่วนตัว Alexa อ่านหนังสือในระบบ Kindle ให้เราฟังได้ด้วย

Alexa จะอ่านอีบุ๊กในไลบรารี Kindle ของเราโดยใช้เทคโนโลยี text-to-speech แบบเดียวกับที่ใช้อ่านบทความและข่าวให้เราฟัง แต่น่าเสียดายว่ายังไม่สามารถฟัง audiobook จากระบบ Audible ได้ ความสามารถก็ยังถือว่าจำกัดอยู่บ้างครับ

กูเกิลรายงานโครงการ Unison ตั้งเป้าสร้างระบบออกเสียงจากข้อความในภาษาที่มีข้อมูลน้อย

By lew

on 9 September 2015 - 20:15 Tag: Google, Research, Text-to-Speech

Google

กูเกิลรายงานถึงโครงการวิจัย Unison เป็นโครงการเพื่อการเก็บข้อมูลพัฒนาระบบออกเสียงจากข้อความ (text-to-speech - TTS) จากภาษาที่มีข้อมูลน้อย (low resource languages) โดยเลือกภาษาบังคลาเทศ และใช้อาสาสมัครที่เป็นพนักงานของกูเกิลเองมาช่วยพูดให้เสียง

Google Text to Speech รองรับภาษาไทยแล้ว

By Virusfowl

on 18 July 2015 - 17:58 Tag: Google, Android, Text-to-Speech, Accessibility

Google

ก่อนหน้านี้เราเคยมี Vaja และ Vocalizer ซึ่งเป็นแอพพลิเคชัน Text to Speech บนระบบปฏิบัติการแอนดรอยด์ ซึ่งมีเสียงอ่านในภาษาไทย ล่าสุด Google ก็ได้เพิ่มความสามารถนี้ให้ชาวไทยแล้วเช่นกัน

โดยในการอัพเดตล่าสุด แอพ Google Text to Speech เวอร์ชัน 3.56.2080558 ได้เพิ่มการรองรับการอ่านในภาษาต่างๆ อีกกว่า 6 ภาษา ได้แก่ Cantonese (Hong Kong), Chinese (China), Hindi (India), Indonesian (Indonesia), Thai (Thailand) และ Turkey (Turkish)

สิ้นสุดการรอคอย เสียง Vocalizer สำหรับ Android ออกมาให้ใช้งานกันแล้ว

By Virusfowl

on 15 January 2015 - 09:59 Tag: Android, Text-to-Speech, Accessibility

Android

เมื่อเกือบปีที่ผ่านมา ทาง Code Factory ได้ปล่อย เสียง Eloquence ซึ่งเป็นเสียง Text to Speech (TTS) ยอดนิยม สำหรับระบบปฏิบัติการ Android ออกมาให้เราได้ใช้งานกัน แต่เนื่องจากเสียง Eloquence นั้นเป็น TTS สำหรับภาษาอังกฤษ คนไทยเราอาจจะใช้งานได้ไม่สะดวกนัก แต่ล่าสุด ทาง Code Factory ได้ปล่อยเสียง TTS ตัวล่าสุดออกมาให้เราได้ใช้งานกัน ซึ่งก็คือ Vocalizer นั่นเอง

สัมภาษณ์ ดร.ชัย วุฒิวิวัฒน์ชัย ผู้อยู่เบื้องหลัง VAJA โปรแกรม Text-to-Speech ภาษาไทย

By littletail

on 17 June 2014 - 15:06 Tag: Interview, Researcher, NECTEC, Text-to-Speech, Vaja

Interview

ที่ผ่านมา หลายบริษัทได้ขยับตัวไปเล่นในตลาดเทคโนโลยีทางด้านเสียงมากขึ้น อย่างการนำไปประยุกต์เป็น voice input/output ในสมาร์ทโฟน หรือการประยุกต์ใช้กับอุปกรณ์ไฟฟ้าภายในบ้าน ด้วยความที่ผมสนใจในเรื่องพวกนี้อยู่พอสมควร แล้วก็มีโอกาสได้เห็นการสาธิตโปรแกรม VAJA ของ สวทช. ในงาน Microsoft Innovation Days จึงได้นัดสัมภาษณ์ ดร. ชัย วุฒิวิวัฒน์ชัย ผู้อำนวยการหน่วยวิจัยวิทยาการสารสนเทศแห่ง NECTEC บุคคลหนึ่งที่เป็นผู้อยู่เบื้องหลังของโปรแกรมนี้เกี่ยวกับแนวคิดและความเป็นมาในการวิจัยและพัฒนาโปรแกรม

มาแล้วเสียง Eloquence TTS สำหรับ Android

By Virusfowl

on 6 May 2014 - 04:57 Tag: Android, Text-to-Speech, Accessibility

Android

เสียงสังเคราะห์อย่าง ETI-Eloquence นี้สำหรับคนตาบอดที่ใช้โปรแกรมอ่านจอภาพคงจะคุ้นเคยกันเป็นอย่างดี เนื่องจากเสียงนี้ได้ถูกใช้เป็นค่าปริยายบนโปรแกรมอ่านจอภาพยอดนิยมอย่าง Jaws for Windows ดังนั้นถึงแม้ว่าเจ้า Eloquence TTS ตัวนี้อาจจะไม่ใช่เสียงที่มีความชัดหรือเป็นธรรมชาติที่สุด แต่ด้วยความคุ้นเคย หลายคนก็อาจจะรอคอย TTS ตัวนี้ให้สามารถใช้งานบนระบบปฏิบัติการอื่นๆ นอกจากบนวินโดส์ได้อยู่เหมือนกัน

กูเกิลออกไฟล์เสียงพูด Android Text-to-Speech เวอร์ชันคุณภาพสูง

By mk

on 7 March 2014 - 12:28 Tag: Google, Android, Text-to-Speech

Google

กูเกิลอัพเดต Google Text-to-speech Engine บน Android เวอร์ชัน 3.0 โดยการเปลี่ยนแปลงที่สำคัญคือเพิ่ม "เสียงพูดคุณภาพสูง" ที่ฟังดูเป็นมนุษย์มากขึ้น ไฟล์เสียงภาษาอังกฤษมีขนาด 244MB (ของเดิม 6.8MB) มีให้เลือกดาวน์โหลดทั้งสำเนียงแบบบริติชและอเมริกัน (ดาวน์โหลดแยกเองในหน้า Settings > Language & input > Text-to-speech)

นอกจากนี้กูเกิลยังปรับ UI ใหม่ให้บริหารจัดการไฟล์เสียงได้ง่ายขึ้น และเพิ่มเสียงพูดในภาษาโปรตุเกสสำเนียงบราซิล กับสเปนสำเนียงอเมริกัน เข้ามาด้วย

Google ทำแอพ Google Text-to-Speech ให้โหลดได้โดยตรงจาก Google Play แล้ว

By ตะโร่งโต้ง

on 12 November 2013 - 02:19 Tag: Google, Application, Text-to-Speech

Google

Google นำระบบการอ่านออกเสียงของ Android มาทำเป็นแอพ Google Text-to-Speech ให้ดาวน์โหลดได้โดยตรงผ่านทาง Google Play

ระบบการอ่านออกเสียงหรือที่เรียกโดยทั่วไปว่า TTS (Text To Speech) นี้ คือการใช้เสียงสังเคราะห์อ่านข้อความที่ถูกเลือกหรือกำหนดไว้โดยผู้ใช้ ซึ่ง Google เองได้พยายามพัฒนาระบบดังกล่าวเพื่อให้สามารถใช้งานได้กับระบบปฏิบัติการ Android แต่ผู้ผลิตอุปกรณ์ Android หลายค่ายกลับเลือกที่จะตัดระบบนี้ออกไปจากผลิตภัณฑ์ที่วางจำหน่ายจริง

เมื่อ Text-to-Speech ของกูเกิล พูดเองว่า "He now praises the iPad"

By nutmos

on 5 January 2013 - 14:47 Tag: Google, Text-to-Speech, iPad, Google Translate

Google

เกิดเรื่องฮา ๆ ขึ้นได้อย่างไรก็ไม่รู้ เมื่อเอนจิน text-to-speech ของกูเกิลเพี้ยน ทำให้ทั้ง Google Now และ Google Translate พูดคำว่า "He now praises the iPad" หรือ "เขายกย่อง iPad" ในประโยคที่มีคำเหล่านี้: end with, enraged with และ filled with

เรื่องเกิดตั้งแต่เดือนตุลาคมปี 2012 มีคนแจ้งปัญหานี้ในหน้า Android support ของกูเกิล แต่ทาง Hacker News เพิ่งจะไปขุดและเขียนข่าวขึ้นมาจนเป็นประเด็น

ไม่สิ้นหวังแล้ว! เมื่อ NECTEC เปิดให้ทดสอบ Vaja for Android (beta)

By Virusfowl

on 23 February 2012 - 01:12 Tag: Android, NECTEC, Text-to-Speech, Accessibility, Vaja

Android

ความหวังในการใช้งานโทรศัพท์มือถือ Android สำหรับคนตาบอด (โดยเฉพาะในประเทศไทย) เริ่มเห็นแววอีกครั้ง เมื่อ NECTEC ประกาศเปิดให้บุคคลทั่วไปได้ทดสอบ Vaja Android

Text-to-Speech API อย่างไม่เป็นทางการจากกูเกิล

By tomyum on 15 December 2009 - 02:17 Tag: Google, Text-to-Speech

Google

เมื่อเดือนที่แล้วกูเกิลได้เผยความสามารถใหม่ของ Google Translate หนึ่งในลูกเล่นใหม่เหล่านั้นมีฟังค์ชั่น text-to-speech อย่างง่ายๆ อยู่ด้วย คุณสามารถลองดูได้ หรือดูวีดิโอนี้ว่ามันทำงานอย่างไร (ที่ 0:45 นาที)

Subscribe to Text-to-Speech