Tags:
Node Thumbnail

Amazon ประกาศเพิ่มฟีเจอร์ใหม่ให้ Polly บริการแปลงข้อความเป็นเสียงหรือ Text-To-Speech สองอย่าง คือระบบเสียงแบบ Neural Text-To-Speech และสไตล์การพูดแบบพูดประกาศข่าว

สิ่งแรกคือ Neural Text-To-Speech โดย Amazon ได้นำ machine learning มาเพิ่มคุณภาพให้เสียงสังเคราะห์ ทำให้เสียงรูปแบบใหม่ฟังดูเป็นธรรมชาติและใกล้เคียงกับเสียงของมุษย์มากยิ่งขึ้น

ตอนนี้ Neural Text-To-Speech รองรับ 11 เสียง ทั้งในรูปแบบเรียลไทม์และ batch ได้แก่

  • เสียงอังกฤษแบบสหราชอาณาจักร: Amy, Emma และ Brian
  • เสียงอังกฤษแบบสหรัฐฯ: Ivy, Joanna, Kendra, Kimberly, Salli, Joey, Justin และ Matthew

ถัดไปคือสไตล์การพูดแบบผู้ประกาศข่าว เดิม Polly จะพูดออกมาตามข้อความในรูปแบบเสียงที่เรียบเฉย ในการอัพเดตครั้งนี้ Amazon ได้เพิ่มสไตล์การพูดแบบผู้ประกาศข่าวให้ Polly เพื่อให้มีสไตล์การพูดที่เหมือนมนุษย์มากขึ้น ลักษณะเดียวกับการฟังประกาศข่าวทางทีวีหรือวิทยุ

ตอนนี้ สไตล์การพูดแบบผู้ประกาศข่าวยังมีให้ใช้งานเฉพาะเสียงสองแบบในภาษาอังกฤษแบบสหรัฐฯ เท่านั้น คือ Joanna และ Matthew

ฟีเจอร์ใหม่ของ Amazon Polly เริ่มเปิดให้ใช้แล้วใน US East (N. Virginia), US West (Oregon) และ Europe (Ireland)

ที่มา - AWS Blogs

No Description

Get latest news from Blognone

Comments

By: checkmate95
Android
on 31 July 2019 - 20:49 #1122185
checkmate95's picture

ต้องลองเอามาวัดกับ wavenet ของ google