เมตามีเดีย เจ้าของแบรนด์ Longdo ที่ให้บริการทั้งพจนานุกรมและแผนที่ออนไลน์ เปิดซอร์สโปรแกรม thpronun สำหรับการแปลงคำภาษาไทยให้กลายเป็นเสียงอ่าน
ตัวโปรแกรมพัฒนาโดยคุณเทพพิทักษ์ การุญบุญญานันท์ (บทสัมภาษณ์บน Blognone) โดยทางเมตามีเดียซื้อไลเซนส์ซอฟต์แวร์ในรูปแบบ GPL ทำให้ซอฟต์แวร์เปิดให้คนทั่วไปใช้งานด้วย
ตัวโปรแกรมรับคำภาษาไทยและสามารถคืนค่าเป็นคำอ่านได้ 5 รูปแบบ ได้แก่ คำอ่านตัวโรมัน (ภาษาอังกฤษ), คำอ่านแบบไทย, ค่าการออกเสียง (phonetic), ค่าเสียงดิบที่ตัวโปรแกรมอ่านได้, และค่า soundex
รุ่นแรกที่เปิดสู่สาธารณะคือรุ่น 0.2.0 และหลังจากนี้จะพัฒนาต่อตามกระบวนการพัฒนาของชุมชนโอเพนซอร์ส โดยตัวโปรแกรมพัฒนาบน C++14
ซอร์สโค้ดมีให้ดาวน์โหลดบน GitHub
ที่มา - Theppitak's blog
ข้อมูลเปิดเผย: เมตามีเดีย ลงโฆษณาด้านการจัดหางานกับ Blognone หลายครั้ง ข่าวนี้เป็นความเห็นของผมเองโดยไม่มีข้อตกลงอื่นใดเป็นพิเศษ
Comments
เยี่ยมเลย ถ้า Google จะเอาไปใช้ได้มั้ยนะ
ทุกวันนี้ Text to speech มันยังอ่านชื่อเพื่อนผมแปลกๆ อยู่เลย
อีกอย่างที่ผิดเพี้ยนสุดๆ ก็คือคำที่ลงท้ายด้วย "ร์" เช่น
- แทททูคัลเล่อร์ => แท๊ด-ทู-คัน-เล่อ-ไหร่
- ทเวนตีไฟฟ์อาเวอส์ => ทะ-เวน-ตี้-ไฟ้-อา-เหว่-ออ-ไส่
(Machine learning มันเรียนมายังไงฟระเนี่ย)
ใช้ Thai TTS ตัวไหนครับนั่น ที่อ่านคำที่ลงท้ายด้วย ร์ แปลกแบบนั้น เพราะที่ผมใช้ยังไม่เคยเจอเลยครับ
@ Virusfowl
I'm not a dev. not yet a user.