Tags:
Node Thumbnail

ไมโครซอฟท์ประกาศความสำเร็จในการพัฒนาระบบ AI แปลภาษา โดยสามารถแปลข่าวจากภาษาจีนเป็นภาษาอังกฤษได้ในระดับทัดเทียมกับมนุษย์

ระบบ machine translation ของไมโครซอฟท์ใช้เทคนิคหลายอย่างช่วยกันยกระดับคุณภาพการแปล โดยสามารถแปลชุดทดสอบ newstest2017 ที่นำข้อความจากหน้าสื่อจริงๆ จำนวน 2,000 ประโยคมาใช้งาน แล้วตรวจสอบคุณภาพเทียบกับการแปลของนักแปลมืออาชีพ 2 กลุ่มที่ไม่เกี่ยวข้องกัน ผลที่ได้ออกมาทัดเทียมกัน

ไมโครซอฟท์เผยแพร่งานวิจัยชิ้นนี้ต่อสาธารณะ และจะนำเทคนิคที่พัฒนาขึ้นไปใช้กับผลิตภัณฑ์ของตัวเองต่อไป เทคนิคเหล่านี้ได้แก่

  • dual learning เมื่อแปลจีนเป็นอังกฤษแล้ว ให้แปลประโยคที่ได้กลับเป็นจีนใหม่ เพื่อให้ระบบเรียนรู้ความผิดพลาดของตัวเอง
  • deliberation networks การแปลประโยคเดิมซ้ำๆ ไปเรื่อยๆ เพื่อพัฒนาและปรับปรุงตัวเองให้ดีขึ้น
  • joint training แปลอังกฤษเป็นจีนด้วย เพื่อเพิ่มจำนวนคู่ประโยค (sentence pair) ให้มากขึ้น ช่วยให้ระบบแปลจีนเป็นอังกฤษมีคลังข้อมูลเพิ่มขึ้น
  • agreement regularization มีเอนจินแปลภาษาสองตัว ตัวหนึ่งแปลจากซ้ายไปขวา อีกตัวแปลจากขวาไปซ้าย ถ้าได้ผลลัพธ์ตรงกัน ก็ถือว่าการแปลนั้นน่าเชื่อถือมากขึ้น

ที่มา - Microsoft AI Blog

No Description

Get latest news from Blognone

Comments

By: art_duron
AndroidWindows
on 15 March 2018 - 18:23 #1038595
art_duron's picture

ไม่น่าเชื่อว่าโปรแกรมแปลภาษาจะมาถึงระดับนี้ได้เร็วขนาดนี้

By: มายองเนสจัง
iPhone
on 15 March 2018 - 18:46 #1038596
มายองเนสจัง's picture

อยากให้ใช้กับไทยได้จัง

By: zerost
AndroidWindows
on 15 March 2018 - 18:49 #1038597
zerost's picture

นักแปลมีตกงานล่ะทีนี้ ถ้าให้ดีขอแบบแปลญี่ปุ่น​จากเกม pc แบบออโต้ซับไตเติ้ล​ได้เลยจะดีมั่กๆ อยากเล่นเกมในตำนานภาค10แต่อ่านไม่ออกนี่สิ

By: iamfalan
iPhoneAndroidWindows
on 15 March 2018 - 20:09 #1038607 Reply to:1038597

รันส์ 10?

By: foizy
AndroidUbuntuWindows
on 15 March 2018 - 22:25 #1038624 Reply to:1038597

ผมคนนึงที่เชื่อว่างานแปลอาจจะต้องมีคน verify อีก 1 step เสมอนะครับ
ถึง AI จะฉลาดขนาดไหนก็ตาม โดยปราศจากความรู้ โดยปราศจากคนที่รู้ภาษา มาตรวจ
ให้ AI บอกว่าแปลถูก สมมติให้แม่นระดับ 95%/97% มันก็มีการเลือกคำที่สุ่มเสี่ยงได้เสมอ

ผมมองไม่ออกเลยว่าถ้าให้ AI แปล แล้วเราจะรู้ได้ยังไงว่า ส่วน 5%/3% ที่ผิดหรือหลุดไป มันผิด

แม้บทบาทแปลทั้งหมด อาจจะหายไปหรือลดลง
แต่บทบาทการอ่านทั้งหมด รวมถึงการตรวจสอบซ้ำ จะเพิ่มขึ้น
(และเผลอๆแพงขึ้นด้วย ในแง่ต้องเรียบเรียงและเลือกคำ)
เพราะความน่าสนใจของการเป็นนักแปลอาชีพจะลดลง
และไม่งั้น ภาษาจะพัฒนาโดย AI แทน (ซึ่งไม่เหมือนภาษาพูดชั่วครั้งคราวตามกาล)
+ คนที่รู้จริงๆว่าถูกต้องจริงๆควรเป็นไงน่าจะลดลงมากด้วย

By: nrml
ContributorIn Love
on 15 March 2018 - 23:27 #1038630 Reply to:1038624
nrml's picture

คุณลืมคิดไปอย่างหนึ่งครับ ณ ตอนนี้ที่มีการใช้นักแปลมืออาชีพ มันก็ยังมี % ผิดพลาดอยู่เช่นกัน ถ้ามองในมุมนี้ ตัว machine เองก็มีแต่จะพัฒนามากยิ่งขึ้นจนข้อผิดพลาดใกล้ 0 เข้าไปเรื่อยๆ

By: foizy
AndroidUbuntuWindows
on 16 March 2018 - 00:08 #1038637 Reply to:1038630

ไม่ได้ลืมครับ .. ในแง่ของงานแปล มันมีความผิดพลาดอยู่แล้ว
เลยใช้คำว่านักแปลจะหายไป แต่คนที่อ่านแล้วตรวจสอบงานแปลมันก็ยังเลี่ยงไม่ได้มากขนาดนั้น

ถ้าเป็นบทความวิชาการหน่อย (คำตรงไปตรงมา + technical term) มันมีความเป็นไปได้สูงมากที่จะแปลได้ดีมากๆ

นี่ยังไม่นับเรื่องบริบทคำพูด เปลี่ยนภาพเป็นนวนิยาย แล้วเลือก target ภาษาเป็นภาษาไทย ... มีตัวละคร 10 ตัว คนนึงพูดสุภาพใช้ศัพท์ระดับสุภาพตลอด (เป็น Doctor) อีกคนนึงใช้ภาษาระดับชาวบ้านตลอด คุณ ท่าน _ึง นาย เธอ แก ... ทั้งหมดนี้ภาษาอังกฤษ simplify ว่า "you"

คือ choice of wording / consistency มันมีหลายมิติมาก ที่สุดแล้วผมเลยมองว่ามันยังอีกไกล

---- ส่วนประเด็นความผิดพลาดในงานแปล
ปัญหาที่ผมมองคือ เราจะหาความผิดของคำ 1% ที่ผิดไปแล้วความหมายเปลี่ยนเลยได้ยังไงอ่ะครับ ถ้าไม่ได้อาศัยคนอ่านแล้วรู้สึกว่า คำนี้แปลแล้วทะแม่งๆนะ... คือผมมองว่าที่สุดเราเชื่อเครื่องแปลภาษา โดยยังไม่รู้ว่ามันแปลผิดตรงไหน ได้ยากนะครับ แม้จะเหลือ 1% หรือเข้าใกล้ 0

พอถึงจุดนึงเราอาจจะ trust machine translation มากกว่าคน
แต่ถ้าไปถึงจุดนั้น เราจะรู้ได้ไงว่า มันผิดตรงไหน ? ผมเลยมองว่า
อนาคตรูปแบบงานอาจจะเปลี่ยนไป คือ AI อาจจะแปลออกมาให้ได้ confidentiality สูงถึง 99.9%

แต่การจะหา 0.1% ที่ผิด(เน้นเฉพาะความหมายผิด) ให้เจอได้ แปลว่าอาจจะต้องใช้ proof reader 2-3-4 คน เพื่อเช็คหรือตรวจกรองว่า อ่านแล้วไม่ขัดหูจริงๆ หรือไม่ได้ผิดความหมายที่ต้องการจะสื่อจริงๆ ...

นอกจากนี้ยังมีคำที่มีโทนแฝงเป็นเชิงลบ หรือเชิงบวก ขึ้นกับบริบท (หรือคำที่เป็น Connotative) ที่ไม่ใช่ทุกครั้งที่จะเลือกคำกลางๆแล้วความหมายยังเนียนอยู่

เขาเป็นคนที่โดดเด่นมากๆ ...
unique - positive
different - neutral
peculiar - negative

---- แล้วยังมีงานเขียนยาวๆ เช่นหนังสือวิชาการ ที่ยาวไปกว่า paper นี่ ยังไง human ก็น่าจะเลี่ยงไม่ได้อยู่ดี
บทที่ 15 ... ตามที่ได้กล่าวไปแล้วในบทที่ 2 ว่า "____________"

บริบทของงานในบทที่ 15 เป็นแบบนึง ... บริบทในบทที่ 2 เป็นอีกแบบนึง สิ่งที่กล่าวไว้อาจจะเปลี่ยนไป (เพราะคำที่เลือกใช้จากบริบทเปลี่ยนไป)

ผมเลยมองว่า สายอาชีพนี้ยังไม่ตกงานไปอีกพักใหญ่มากๆอ่ะครับ

By: hisoft
ContributorWindows PhoneWindows
on 16 March 2018 - 00:12 #1038642 Reply to:1038637
hisoft's picture

แต่การจะหา 0.1% ที่ผิด(เน้นเฉพาะความหมายผิด) ให้เจอได้ แปลว่าอาจจะต้องใช้ proof reader 2-3-4 คน เพื่อเช็คหรือตรวจกรองว่า อ่านแล้วไม่ขัดหูจริงๆ

ถ้าแบบนั้นคือจะทำให้ค่ามันสูงกว่าปัจจุบันทุกวันนี้?

By: foizy
AndroidUbuntuWindows
on 16 March 2018 - 00:30 #1038646 Reply to:1038642

ผมแค่มองว่า ด้วยพอเข้ายุค AI งานจะผิดน้อยลง
แต่เราจะหาจุดที่ผิดเจอ แล้วรู้ว่าผิดยากขึ้น
(เพราะบุคลากรสายภาษาน้อยลง + เราเชื่อมั่นใน AI สูงขึ้น)
(นี่ผมเข้าใจคำถามไม่ผิดใช่ไหม)

เอางี้ครับ

มีเอกสารสำคัญหนึ่งฉบับ เป็นเรื่องนโยบายระหว่างประเทศ และการตัดสินใจที่เกี่ยวกับชีวิตคน + การเงินการคลังระหว่างประเทศ ... ต้นฉบับร่างเป็นภาษา X ... สิ่งที่ได้รับเป็น ภาษา Y
sign by "AI Translation" ว่าผลการแปลเชื่อถือได้ 3 บริษัท AI
confidentiality 3 AI บอกว่าแปลได้ถูกต้อง 99%
(a4 1 หน้าได้ประมาณ 500 word, เอกสาร 1 หน้ามีคำที่มีโอกาสผิดประมาณสัก 5คำ... หรือเอกสาร 3-5 หน้าอาจจะผิดสักประโยค)

ตัวเลขกี่เปอร์เซนต์ / AI กี่ตัว ... ที่จะทำให้เราไม่ต้องหา "คน"/"ผู้เชี่ยวชาญเรื่องภาษา" คือ 3rd party มาตรวจสอบว่า สิ่งที่เรากำลังจะเซ็นอนุมัติตาม translated paper นั้น เป็นสิ่งที่ตรงกับ original paper ต้องการ

ที่ผมจะสื่อคือเรื่องนี้ ผมมองว่าสุดท้ายมันจะยังต้องมี "คนที่ชำนาญเรื่องภาษา" เพื่อ recheck การแปลอีกขั้น

โพสต์ก่อนหน้ามีสองประเด็นนะครับ
- แปลถูกขนาดไหนเราถึงจะไว้ใจ AI 100% ... ถ้าประโยคสั้นๆ เหมือน SMS นัดคนสามกลุ่ม ไปเจอกันพี่สนามฟุตบอล ... แปลด้วย AI Translate confident ชัดมาก .. กลุ่มนึงไปเจอกันสนามฟุตบอล .. อีกกลุ่มไปรวมตัวกันที่สนามอเมริกันฟุตบอล (แปลมันกลายเป็นคำว่า soccer กับ คำว่า football ... แต่เนื่องจากเราไม่รู้ไงว่าปลายทางคืออะไร.. เราไม่ใช่นักแปล เราเชื่อการแปลของ AI ... แปลไปได้ soccer กับ football .. แปลกลับมากลายเป็นฟุตบอลเหมือนกัน)

กับประเด็นที่ว่า นักแปลจะตกงาน (ถ้าจะมีนักแปลตกงานก็พวกแปลสั้นๆ)
- AI ความสามารถในการแปลสูงพอที่จะแปล paper ยาวมากๆ หรือยัง สามารถเชื่อมโยงเรื่องราวที่เกิดขึ้นระหว่างบทได้หรือยัง
- งานนิยาย ที่มีบุคลิกของตัวละคร วิธีการพูด / รวมไปถึงสำนวนแปล (นิยายกำลังภายในจีนฉบับสำนวนกูเกิล นิยายกำลังภายในจีนฉบับสำนวนโกวเล้ง / นิยายกำลังภายในจีนฉบับ น.นพรัตน์ / นิยายฉบับ ว ณ เมืองลุง)

ไม่ต้องไปไหนไกล
ขนาดนี่ผมพิมพ์ไทย กลับมาอ่านของตัวเองยังต้องแปลไทยเป็นไทยเลย

By: nrml
ContributorIn Love
on 16 March 2018 - 00:37 #1038647 Reply to:1038646
nrml's picture

ผมว่าถ้าเป็นเอกสารที่มีความสำคัญมากๆ ระดับที่ไม่สามารถผิดพลาดได้ หรือถ้าผิดพลาดแล้วโลกสามารถแตกได้ ตรงนี้มันก็ยังจำเป็นต้องมีการตรวจเช็คที่ละเอียดมากๆ ทำหลายรอบ ทั้งจากคนจากเครืองจักร หรืออาจจะไม่มีเครื่องจักรเข้ามาเกี่ยวข้องเลย

ส่วนตัวอย่างที่คุณยกมา AI ก็น่าจะทำงานลักษณะคล้ายๆ คนนะครับ คือใช้บริบทแวดล้อมเข้ามาร่วมในการตัดสินใจเลือกคำด้วย

ซึ่งถ้าอยู่ๆ ให้แปลคำว่า Football จากประโยคเดียวโดดๆ ที่ไม่มีบริบทใดๆ แวดล้อมเลย มันก็มีโอกาสที่จะแปลผิดพลาดเป็น 2 แบบได้ไม่ว่าจะเป็นมนุษย์หรือ AI

By: foizy
AndroidUbuntuWindows
on 16 March 2018 - 00:52 #1038648 Reply to:1038647

ครับ เท่าที่ดูใน paper มันก็ใช้ทั้ง RTL และ LTR ในการแปลไปกลับว่ายังเหมือนเดิมหรือเปล่าสอบเช็คกันเองนี่ล่ะครับ

แล้วคราวนี้พอยก Extreme case มาแล้ว
พวก case ทั่วไปล่ะถ้าเป็นงานแปลทั่วไป ระดับไหนบ้างที่เราจะ ไม่ต้องการ proof reader / proof translator ... ผมเลยมองว่าต่อให้ไปถึง 99.9% แต่สำหรับนิยายหรืองานวิจัย ก็ยังเลี่ยงไม่ได้ที่จะต้องผ่านตาคนที่เป็นนักแปลจริงๆ ว่าได้อย่างที่อยากได้ อยุ่ดี หรือเปล่าครับ

คือไม่ต้องถึงขั้นโลกแตก แต่ถ้าเป็น
งานวิจัย -> ความหมายผิด ตัวแปรควบคุมผิด วิธีทดลองผิด ก็ผิดไปไกลได้
สิ่งที่ต้องประกาศสู่สาธารณะ -> ความหมายผิด ก็ผิดได้

... นอกจาก news/snippets/ad-media ง่ายๆ หรืออะไรที่ไม่สำคัญ(แปลผิดแปลถูกก็ได้) ที่สุดแล้วผมยังมองว่างานแปลที่ serious ไม่น่าจะมี AI มาทดแทนคนได้เลย (การที่มี AI มาช่วยทำให้คนแปลได้ไวขึ้นก็จริง...ลดภาระการเรียบเรียงของคนได้ก็จริง แต่สกิลที่ต้องใช้ในการตรวจก็ยังต้องสูงเช่นเดิม คือเราต้องการคนที่มีสกิลอยู่ดีหรือเปล่าครับ .. หรือมองอีกมุม เราอาจจะต้องมีคนมา take responsibility ซึ่ง AI มันทำไม่ได้หรือเปล่า)

ทั้งหมดนี้ตอบภายใต้โพสต์ต้นว่า คนแปลตกงาน นะครับ

555 ถ้าในบริบทของคนแปลก็คือ มี translator แบบไม่จริงจังก็ดี
แต่ที่สุดเราก็อยากได้เกมที่แปลแล้วมีคน certify งานแปลว่าเนื้อเรื่องตรงต้นฉบับอยู่ดี หรือเปล่า

By: nrml
ContributorIn Love
on 16 March 2018 - 01:09 #1038651 Reply to:1038648
nrml's picture

ในระดับทั่วไปผมว่าแทนได้แทบจะทั้งหมดครับ ส่วน translator ผมก็เห็นด้วยว่าคงไม่มีวันหายไป แต่ก็ไม่น่าจะมีเยอะและกลายเป็นวิชาชีพเฉพาะที่ค่าตัวสูงลิ่วในอนาคต

By: Hoo
AndroidWindows
on 16 March 2018 - 07:49 #1038672 Reply to:1038624

ผมว่าในเชิงเศรษฐกิจ
-AI จะมาแทนงานแปลง่ายๆไม่สำคัญ
-จะเหลือเฉพาะผู้เชี่ยวชาญ มา verified งานสำคัญๆ
-แต่งานที่ไม่สำคัญถูกแย่งไปหมด จะทำให้ไม่มีสนามฝึกเพื่อสร้างผู้เชี่ยวชาญรุ่นใหม่
-สุดท้ายจะไม่เหลือคนที่รู้ว่า AI แปลผิด แล้ว AI ก็จะได้ 100% .. เฮ!!

By: HMage
AndroidWindows
on 16 March 2018 - 10:03 #1038695 Reply to:1038597

ผมว่าไม่ตกงานหรอกครับ แต่จะเปลี่ยนบทบาทเป็นผู้ตรวจสอบแทน หน้าที่เดียวกับ บ.ก. คอยให้คำแนะนำนักเขียน

เพราะยังไง AI ก็ต้องเรียนรู้การเปลี่ยนแปลงของภาษาที่คนใช้กันไปตามยุคสมัย ถึงมันจะสามารถกวาดเอาวิธีพูดของคนทั่วไปได้จาก social network แต่ก็ต้องมีคนกำหนดหลักการ, มารยาท, การเลือกใช้คำ, หรือระดับภาษาอยู่ดี

By: Neroroms
Windows
on 16 March 2018 - 13:18 #1038741 Reply to:1038695

เห็นด้วยครับ ai กับคนจะทำงานด้วยกันเพื่อ cross check กันมันจะช่วยให้ทำงานได้เร็วขึ้น

By: nrml
ContributorIn Love
on 15 March 2018 - 19:11 #1038599
nrml's picture

เมื่อหลายเดือนก่อนยังเห็นมีการถกเถียงเรื่องนี้ใน FB อยู่เลย

By: Jirawat
Android
on 15 March 2018 - 19:27 #1038600
Jirawat's picture

ขอแปลหนังญี่ปุ่นด้วยคร๊าาบบบ

By: Neroroms
Windows
on 15 March 2018 - 21:41 #1038617 Reply to:1038600

ทำไมเรายังไม่วาร์ป
//ผิด

By: teerapon0009
Windows PhoneAndroidWindows
on 15 March 2018 - 21:22 #1038612
teerapon0009's picture

ขอดีขอภาษาญี่ปุ่นเป็นไทยด้วย

By: pit
ContributoriPhoneAndroidWindows
on 15 March 2018 - 22:05 #1038621 Reply to:1038612

ยากมากครับ ภาษาญี่ปุ่น (และเกาหลี) โครงสร้างประโยคต่างจากไทยมาก และสัดส่วนปริมาณการใช้ภาษาไทยยังน้อยจนระบบเรียนรู้ได้ไม่มาก.

By: Hoo
AndroidWindows
on 16 March 2018 - 07:56 #1038673 Reply to:1038612

เข้าใจว่า ปัญหาอยู่ที่ฝั่งไทยนะ
เหมือนภาษาอื่นมี engineer พัฒนาจำนวนมาก/ยาวนานพอ
อย่าง ญี่ปุ่น<->อังกฤษ<->เยอรมัน ได้ยินมาว่าแปลดีมาก

แต่ของไทย จะป่วยหมดทั้งแปลไป/กลับภาษาอื่น
ถ้าอัด engineer ให้ ไทย<->อังกฤษ ดีๆ
โดยรวมน่าจะไม่ป่วยหนักแบบปัจจุบัน

By: ม้านุต on 15 March 2018 - 23:31 #1038632

แล้วเมื่อไหร่ Google จะเป็นเหมือน...

By: zipper
ContributorAndroid
on 16 March 2018 - 12:30 #1038736

เห็นว่า WeChat มีฟังก์ชั่นแปลภาษาได้แต่ไม่รู้เป็นไงมั่ง อาจจะมีผิดบ้างแต่ก็น่าจะพอทำให้เดาได้ว่าอีกฝ่ายแชทอะไรมา มันก็พออำนวยความสะดวกได้ในระดับหนึ่ง ถึงแม้ว่าจะแปลไม่ตรง 100% ก็ตาม ถ้าในระดับคุยกันเล่นๆ คงไม่ซีเรียสเรื่องความถูกต้องมาก แค่ขอให้เข้าใจกันได้ก็พอ