ไมโครซอฟท์ประกาศความสำเร็จในการพัฒนาระบบ AI แปลภาษา โดยสามารถแปลข่าวจากภาษาจีนเป็นภาษาอังกฤษได้ในระดับทัดเทียมกับมนุษย์
ระบบ machine translation ของไมโครซอฟท์ใช้เทคนิคหลายอย่างช่วยกันยกระดับคุณภาพการแปล โดยสามารถแปลชุดทดสอบ newstest2017 ที่นำข้อความจากหน้าสื่อจริงๆ จำนวน 2,000 ประโยคมาใช้งาน แล้วตรวจสอบคุณภาพเทียบกับการแปลของนักแปลมืออาชีพ 2 กลุ่มที่ไม่เกี่ยวข้องกัน ผลที่ได้ออกมาทัดเทียมกัน
ไมโครซอฟท์เผยแพร่งานวิจัยชิ้นนี้ต่อสาธารณะ และจะนำเทคนิคที่พัฒนาขึ้นไปใช้กับผลิตภัณฑ์ของตัวเองต่อไป เทคนิคเหล่านี้ได้แก่
- dual learning เมื่อแปลจีนเป็นอังกฤษแล้ว ให้แปลประโยคที่ได้กลับเป็นจีนใหม่ เพื่อให้ระบบเรียนรู้ความผิดพลาดของตัวเอง
- deliberation networks การแปลประโยคเดิมซ้ำๆ ไปเรื่อยๆ เพื่อพัฒนาและปรับปรุงตัวเองให้ดีขึ้น
- joint training แปลอังกฤษเป็นจีนด้วย เพื่อเพิ่มจำนวนคู่ประโยค (sentence pair) ให้มากขึ้น ช่วยให้ระบบแปลจีนเป็นอังกฤษมีคลังข้อมูลเพิ่มขึ้น
- agreement regularization มีเอนจินแปลภาษาสองตัว ตัวหนึ่งแปลจากซ้ายไปขวา อีกตัวแปลจากขวาไปซ้าย ถ้าได้ผลลัพธ์ตรงกัน ก็ถือว่าการแปลนั้นน่าเชื่อถือมากขึ้น
ที่มา - Microsoft AI Blog

on
ไม่น่าเชื่อว่าโปรแกรมแปลภาษาจ
art_duron Thu, 15/03/2018 - 18:23
ไม่น่าเชื่อว่าโปรแกรมแปลภาษาจะมาถึงระดับนี้ได้เร็วขนาดนี้
อยากให้ใช้กับไทยได้จัง
มายองเนสจัง Thu, 15/03/2018 - 18:46
อยากให้ใช้กับไทยได้จัง
นักแปลมีตกงานล่ะทีนี้
zerost Thu, 15/03/2018 - 18:49
นักแปลมีตกงานล่ะทีนี้ ถ้าให้ดีขอแบบแปลญี่ปุ่นจากเกม pc แบบออโต้ซับไตเติ้ลได้เลยจะดีมั่กๆ อยากเล่นเกมในตำนานภาค10แต่อ่านไม่ออกนี่สิ
รันส์ 10?
iamfalan Thu, 15/03/2018 - 20:09
In reply to นักแปลมีตกงานล่ะทีนี้ by zerost
รันส์ 10?
ผมคนนึงที่เชื่อว่างานแปลอาจจะ
foizy Thu, 15/03/2018 - 22:25
In reply to นักแปลมีตกงานล่ะทีนี้ by zerost
ผมคนนึงที่เชื่อว่างานแปลอาจจะต้องมีคน verify อีก 1 step เสมอนะครับ
ถึง AI จะฉลาดขนาดไหนก็ตาม โดยปราศจากความรู้ โดยปราศจากคนที่รู้ภาษา มาตรวจ
ให้ AI บอกว่าแปลถูก สมมติให้แม่นระดับ 95%/97% มันก็มีการเลือกคำที่สุ่มเสี่ยงได้เสมอ
ผมมองไม่ออกเลยว่าถ้าให้ AI แปล แล้วเราจะรู้ได้ยังไงว่า ส่วน 5%/3% ที่ผิดหรือหลุดไป มันผิด
แม้บทบาทแปลทั้งหมด อาจจะหายไปหรือลดลง
แต่บทบาทการอ่านทั้งหมด รวมถึงการตรวจสอบซ้ำ จะเพิ่มขึ้น
(และเผลอๆแพงขึ้นด้วย ในแง่ต้องเรียบเรียงและเลือกคำ)
เพราะความน่าสนใจของการเป็นนักแปลอาชีพจะลดลง
และไม่งั้น ภาษาจะพัฒนาโดย AI แทน (ซึ่งไม่เหมือนภาษาพูดชั่วครั้งคราวตามกาล)
คุณลืมคิดไปอย่างหนึ่งครับ ณ
nrml Thu, 15/03/2018 - 23:27
In reply to ผมคนนึงที่เชื่อว่างานแปลอาจจะ by foizy
คุณลืมคิดไปอย่างหนึ่งครับ ณ ตอนนี้ที่มีการใช้นักแปลมืออาชีพ มันก็ยังมี % ผิดพลาดอยู่เช่นกัน ถ้ามองในมุมนี้ ตัว machine เองก็มีแต่จะพัฒนามากยิ่งขึ้นจนข้อผิดพลาดใกล้ 0 เข้าไปเรื่อยๆ
ไม่ได้ลืมครับ ..
foizy Fri, 16/03/2018 - 00:08
In reply to คุณลืมคิดไปอย่างหนึ่งครับ ณ by nrml
ไม่ได้ลืมครับ .. ในแง่ของงานแปล มันมีความผิดพลาดอยู่แล้ว
เลยใช้คำว่านักแปลจะหายไป แต่คนที่อ่านแล้วตรวจสอบงานแปลมันก็ยังเลี่ยงไม่ได้มากขนาดนั้น
ถ้าเป็นบทความวิชาการหน่อย (คำตรงไปตรงมา + technical term) มันมีความเป็นไปได้สูงมากที่จะแปลได้ดีมากๆ
นี่ยังไม่นับเรื่องบริบทคำพูด เปลี่ยนภาพเป็นนวนิยาย แล้วเลือก target ภาษาเป็นภาษาไทย ... มีตัวละคร 10 ตัว คนนึงพูดสุภาพใช้ศัพท์ระดับสุภาพตลอด (เป็น Doctor) อีกคนนึงใช้ภาษาระดับชาวบ้านตลอด คุณ ท่าน _ึง นาย เธอ แก ... ทั้งหมดนี้ภาษาอังกฤษ simplify ว่า "you"
คือ choice of wording / consistency มันมีหลายมิติมาก ที่สุดแล้วผมเลยมองว่ามันยังอีกไกล
---- ส่วนประเด็นความผิดพลาดในงานแปล
ปัญหาที่ผมมองคือ เราจะหาความผิดของคำ 1% ที่ผิดไปแล้วความหมายเปลี่ยนเลยได้ยังไงอ่ะครับ ถ้าไม่ได้อาศัยคนอ่านแล้วรู้สึกว่า คำนี้แปลแล้วทะแม่งๆนะ... คือผมมองว่าที่สุดเราเชื่อเครื่องแปลภาษา โดยยังไม่รู้ว่ามันแปลผิดตรงไหน ได้ยากนะครับ แม้จะเหลือ 1% หรือเข้าใกล้ 0
พอถึงจุดนึงเราอาจจะ trust machine translation มากกว่าคน
แต่ถ้าไปถึงจุดนั้น เราจะรู้ได้ไงว่า มันผิดตรงไหน ? ผมเลยมองว่า
อนาคตรูปแบบงานอาจจะเปลี่ยนไป คือ AI อาจจะแปลออกมาให้ได้ confidentiality สูงถึง 99.9%
แต่การจะหา 0.1% ที่ผิด(เน้นเฉพาะความหมายผิด) ให้เจอได้ แปลว่าอาจจะต้องใช้ proof reader 2-3-4 คน เพื่อเช็คหรือตรวจกรองว่า อ่านแล้วไม่ขัดหูจริงๆ หรือไม่ได้ผิดความหมายที่ต้องการจะสื่อจริงๆ ...
นอกจากนี้ยังมีคำที่มีโทนแฝงเป็นเชิงลบ หรือเชิงบวก ขึ้นกับบริบท (หรือคำที่เป็น Connotative) ที่ไม่ใช่ทุกครั้งที่จะเลือกคำกลางๆแล้วความหมายยังเนียนอยู่
เขาเป็นคนที่โดดเด่นมากๆ ...
unique - positive
different - neutral
peculiar - negative
---- แล้วยังมีงานเขียนยาวๆ เช่นหนังสือวิชาการ ที่ยาวไปกว่า paper นี่ ยังไง human ก็น่าจะเลี่ยงไม่ได้อยู่ดี
บทที่ 15 ... ตามที่ได้กล่าวไปแล้วในบทที่ 2 ว่า "____________"
บริบทของงานในบทที่ 15 เป็นแบบนึง ... บริบทในบทที่ 2 เป็นอีกแบบนึง สิ่งที่กล่าวไว้อาจจะเปลี่ยนไป (เพราะคำที่เลือกใช้จากบริบทเปลี่ยนไป)
ผมเลยมองว่า สายอาชีพนี้ยังไม่ตกงานไปอีกพักใหญ่มากๆอ่ะครับ
แต่การจะหา 0.1% ที่ผิด
hisoft Fri, 16/03/2018 - 00:12
In reply to ไม่ได้ลืมครับ .. by foizy
ถ้าแบบนั้นคือจะทำให้ค่ามันสูงกว่าปัจจุบันทุกวันนี้?
ผมแค่มองว่า ด้วยพอเข้ายุค AI
foizy Fri, 16/03/2018 - 00:30
In reply to แต่การจะหา 0.1% ที่ผิด by hisoft
ผมแค่มองว่า ด้วยพอเข้ายุค AI งานจะผิดน้อยลง
แต่เราจะหาจุดที่ผิดเจอ แล้วรู้ว่าผิดยากขึ้น
(เพราะบุคลากรสายภาษาน้อยลง + เราเชื่อมั่นใน AI สูงขึ้น)
(นี่ผมเข้าใจคำถามไม่ผิดใช่ไหม)
เอางี้ครับ
มีเอกสารสำคัญหนึ่งฉบับ เป็นเรื่องนโยบายระหว่างประเทศ และการตัดสินใจที่เกี่ยวกับชีวิตคน + การเงินการคลังระหว่างประเทศ ... ต้นฉบับร่างเป็นภาษา X ... สิ่งที่ได้รับเป็น ภาษา Y
sign by "AI Translation" ว่าผลการแปลเชื่อถือได้ 3 บริษัท AI
confidentiality 3 AI บอกว่าแปลได้ถูกต้อง 99%
(a4 1 หน้าได้ประมาณ 500 word, เอกสาร 1 หน้ามีคำที่มีโอกาสผิดประมาณสัก 5คำ... หรือเอกสาร 3-5 หน้าอาจจะผิดสักประโยค)
ตัวเลขกี่เปอร์เซนต์ / AI กี่ตัว ... ที่จะทำให้เราไม่ต้องหา "คน"/"ผู้เชี่ยวชาญเรื่องภาษา" คือ 3rd party มาตรวจสอบว่า สิ่งที่เรากำลังจะเซ็นอนุมัติตาม translated paper นั้น เป็นสิ่งที่ตรงกับ original paper ต้องการ
ที่ผมจะสื่อคือเรื่องนี้ ผมมองว่าสุดท้ายมันจะยังต้องมี "คนที่ชำนาญเรื่องภาษา" เพื่อ recheck การแปลอีกขั้น
โพสต์ก่อนหน้ามีสองประเด็นนะครับ
กับประเด็นที่ว่า นักแปลจะตกงาน (ถ้าจะมีนักแปลตกงานก็พวกแปลสั้นๆ)
ไม่ต้องไปไหนไกล
ขนาดนี่ผมพิมพ์ไทย กลับมาอ่านของตัวเองยังต้องแปลไทยเป็นไทยเลย
ผมว่าถ้าเป็นเอกสารที่มีความสำ
nrml Fri, 16/03/2018 - 00:37
In reply to ผมแค่มองว่า ด้วยพอเข้ายุค AI by foizy
ผมว่าถ้าเป็นเอกสารที่มีความสำคัญมากๆ ระดับที่ไม่สามารถผิดพลาดได้ หรือถ้าผิดพลาดแล้วโลกสามารถแตกได้ ตรงนี้มันก็ยังจำเป็นต้องมีการตรวจเช็คที่ละเอียดมากๆ ทำหลายรอบ ทั้งจากคนจากเครืองจักร หรืออาจจะไม่มีเครื่องจักรเข้ามาเกี่ยวข้องเลย
ส่วนตัวอย่างที่คุณยกมา AI ก็น่าจะทำงานลักษณะคล้ายๆ คนนะครับ คือใช้บริบทแวดล้อมเข้ามาร่วมในการตัดสินใจเลือกคำด้วย
ซึ่งถ้าอยู่ๆ ให้แปลคำว่า Football จากประโยคเดียวโดดๆ ที่ไม่มีบริบทใดๆ แวดล้อมเลย มันก็มีโอกาสที่จะแปลผิดพลาดเป็น 2 แบบได้ไม่ว่าจะเป็นมนุษย์หรือ AI
ครับ เท่าที่ดูใน paper
foizy Fri, 16/03/2018 - 00:52
In reply to ผมว่าถ้าเป็นเอกสารที่มีความสำ by nrml
ครับ เท่าที่ดูใน paper มันก็ใช้ทั้ง RTL และ LTR ในการแปลไปกลับว่ายังเหมือนเดิมหรือเปล่าสอบเช็คกันเองนี่ล่ะครับ
แล้วคราวนี้พอยก Extreme case มาแล้ว
พวก case ทั่วไปล่ะถ้าเป็นงานแปลทั่วไป ระดับไหนบ้างที่เราจะ ไม่ต้องการ proof reader / proof translator ... ผมเลยมองว่าต่อให้ไปถึง 99.9% แต่สำหรับนิยายหรืองานวิจัย ก็ยังเลี่ยงไม่ได้ที่จะต้องผ่านตาคนที่เป็นนักแปลจริงๆ ว่าได้อย่างที่อยากได้ อยุ่ดี หรือเปล่าครับ
คือไม่ต้องถึงขั้นโลกแตก แต่ถ้าเป็น
งานวิจัย -> ความหมายผิด ตัวแปรควบคุมผิด วิธีทดลองผิด ก็ผิดไปไกลได้
สิ่งที่ต้องประกาศสู่สาธารณะ -> ความหมายผิด ก็ผิดได้
... นอกจาก news/snippets/ad-media ง่ายๆ หรืออะไรที่ไม่สำคัญ(แปลผิดแปลถูกก็ได้) ที่สุดแล้วผมยังมองว่างานแปลที่ serious ไม่น่าจะมี AI มาทดแทนคนได้เลย (การที่มี AI มาช่วยทำให้คนแปลได้ไวขึ้นก็จริง...ลดภาระการเรียบเรียงของคนได้ก็จริง แต่สกิลที่ต้องใช้ในการตรวจก็ยังต้องสูงเช่นเดิม คือเราต้องการคนที่มีสกิลอยู่ดีหรือเปล่าครับ .. หรือมองอีกมุม เราอาจจะต้องมีคนมา take responsibility ซึ่ง AI มันทำไม่ได้หรือเปล่า)
ทั้งหมดนี้ตอบภายใต้โพสต์ต้นว่า คนแปลตกงาน นะครับ
555 ถ้าในบริบทของคนแปลก็คือ มี translator แบบไม่จริงจังก็ดี
แต่ที่สุดเราก็อยากได้เกมที่แปลแล้วมีคน certify งานแปลว่าเนื้อเรื่องตรงต้นฉบับอยู่ดี หรือเปล่า
ในระดับทั่วไปผมว่าแทนได้แทบจะ
nrml Fri, 16/03/2018 - 01:09
In reply to ครับ เท่าที่ดูใน paper by foizy
ในระดับทั่วไปผมว่าแทนได้แทบจะทั้งหมดครับ ส่วน translator ผมก็เห็นด้วยว่าคงไม่มีวันหายไป แต่ก็ไม่น่าจะมีเยอะและกลายเป็นวิชาชีพเฉพาะที่ค่าตัวสูงลิ่วในอนาคต
ผมว่าในเชิงเศรษฐกิจ
Hoo Fri, 16/03/2018 - 07:49
In reply to ผมคนนึงที่เชื่อว่างานแปลอาจจะ by foizy
ผมว่าในเชิงเศรษฐกิจ
-AI จะมาแทนงานแปลง่ายๆไม่สำคัญ
-จะเหลือเฉพาะผู้เชี่ยวชาญ มา verified งานสำคัญๆ
-แต่งานที่ไม่สำคัญถูกแย่งไปหมด จะทำให้ไม่มีสนามฝึกเพื่อสร้างผู้เชี่ยวชาญรุ่นใหม่
-สุดท้ายจะไม่เหลือคนที่รู้ว่า AI แปลผิด แล้ว AI ก็จะได้ 100% .. เฮ!!
ผมว่าไม่ตกงานหรอกครับ
HMage Fri, 16/03/2018 - 10:03
In reply to นักแปลมีตกงานล่ะทีนี้ by zerost
ผมว่าไม่ตกงานหรอกครับ แต่จะเปลี่ยนบทบาทเป็นผู้ตรวจสอบแทน หน้าที่เดียวกับ บ.ก. คอยให้คำแนะนำนักเขียน
เพราะยังไง AI ก็ต้องเรียนรู้การเปลี่ยนแปลงของภาษาที่คนใช้กันไปตามยุคสมัย ถึงมันจะสามารถกวาดเอาวิธีพูดของคนทั่วไปได้จาก social network แต่ก็ต้องมีคนกำหนดหลักการ, มารยาท, การเลือกใช้คำ, หรือระดับภาษาอยู่ดี
เห็นด้วยครับ ai
Neroroms Fri, 16/03/2018 - 13:18
In reply to ผมว่าไม่ตกงานหรอกครับ by HMage
เห็นด้วยครับ ai กับคนจะทำงานด้วยกันเพื่อ cross check กันมันจะช่วยให้ทำงานได้เร็วขึ้น
เมื่อหลายเดือนก่อนยังเห็นมีกา
nrml Thu, 15/03/2018 - 19:11
เมื่อหลายเดือนก่อนยังเห็นมีการถกเถียงเรื่องนี้ใน FB อยู่เลย
ขอแปลหนังญี่ปุ่นด้วยคร๊าาบบบ
Jirawat Thu, 15/03/2018 - 19:27
ขอแปลหนังญี่ปุ่นด้วยคร๊าาบบบ
ทำไมเรายังไม่วาร์ป //ผิด
Neroroms Thu, 15/03/2018 - 21:41
In reply to ขอแปลหนังญี่ปุ่นด้วยคร๊าาบบบ by Jirawat
ทำไมเรายังไม่วาร์ป
//ผิด
ขอดีขอภาษาญี่ปุ่นเป็นไทยด้วย
teerapon0009 Thu, 15/03/2018 - 21:22
ขอดีขอภาษาญี่ปุ่นเป็นไทยด้วย
ยากมากครับ ภาษาญี่ปุ่น
pit Thu, 15/03/2018 - 22:05
In reply to ขอดีขอภาษาญี่ปุ่นเป็นไทยด้วย by teerapon0009
ยากมากครับ ภาษาญี่ปุ่น (และเกาหลี) โครงสร้างประโยคต่างจากไทยมาก และสัดส่วนปริมาณการใช้ภาษาไทยยังน้อยจนระบบเรียนรู้ได้ไม่มาก.
เข้าใจว่า
Hoo Fri, 16/03/2018 - 07:56
In reply to ขอดีขอภาษาญี่ปุ่นเป็นไทยด้วย by teerapon0009
เข้าใจว่า ปัญหาอยู่ที่ฝั่งไทยนะ
เหมือนภาษาอื่นมี engineer พัฒนาจำนวนมาก/ยาวนานพอ
อย่าง ญี่ปุ่น<->อังกฤษ<->เยอรมัน ได้ยินมาว่าแปลดีมาก
แต่ของไทย จะป่วยหมดทั้งแปลไป/กลับภาษาอื่น
ถ้าอัด engineer ให้ ไทย<->อังกฤษ ดีๆ
โดยรวมน่าจะไม่ป่วยหนักแบบปัจจุบัน
แล้วเมื่อไหร่ Google
ม้านุต Thu, 15/03/2018 - 23:31
แล้วเมื่อไหร่ Google จะเป็นเหมือน...
เห็นว่า WeChat
zipper Fri, 16/03/2018 - 12:30
เห็นว่า WeChat มีฟังก์ชั่นแปลภาษาได้แต่ไม่รู้เป็นไงมั่ง อาจจะมีผิดบ้างแต่ก็น่าจะพอทำให้เดาได้ว่าอีกฝ่ายแชทอะไรมา มันก็พออำนวยความสะดวกได้ในระดับหนึ่ง ถึงแม้ว่าจะแปลไม่ตรง 100% ก็ตาม ถ้าในระดับคุยกันเล่นๆ คงไม่ซีเรียสเรื่องความถูกต้องมาก แค่ขอให้เข้าใจกันได้ก็พอ