Tags:

เมื่อปีที่แล้ว กูเกิลเพิ่มฟีเจอร์ OCR แปลงข้อความจาก PDF และรูปภาพลง Google Docs

ล่าสุดกูเกิลประกาศว่าฟีเจอร์ OCR รองรับภาษาเพิ่มเติมอีก 29 ภาษา ผมลองเช็คดูแล้วก็มีภาษาไทยด้วย แต่เท่าที่ลองทดสอบแล้วยังไม่สมบูรณ์ขนาดใช้งานจริงได้ ถ้าใครทดสอบแล้วได้ผลที่ดีกว่านี้ก็แจ้งมาได้ครับ

ที่มา - Google Docs Blog

ภาษาไทยมีให้เลือกตอนอัพโหลดไฟล์ภาพหรือ PDF แล้วสั่งให้แปลงเป็นข้อความ

ผมลองอัพไฟล์ภาพทดสอบ 2 ไฟล์ ดูผลกันเอาเองตามลิงก์

Comments

By: iStyle
ContributorAndroidSymbianWindows
iStyle's blog
on 01/03/11 9:36 #264423 toggle
iStyle's picture

ปวดตรั่บกว่า translate อีก= ='


May the Force Close be with you.

By: joomla
iPhoneUbuntu
joomla's blog
on 01/03/11 9:43 #264425 Reply to:264423 toggle
joomla's picture

ใช้กุเกิ้ลค้นหาแล้วมันแปลหน้าเวบให้ ทีแรกอ่านงงๆ ว่าใครเขียนบทความฟร่ะ อ่านเข้าใจยากฉิบ อ่านไปอ่านมาเริ่มเอะใจ มันแปลจากภาษาอังกฤษเป็นไทยนี่เอง อ่านแล้วมึนมากๆ


v___v

By: AMp
In Love
AMp's blog
on 01/03/11 9:59 #264433 toggle
AMp's picture

แปลงออกมาแล้ว นึกว่าภาษาเขมร - -*

By: wichate
Android
wichate's blog
on 01/03/11 10:06 #264437 toggle
wichate's picture

เท่าที่ดู มันแยกภาษาอังกฤษกับภาษาไทย ที่อยู่ในหน้าเดียวกันไม่ได้แฮะ

By: Eka-X
ContributoriPhoneAndroidIn Love
Eka-X's blog
on 01/03/11 10:48 #264448 toggle
Eka-X's picture

อย่างน้อยก็ถือเป็นการเริ่มต้นแหละครับ เผื่ออนาคตจะได้มี OCR ไทยที่ใช้งานได้จริงๆ ของ NECTEC ก็ต้องให้กำลังใจกันต่อไป

By: Ekae
AndroidUbuntu
Ekae's blog
on 01/03/11 11:16 #264456 toggle
Ekae's picture

เป็นนิมิตหมายที่ดี

ปล ภาษาไทยมันยากจริงๆนะเนี้ย

By: paween_a
iPhone
paween_a's blog
on 01/03/11 11:17 #264457 toggle
paween_a's picture

ดีดี

By: ko01
Android
ko01's blog
on 01/03/11 11:43 #264466 toggle
ko01's picture

รอให้สมบูรณ์จะแจ่มมาก

By: nolykk
ContributoriPhoneAndroidUbuntu
nolykk's blog
on 01/03/11 12:40 #264477 toggle
nolykk's picture

ขอตัดคำไทยใน docs ก่อนได้ไหมครับ = =


twitter.com/djnoly

By: hisoft
ContributorWindows PhoneWindows
hisoft's blog
on 01/03/11 13:28 #264486 toggle
hisoft's picture

ของ NECTEC มีสองตัว ArnThai (อ่านไทย) กับ ThaiOCR ผมว่า ArnThai นี่แปลงได้ดูดีสุดแล้วมั้งครับแต่หยุดพัฒนาไปแล้ว รันบน XP ยังไม่ได้เลย ต้อง 98 ส่วน ThaiOCR นี่ก็พอๆ กับ Google เลย แต่ผมว่าเริ่มมีมันก็น่าจะพัฒนาต่อไปเรื่อยๆ นะ


 

The Phantom Thief

By: paijc
ContributorWindows PhoneAndroidUbuntu
paijc's blog
on 01/03/11 17:52 #264523 Reply to:264486 toggle
paijc's picture

ปัญหาของ software ไทยคือความต่อเนื่องในการพัฒนาเนี่ยแหละ

By: kohsija
AndroidSymbianWindowsIn Love
kohsija's blog
on 01/03/11 22:12 #264612 Reply to:264486 toggle
kohsija's picture

เคยใช้ ThaiOCR ช่วยทำงานส่งอาจารย์ด้วย ตอนเรียน สนุกจะตาย... แก้ manual เองเกือบหมด LOL


@kohsija

By: modeller
iPhoneAndroid
modeller's blog
on 01/03/11 15:49 #264511 toggle
modeller's picture

ถ้าทำภาษาไทยได้ดีๆแบบตัวโรมันนะ มันจะทุ่นแรงได้เยอะมาก


MacPhuket

By: b98se
AndroidWindows
b98se's blog
on 01/03/11 16:04 #264514 toggle
b98se's picture

abbyy finereader

By: pittaya
WriterAndroidUbuntuIn Love
pittaya's blog
on 01/03/11 17:45 #264522 toggle
pittaya's picture

ผมลองเล่นดู พยายามปรับ threshold ของตัวหนังสือให้เหลือขาวกับดำแล้วก็ยังไม่ค่อยเวิร์คแฮะ https://skitch.com/pittaya/r1mb9/history.png-google-docs


pittaya.com

By: saknarak
Android
saknarak's blog
on 01/03/11 19:53 #264536 toggle
saknarak's picture

ArnThai กับ ThaiOCR ไม่พัฒนาต่อ ก็น่าจะประกาศเป็น public domain ไป หรือเป็น GPL ก็ได้ จะเกิดประโยชน์ต่อสาธารณะมากกว่า

By: Virusfowl
ContributorSymbianWindows
Virusfowl's blog
on 10/03/11 4:23 #267441 toggle
Virusfowl's picture

ใช้ screen reader เข้าไปอ่านไฟล์ตัวอย่าง ฟังแล้วปวดตับ T_T

ราวกับภาษาเขมร ตามที่ ref บนว่าไว้นั่นล่ะ


@ Virusfowl

sometime something with someone

By: lastall
ContributorWindows PhoneAndroidSymbian
lastall's blog
on 28/04/12 14:33 #413687 toggle
lastall's picture

ไฟล์สแกนบทความจากมติชนสุดสัปดาห์ อัพเดต 28 เม.ย. 2555 OCR ถูกปรับปรุงขึ้นมา ผมคิดว่าควรเพิ่มระบบคำที่ถูกต้องลงไปตรวจสอบด้วย เช่น ตอนทื เป็นคำไม่ถูกต้อง จะถูกแทนที่ ด้วยคำที่ใช้สื่อสารในปัจจุบัน ตอนที่ แทน