ช่วนกันถอดความหนังสือด้วย reCAPTCHA

tags:

เชื่อว่าทุกคนคงคุ้นเคยกับ CAPTCHA กันอยู่แล้ว (ถ้าไม่เคยได้ยินชื่อ กดเข้าไปตามลิงก์ก็น่าจะอ๋อ) มีการคำนวณว่าแต่ละวันมีคนต้องแก้ปัญหา CAPTCHA ประมาณ 60 ล้านครั้ง ถ้าแต่ละคนใช้เวลา 10 วินาทีในการคิดและพิมพ์ เราก็จะเสียเวลาในการทำงานไปเปล่าๆ 150,000 ชั่วโมงต่อวัน มีวิธีเอาแรงงานตรงนี้มาใช้ประโยชน์ได้หรือเปล่า

โครงการ reCAPTCHA จึงเกิดมาด้วยแนวคิดนี้ ไหนๆ ผู้ใช้ต้องแก้ปัญหาตัวหนังสือที่อ่านยาก และมีโครงการสแกนหนังสือเพื่อทำ OCR จำนวนมาก ที่ผลการสแกนบิดๆ เบี้ยวๆ ต้องใช้แรงคนมานั่งแปลอีกครั้ง ก็เอาสองงานนี้มารวมร่างกันเสีย นั่นแปลว่าทุกครั้งที่เราแก้ปัญหา reCAPTCHA เรากำลังทำประโยชน์โดยการแปลงภาพหนังสือเป็นข้อความกันอยู่

ขณะที่เขียนมีปลั๊กอิน reCAPTCHA สำหรับ Wordpress, MediaWiki และ phpBB แล้ว เดี๋ยวถ้ามีของ Drupal อาจจะเอามาใช้กับ Blognone ครับ

ที่มา - reCAPTCHA

sirn's picture

เสริมหน่อยว่าคนทำ reCAPTCHA คือ Luis von Ahn ลองไปดูเรื่อง Human Computation ที่เขาพูดใน Google TechTalk ดูจะสนุกมากครับ

oakyman's picture

เยี่ยม
คนนี้นี่เอง ที่เคยทำเกมจับคู่ใช่มั้ยครับ
--
my blog

lew's picture

สังเกตุว่าเค้าจะใช้ 2 คำพร้อมกันเสมอ เลยเดาๆ ว่าเขาจะสุ่มสองคำที่ไม่ซ้ำกันให้แต่ละคน ถ้ามีคนแปลงคำเดียวกันเหมือนกันมากกว่าสองครั้งขึ้นไปถึงจะถือว่าถูกต้อง
------
LewCPE

sirn's picture

ไปอ่านจากเว็บ reCAPTCHA สองคำนี้ จะสุ่มโดยที่มีหนึ่งคำที่ "รู้อยู่แล้ว" ว่ามันเป็นคำว่าอะไร ถ้าหากตอบอันนั้นถูก reCAPTCHA ก็จะอนุมานว่าอีกคำหนึ่งเป็นคำที่ถูกด้วยครับ

จาก What is reCAPTCHA?

But if a computer can't read such a CAPTCHA, how does the system know the correct answer to the puzzle? Here's how: Each new word that cannot be read correctly by OCR is given to a user in conjunction with another word for which the answer is already known. The user is then asked to read both words. If they solve the one for which the answer is known, the system assumes their answer is correct for the new one. The system then gives the new image to a number of other people to determine, with higher confidence, whether the original answer was correct.

anon3@drupal.org's picture

ลิขสิทธิ์ของข้อมูลที่ได้จะเป็นของใคร. เป็นของเจ้าของเว็บ หรือ เป็นของ contributor?

--
อานนท์
(user/pass กันลืม)
username: anon3@drupal.org
password: anon3

kamthorn's picture

โอว.. คิดได้ไงนี่

--

CCCP's picture

สงสัยจะเป็นเจ้าของทฤษฎี win-win ไม่รู้ตอนนี้ยังพูดรู้เรื่องอยู่รึเปล่า 5

ezy's picture

น่าลองเล่นแฮะ

avaya's picture

เจ๋งมาก