คนแถวนี้น่าจะรู้จักบริการตรวจว่าเป็นคนหรือเป็นคอม หรือที่เราเรียกกันเป็นภาษาเทคนิคว่า CAPTCHA เมื่อปี 2007 เราเคยลงเรื่อง reCAPTCHA ซึ่งนำบริการ CAPTCHA มาผนวกกับ OCR
ล่าสุดกูเกิลซื้อกิจการ reCAPTCHA ไปเรียบร้อยโดยไม่เปิดเผยวงเงิน คาดว่าเทคโนโลยีของ CAPTCHA ด้านการทำ OCR โดยใช้พลังมวลชน จะช่วยงานของกูเกิลในบริการ Google Books และ Google News Archive Search ได้มาก ถ้าคิดไม่ออกลองนึกดูว่าถ้าคนที่ค้นหาข้อมูลบนกูเกิลจะต้องป้อน reCAPTCHA ทุกคน หนังสือที่สแกนเข้ามาเก็บใน Google Books คงถูกแปลงเป็นตัวหนังสือในเวลาไม่นาน
ปิดท้ายข่าวนี้ด้วยภาพความร่วมมือระหว่างกูเกิลกับ reCAPTCHA
ที่มา - Official Google Blog
- 24 comments
- 2812 reads
- Read more
เชื่อว่าทุกคนคงคุ้นเคยกับ CAPTCHA กันอยู่แล้ว (ถ้าไม่เคยได้ยินชื่อ กดเข้าไปตามลิงก์ก็น่าจะอ๋อ) มีการคำนวณว่าแต่ละวันมีคนต้องแก้ปัญหา CAPTCHA ประมาณ 60 ล้านครั้ง ถ้าแต่ละคนใช้เวลา 10 วินาทีในการคิดและพิมพ์ เราก็จะเสียเวลาในการทำงานไปเปล่าๆ 150,000 ชั่วโมงต่อวัน มีวิธีเอาแรงงานตรงนี้มาใช้ประโยชน์ได้หรือเปล่า
โครงการ reCAPTCHA จึงเกิดมาด้วยแนวคิดนี้ ไหนๆ ผู้ใช้ต้องแก้ปัญหาตัวหนังสือที่อ่านยาก และมีโครงการสแกนหนังสือเพื่อทำ OCR จำนวนมาก ที่ผลการสแกนบิดๆ เบี้ยวๆ ต้องใช้แรงคนมานั่งแปลอีกครั้ง ก็เอาสองงานนี้มารวมร่างกันเสีย นั่นแปลว่าทุกครั้งที่เราแก้ปัญหา reCAPTCHA เรากำลังทำประโยชน์โดยการแปลงภาพหนังสือเป็นข้อความกันอยู่
ขณะที่เขียนมีปลั๊กอิน reCAPTCHA สำหรับ Wordpress, MediaWiki และ phpBB แล้ว เดี๋ยวถ้ามีของ Drupal อาจจะเอามาใช้กับ Blognone ครับ
ที่มา - reCAPTCHA
- 9 comments
- 2508 reads



