กูเกิลเริ่มทำ OCR กับไฟล์ PDF
กูเกิลประกาศเริ่มแปลงข้อมูลภาพในไฟล์ PDF ทั้งหมดให้เป็นตัวอักษรเพื่อให้สามารถค้นหาได้ โดยใช้เทคโนโลยี Optical Character Recognition (OCR) แบบเดียวกับที่กูเกิลเคยใช้ใน Google Book Search มาก่อนหน้านี้แล้ว
ความพยายามของกูเกิลในช่วงๆ หลังๆ มานี้คงเป็นเรื่องของความพยายามในการค้นหาข้อมูลที่แต่ก่อนเคยค้นกันไม่ได้เช่นหน้าเว็บที่ต้องคลิกฟอร์มก่อน หรือจะเป็นไฟล์ PDF ที่เก็บเอกสารเป็นภาพแทนที่จะเป็นข้อความ
อนาคตคงไม่แปลกอะไรหากเราจะได้เห็นรูปแบบการค้นหาแบบใหม่ๆ เช่นการค้นหาคำพูดจากไฟล์ mp3 หรือวีดีโอใน Youtube ก็เป็นได้
ที่มา - Google Blog
ข่าวย้อนหลังที่เกี่ยวข้อง
- แบนด์วิธไปต่างประเทศของประเทศไทยเกิน 50 Gbps แล้ว
- 3 ไตรมาสแรกปี 2551 กูเกิล ไชนา รับทรัพย์กว่า 973 ล้านหยวน
- นิวซีแลนด์เตรียมใช้ "มาตรา 92" ละเมิดลิขสิทธิ ตัดเน็ตทันทีโดยไม่ต้องขึ้นศาลหรือหาหลักฐาน
- DreamWorks เตรียมฉายโฆษณาหนังใหม่ช่วงพัก Super Bowl เป็นสามมิติ
- Picasa สำหรับ Mac OS X เปิดตัวแล้ว
- ส่วนแบ่งตลาดของ IE ต่ำกว่า 70% แล้ว
- lew's blog
- Login or register to post comments





Google Audio Indexing
+1 Informative
ผมพลาดไปได้ไงเนี่ย
LewCPE
อ๊ะ เริ่มกันแล้วแฮะ
——————————————————————
คิดๆ ขีดๆ เขียนๆ | นั่งเล่นในสวน ชวนคุยเรื่องเกม
สามารถ search ได้แทบจะทุกอย่างจริงๆ
เจ๋งเลยครับ … แบบว่าต่อไปก็สามารถ Search ข้อมูลในวิดิโอได้มากยิ่งขึ้น
เป็นประโยชน์กับผมมากๆครับ : )
ขอบคุณครับ สวัสดีครับ
:: Take minimum, Give Maximum ::
เยี่ยมเลยอะ ^^;