จากงานสัมมนา Blognone Tech Day
ลิ่วได้แสดงความประทับใจในการใช้งานอักขระ ZWSP (Zero Width Space) ซึ่งนอกจากจะทำให้เว็บเบราว์เซอร์ตัดคำได้ถูกต้องเป็นที่น่าพอใจแล้ว ยังสามารถทำให้ search engine เข้ามาทำ index กับเนื้อหาภาษาไทย และสามารถค้นหาข้อมูลได้ถูกต้อง
แต่ผมเพิ่งนึกอะไรออกเกี่ยวกับ search engine ก็เลยลองทดสอบดู ด้วยคำค้นหาต่อไปนี้
โดยใช้ search engine สามตัว คือ Google, MSN Search, และ Yahoo! Search
Googlehttp://www.google.com/
MSN Searchhttp://search.msn.com/
Yahoo! Searchhttp://search.yahoo.com/
โดยธรรมชาติของภาษาไทย คำ ๆ หนึ่งมักจะประกอบขึ้นจากคำหลายคำ ซึ่งทั้งคำเต็มและคำย่อยนั้นควรจะค้นหาได้ทั้งคู่ แต่อัลกอริทึมของ search engine ยังไม่รู้จักหลักการนี้ของภาษาไทยอย่างเห็นได้ชัด ผมไม่รู้ว่าอย่างภาษาจีนหรือญี่ปุ่นที่มีลักษณะใกล้เคียงกัน search engine จะสามารถค้นหาทั้งคำเต็มและคำย่อยภายในคำ ๆ เดียวกันได้หรือไม่ ซึ่งถ้าทำได้อยู่แล้ว ภาษาไทยก็น่าจะเพิ่มเข้าไปได้เช่นกัน
ไปอ่านเรื่องลิ่ว ๆ กับ ZWSP ได้ที่นี่ครับ
ป.ล. สังเกตไหมว่า MSN Search ไม่มีโลโก้ให้เห็น เพราะดันเอาไปไว้มุมขวาบน :-P
(จากเว็บบล็อกผมเอง: http://paepae.exteen.com/20060501/zwsp-search-engine)
ผมก็นึกถึงปัญหานี้อยู่เหมือนกันครับ ไม่ใช่เฉพาะ search engine นะ สมมุติว่าเราใช้ฟีเจอร์ find as you type ของ firefox หาคำว่า "มากที่สุด" เนี่ย เราต้องพิมพ์เป็น "มาก ที่ สุด" ด้วยหรือเปล่า ?
pittaya.com
> pittaya ไม่ได้ทั้งสองกรณีครับ เราจำเป็นต้องพิมพ์ "ตัวอักขระ ZWSP (0x200B)" ลงไปในการค้นหานั้น ๆ
ลอง copy ไปใช้ค้นหาดูได้นะครับ 1) ธรรมดา ==> "มากที่สุด" 2) เว้นวรรค ==> "มาก ที่ สุด" 3) ZWSP ==> "มากที่สุด"
LinkedIn
ผมว่า ถ้าคีย์บอร์ดมีคีย์ ZWSP น่าจะสะดวกขึ้น เวลาพิมพ์ก็เคาะๆ ไปด้วย แบบ space bar เลย
iPAtS
>>ผมว่า ถ้าคีย์บอร์ดมีคีย์ ZWSP น่าจะสะดวกขึ้น >>เวลาพิมพ์ก็เคาะๆ ไปด้วย แบบ space bar เลย
ไม่ควรต้องเคาะครับ แต่ถ้าทำได้ ก็คงตัดคำได้ไปแล้วนี่เนอะ
onedd.net