Google

อ่านแต่หัวข่าวเฉยๆ มันจะเข้าใจยากนิดนึงครับ ขออธิบายเพิ่มดังนี้
"วัตถุ" หรือ "อ็อบเจ็คต์" แต่ละชนิดจะมีข้อมูล metadata ที่อธิบายตัวมันเองแตกต่างกันไป เช่น ภาพยนตร์มีข้อมูลความยาว ผู้กำกับ นักแสดงนำ, หนังสือมีข้อมูลผู้เขียน ปีที่พิมพ์ จำนวนหน้า ฯลฯ ซึ่งเวลาเก็บข้อมูล metadata เหล่านี้ในฐานข้อมูลเฉพาะก็ไม่มีปัญหาอะไร เพราะกำหนดฟิลด์ชัดเจนว่าฟิลด์ไหนหมายถึงอะไร (structured data)
แต่พอ "แสดงผล" ข้อมูลออกมาเป็น HTML บนหน้าเว็บ มันจะกลายเป็นข้อความ text ธรรมดาทั้งหมด (unstructured data) แยกแยะได้ยากว่าข้อความส่วนไหนคือฟิลด์ผู้เขียน ฟิลด์ผู้กำกับ ฯลฯ แน่นอนว่าเรา__อาจ__ดักจับแพทเทิร์นบางอย่างได้ แต่ไม่ใช่เรื่องง่ายเพราะแต่ละเว็บใช้ไม่เหมือนกัน

ในมุมมองของคนทำ search engine ปัญหานี้ทำให้ผลการค้นหาไม่ดีอย่างที่ควรจะเป็น เพราะ search engine ไม่สามารถสกัดข้อมูลที่ควรจะเป็น structured ออกมาได้
ทางออกหนึ่งของปัญหานี้ก็คือกำหนดฟอร์แมตมาตรฐานให้กับข้อมูล HTML (และหวังว่าคนจะนำไปใช้กันเยอะๆ) ฟอร์แมตข้อมูลลักษณะนี้เรียกว่า microdata (ในอดีตเคยมีโครงการ Microformats พยายามจะทำแบบนี้แต่ไม่ประสบความสำเร็จนัก)
Schema.org เป็นโครงการใหม่ที่พยายามกำหนดฟอร์แมต microdata แต่คราวนี้ไม่ธรรมดาเพราะ search engine ใหญ่ของโลก 3 รายคือกูเกิล ไมโครซอฟท์ ยาฮู หนุนหลังอย่างเต็มที่
Schema.org จะทำตัวเป็นองค์กรกลางสำหรับกำหนดฟอร์แมต microdata รูปแบบต่าง เช่น ภาพยนตร์ หนังสือ สูตรอาหาร รายการทีวี บุคคล เหตุการณ์ องค์กร ฯลฯ (ดูรายการทั้งหมด)
เพื่อให้เห็นภาพกันมากขึ้น ก็ขอโชว์โค้ดตัวอย่างของ schema.org ครับ
ข้อความปกติบนเว็บ

Resistance 3: Fall of Man
by Sony
Platform: Playstation 3
Rated: Mature

ฟอร์แมตที่กำหนดโดย schema.org

<div itemscope itemtype="http://schema.org/CreativeWork">
<img itemprop="image" src="videogame.jpg" />
<span itemprop="name">Resistance 3: Fall of Man</span>
by <span itemprop="author">Sony</span>,
Platform: Playstation 3
Rated:<span itemprop="contentRating">Mature</span>
</div>

จะเห็นว่าฟอร์แมตของ schema.org จะใช้แท็ก HTML ธรรมดา แต่จะเพิ่ม attribute ใหม่มาสองชนิดคือ itemtype และ temprop เป็นต้น
กูเกิลประกาศว่าเดิมทีรองรับฟอร์แมตแบบนี้ 3 ชนิดคือ microformat, RDFa และ microdata (ของ schema.org) ต่อจากนี้ไปจะเน้นที่ microdata เพียงอย่างเดียว แต่ก็จะยังรองรับฟอร์แมตแบบอื่นๆ ต่อไป
กูเกิลยังออกเครื่องมือสำหรับทดสอบเว็บไซต์ว่าเขียนฟอร์แมตของ microdata ถูกต้องหรือไม่ ชื่อว่า Rich Snippets Testing Tool
การร่วมกันผลักดัน schema.org ครั้งนี้ จะคล้ายๆ กับการกำหนดฟอร์แมตของ sitemap ในอดีต (ผ่าน sitemaps.org) ซึ่งภายหลังกลายเป็นมาตรฐานให้เว็บมาสเตอร์ทุกเว็บต้องปฏิบัติตาม คราวนี้ก็ต้องรอดูว่า schema.org จะมีคนใช้มากน้อยแค่ไหน (อาจต้องให้เวลาอีกสักพัก)
ใครที่ทำเว็บรีวิวผลิตภัณฑ์ชนิดต่างๆ อาจพิจารณาใช้งานเพื่อให้ search engine เข้าถึงข้อมูลของเว็บเราได้ดีขึ้น
ที่มา - Search Engine Land
คำประกาศสนับสนุนจาก 3 รายใหญ่: กูเกิล, ไมโครซอฟท์, ยาฮู

Hiring! บริษัทที่น่าสนใจ

Carmen Software company cover
Carmen Software
Hotel Financial Solutions
Next Innovation (Thailand) Co., Ltd. company cover
Next Innovation (Thailand) Co., Ltd.
We are web design with consulting & engineering services driven the future stronger and flexibility.
KKP Dime company cover
KKP Dime
KKP Dime บริษัทในเครือเกียรตินาคินภัทร
Kiatnakin Phatra Financial Group company cover
Kiatnakin Phatra Financial Group
Financial Service
Fastwork Technologies company cover
Fastwork Technologies
Fastwork.co เว็บไซต์ที่รวบรวม ฟรีแลนซ์ มืออาชีพจากหลากหลายสายงานไว้ในที่เดียวกัน
Thoughtworks Thailand company cover
Thoughtworks Thailand
Thoughtworks เป็นบริษัทที่ปรึกษาด้านเทคโนโยลีระดับโลกที่คว้า Great Place to Work 3 ปีซ้อน
Iron Software company cover
Iron Software
Iron Software is an American company providing a suite of .NET libraries by engineer for engineers.
CLEVERSE company cover
CLEVERSE
Cleverse is a Venture Builder. Our team builds several tech companies.
Nipa Cloud company cover
Nipa Cloud
#1 OpenStack cloud provider in Thailand with our own data center and software platform.
Bangmod Enterprise company cover
Bangmod Enterprise
The leader in Cloud Server and Hosting in Thailand.
CIMB THAI Bank company cover
CIMB THAI Bank
MOVING FORWARD WITH YOU - CIMB is the leading ASEAN Bank
Bangkok Bank company cover
Bangkok Bank
Bangkok Bank is one of Southeast Asia's largest regional banks, a market leader in business banking
MuvMi (Urban Mobility Tech Co.,Ltd.) company cover
MuvMi (Urban Mobility Tech Co.,Ltd.)
Shape the future of urban mobility towards affordable, clean, and safe solutions
T.N. Digital Solution Co., Ltd. company cover
T.N. Digital Solution Co., Ltd.
TNDS has been involving in every first move of banking’s major digital transformation.
KBTG - KASIKORN Business-Technology Group company cover
KBTG - KASIKORN Business-Technology Group
KBTG - "The Technology Company for Digital Business Innovation"
Siam Commercial Bank Public Company Limited company cover
Siam Commercial Bank Public Company Limited
"Let's start a brighter career future together"
Icon Framework co.,Ltd. company cover
Icon Framework co.,Ltd.
Global Standard Platform for Real Estate แพลตฟอร์มสำหรับธุรกิจอสังหาริมทรัพย์ครบวงจร มาตรฐานระดับโลก
REFINITIV company cover
REFINITIV
The Financial and Risk business of Thomson Reuters is now Refinitiv
H LAB company cover
H LAB
Re-engineering healthcare systems through intelligent platforms and system design.
The Gang Technology Co., Ltd. company cover
The Gang Technology Co., Ltd.
We're a Digital Agency that helps our customers transform their business into digital with ease.
LTMH company cover
LTMH
LTMH มุ่งเน้นการพัฒนาผลิตภัณฑ์ที่สามารถช่วยพันธมิตรของเราให้บรรลุเป้าหมาย
Seven Peaks company cover
Seven Peaks
We Drive Digital Transformation
Wisesight (Thailand) Co., Ltd. company cover
Wisesight (Thailand) Co., Ltd.
The Best Choice For Handling Social Media · High Expertise in Social Data · Most Advanced and Secure
MOLOG Tech company cover
MOLOG Tech
We are Modern Logistic Platform, Specialize in WMS, OMS and TMS.
Data Wow Co.,Ltd company cover
Data Wow Co.,Ltd
We enable our clients to realize increased productivity by solving their most complex issues by Data
LINE Company Thailand company cover
LINE Company Thailand
LINE, the world's hottest mobile messaging platform, offers free text and voice messaging + Call
LINE MAN Wongnai company cover
LINE MAN Wongnai
Join our journey to becoming No.1 food platform in Thailand

tr Fri, 03/06/2011 - 11:17

ใครนั่งทำ SEO ก็ควรนั่งทำอันนี้แหละ สามเจ้าใหญ่เขาจัดเองเลย :)

ดูแล้วแปลกๆ อย่าง <div itemscope> ผมว่าน่าจะเป็น <div:itemscope> นะครับ

อ้างอิงจาก XML Schema ที่เคยผ่านตามา

div:itemscope มันเป็น tag ใหม่ไปเลยนะครับ

ไม่เหมือนกับ div แต่ใช้ attr เป็น itemscope เพราะ div เดิมก็ยังแสดงผลได้ปกติอยู่ เพียงแต่ attr ตัวใหม่เพิ่มเข้ามา browser ก็แสดงผลได้ถูกต้อง และ ignore ตัว attr ที่ไม่รู้จักไป แต่ search engine สามารถ crawl เพื่อดักจับ attr ใหม่ในเว็บได้

PaPaSEK Fri, 03/06/2011 - 11:32

In reply to by xenogew

โอ้! ขอบคุณมากครับสำหรับความรู้

เอ... เหมือนผมเคยอ่านเจอจากไหนไม่รู้ว่า Attribute ที่มันเปิดโล่งๆ นี่ถือว่าไม่มาตรฐานไม่ใช่เหรอครับ (HTML Schema)

หรือว่านี่เป็นมาตรฐานใหม่อีกตัว?

icez Fri, 03/06/2011 - 16:06

In reply to by PaPaSEK

ปกติการเปิด attribute โล่งๆ จะหมายถึง attribute นั้นเป็น boolean และให้ค่าเท่ากับ true (ถ้าไม่มีถือว่าเป็น false) ครับ
ยกเว้นเสียแต่จะใส่ attribute value เป็น false / disable / อะไรแนวๆ นี้

PaPaSEK Fri, 03/06/2011 - 18:35

In reply to by PaPaSEK

@icez ขอบคุณมากครับ เขียน HTML มาหลายปีเพิ่งเข้าใขวันนี้ว่า Attribute แบบเปิดโล่งคือ Boolean

@lew ขอบคุณอีกเช่นกันครับ รับวันมาตรฐานมีหลายแบบเหลือเกิน ชักมึนๆ คงต้องฝึกบ่อยๆ จะได้ชิน

ถ้าได้อ่านหนังสือ Weaving the Web ของท่านเซอร์ Tim จะเล่าไว้ครับ ว่าสมัยนั้นมีฟอร์แมตสำหรับ HyperText จำนวนมาก บางอันเสียเงิน บางอันฟรี

HTML สร้างจาก SGML ที่ตอนนั้น IBM กำลังสนับสนุนให้บริษัทต่างๆ เก็บข้อมูลเป็น SGML แทน Binary กันมากขึ้น ตอนนั้น Tim B. Lee ถึงได้ไปสร้างมาตรฐานจาก SGML ขึ้นมาอีกชัน ผ่านไปหลายปีบริษัทใหญ่ๆ เช่น IBM และบริษัทซอฟต์แวร์อื่นๆ ถึงได้ผลักดัน XML

คนมักลืมชื่อ IBM ในประวัติศาสตร์หลายๆ หน้าของวงการครับ ทั้ง SGML นี่หลังๆ หนังสือก็ไม่เขียนถึงกันแล้ว

winteen Fri, 03/06/2011 - 12:52

ชาว Web designer ได้ของเล่นใหม่มาใช้อีกแล้วว

ชอบ microformat มากกว่าแฮะ อันนั้นใช้ class แล้วเอาไปผูกกับ css ง่ายดี, javascript framework ปัจจุบันส่วนใหญ่ก็มี class selector กันอยู่แล้ว จัดการต่างๆ ง่ายกว่า

rabbitch Fri, 03/06/2011 - 17:41

จะถึงยุค web 3.0 แล้วใช่ไหมนี่ หลังจากโรบอทอ่านเข้าใจอีกหน่อยคงนำมาประมวลผลจนคอมพิวเตอร์เข้าใจอะไรที่มนุษย์เข้าใจ

คิดว่า ผ่าน/ไม่ผ่าน คงไม่เป็นปัญหามั้งนะ
เพราะหลายครั้งที่ code ที่ทางฝั่ง distributor แจกออกมา ก็มี attribute แปลก ๆ ติดมา

หรืออย่างพวก Dojo, jQuery ก็เช่นกัน ที่ติด attribute ที่ไม่ได้อยู่ใน W3C standard แต่ก็เพื่อความสะดวกในการเรียกใช้งานตาม platform ที่จะใช้งาน ก็ขึ้นแดง (ดัก error) ก็เพราะตัว IDE ไม่มีการกำหนด definition ให้มันต่างหาก