คือตอนนี้ผมกำลังทำโปรเจคจบอยู่นะครับ เป็นการไปดึงข้อมูลกระทู้และก็คอมเม้นต่างๆ ในเว็บ Pantip แล้วเอามาวิเคราะห์นะครับ แต่มีปัญหาตรงที่ผมไม่มีความรู้ด้านเว็บเลย เลยไม่รู้ว่าจะไปดึงข้อมูลมาได้ยังไง ที่คิดไว้ก็คือไปตัดเอาข้อความจาก file HTML โดยตรงเลยโดยอาศัย Tag เป็นตัวกำหนดขอบเขตว่าส่วนไหนเป็น หัวข้อ เนื่อหา ผู้โพส วันเวลา แต่ก็เกิดปัญหาว่ามีส่วนหนึ่งที่ผมต้องการมากคือตรง "ถูกใจ" ที่จะแสดงคนที่มาถูกใจโพส แต่ใน source HTML มันไม่มีส่วนนี้แสดงอยู่รู้สึกว่ามันน่าจะเป็น java script นะครับ มีใครพอจะทราบไหมครับว่าจะมีวิธีไหนในการเก็บข้อมูลนี้มาได้นะครับ
view source หา .js แล้วลองไล่ตามไปดูครับ จะเจอฟังก์ชั่นที่ดึง like มาโชว์
อันนี้ตามที่ผมลองคิดดูนะ เริ่มจาก get หัวข้อกระทู้ทั้งหมดของแต่ละหมวดจาก rss feed ซึ่งพันทิพเองมีอยู่แล้ว ในนั้นจะมี link ไปยังเนื้อหากระทู้ต่างๆอยู่ พอได้ลิ้งนั้นแล้วก็ใช้คำสั่งพวก url loader ซึ่งผลลัพจะได้เป็น html content ของลิ้งนั้นทั้งหมดมา พอได้ html มาแล้วที่เหลือก็แค่ดักว่าส่วนไหนเป็นอะไรเพื่อดึงข้อมูลได้แล้วล่ะครับ
Rss ส่วนใหญ่แสดงได้ไม่เยอะนะครับ จะเป็นกระทู้ใหม่ๆ
My iOS apps
My blog
pantip เก็บ ถูกใจ เป็น text file ครับ ลองเปลี่ยน .html เป็น .txt ดูก็จะได้ข้อมูลมาแล้ว
เช่น
http://www.pantip.com/cafe/wahkor/topic/X11700242/X11700242.html
แก้เป็น
http://www.pantip.com/cafe/wahkor/topic/X11700242/X11700242.txt
fotmat ที่เก็บจะเป็น
[reply no.][\t][link to user profile]
*rep no. 0 คือ เนิ้อหากระทู้ครับ
ขอบคุณพี่ๆ ทุกคนมากครับ ทำให้พอเห็นภาพแล้วละครับ
แต่สงสัยตรงที่พี่บอกว่าให้ลองไล่ตามตรง java script
จะใช้วิธีไหนไล่ตามอ่ะครับ แล้วที่มันดึง text file มาแสดงนี้
ดึงมายังไงอ่ะครับ พี่ช่วยแนะนำเรื่องที่ต้องไปศึกษาก็ได้ครับ
ขอบคุณมากๆ ครับ
ใช้ Chrome Developer Tools ครับ เปิดแท็ปใหม่ อย่าเพิ่งเข้าเว็บ กด F12 จะมีหน้าต่าง Developer Tools ขึ้นมา ให้กดปุ่ม Network จากนั้นกลับไปหน้าต่างเดิม ให้เข้าเว็บที่ต้องการ รอโหลดเรื่อยๆ จะเจอ .txt เรียกมาจาก topic_include.js:415
ในบราวเซอร์อื่นๆ กระบวนการนี้สามารถดูได้จาก Firebug > Network ของ Firefox หรือ Internet Explorer Developer Tools แถบ Network เหมือนกันครับ
ขอให้โชคดีครับ
ขอบคุณมากครับ เดี๋ยวจะไปลองดูนะครับ