Tags:

คือตอนนี้ผมกำลังทำโปรเจคจบอยู่นะครับ เป็นการไปดึงข้อมูลกระทู้และก็คอมเม้นต่างๆ ในเว็บ Pantip แล้วเอามาวิเคราะห์นะครับ แต่มีปัญหาตรงที่ผมไม่มีความรู้ด้านเว็บเลย เลยไม่รู้ว่าจะไปดึงข้อมูลมาได้ยังไง ที่คิดไว้ก็คือไปตัดเอาข้อความจาก file HTML โดยตรงเลยโดยอาศัย Tag เป็นตัวกำหนดขอบเขตว่าส่วนไหนเป็น หัวข้อ เนื่อหา ผู้โพส วันเวลา แต่ก็เกิดปัญหาว่ามีส่วนหนึ่งที่ผมต้องการมากคือตรง "ถูกใจ" ที่จะแสดงคนที่มาถูกใจโพส แต่ใน source HTML มันไม่มีส่วนนี้แสดงอยู่รู้สึกว่ามันน่าจะเป็น java script นะครับ มีใครพอจะทราบไหมครับว่าจะมีวิธีไหนในการเก็บข้อมูลนี้มาได้นะครับ

Get latest news from Blognone
By: lancaster
Contributor
on 15 February 2012 - 00:56 #383796

view source หา .js แล้วลองไล่ตามไปดูครับ จะเจอฟังก์ชั่นที่ดึง like มาโชว์

By: holyddog on 15 February 2012 - 02:23 #383827
holyddog's picture

อันนี้ตามที่ผมลองคิดดูนะ เริ่มจาก get หัวข้อกระทู้ทั้งหมดของแต่ละหมวดจาก rss feed ซึ่งพันทิพเองมีอยู่แล้ว ในนั้นจะมี link ไปยังเนื้อหากระทู้ต่างๆอยู่ พอได้ลิ้งนั้นแล้วก็ใช้คำสั่งพวก url loader ซึ่งผลลัพจะได้เป็น html content ของลิ้งนั้นทั้งหมดมา พอได้ html มาแล้วที่เหลือก็แค่ดักว่าส่วนไหนเป็นอะไรเพื่อดึงข้อมูลได้แล้วล่ะครับ

By: sarunw
Contributor
on 15 February 2012 - 02:30 #383832

Rss ส่วนใหญ่แสดงได้ไม่เยอะนะครับ จะเป็นกระทู้ใหม่ๆ


My iOS apps
My blog

By: soginal
AndroidIn Love
on 15 February 2012 - 10:38 #383911
soginal's picture

pantip เก็บ ถูกใจ เป็น text file ครับ ลองเปลี่ยน .html เป็น .txt ดูก็จะได้ข้อมูลมาแล้ว

เช่น

http://www.pantip.com/cafe/wahkor/topic/X11700242/X11700242.html

แก้เป็น

http://www.pantip.com/cafe/wahkor/topic/X11700242/X11700242.txt

fotmat ที่เก็บจะเป็น

[reply no.][\t][link to user profile]

*rep no. 0 คือ เนิ้อหากระทู้ครับ

By: N_Kongkotchawan
Windows
on 15 February 2012 - 21:29 #384165

ขอบคุณพี่ๆ ทุกคนมากครับ ทำให้พอเห็นภาพแล้วละครับ

แต่สงสัยตรงที่พี่บอกว่าให้ลองไล่ตามตรง java script

จะใช้วิธีไหนไล่ตามอ่ะครับ แล้วที่มันดึง text file มาแสดงนี้

ดึงมายังไงอ่ะครับ พี่ช่วยแนะนำเรื่องที่ต้องไปศึกษาก็ได้ครับ

ขอบคุณมากๆ ครับ

By: anu
Contributor
on 15 February 2012 - 22:40 #384185 Reply to:384165

ใช้ Chrome Developer Tools ครับ เปิดแท็ปใหม่ อย่าเพิ่งเข้าเว็บ กด F12 จะมีหน้าต่าง Developer Tools ขึ้นมา ให้กดปุ่ม Network จากนั้นกลับไปหน้าต่างเดิม ให้เข้าเว็บที่ต้องการ รอโหลดเรื่อยๆ จะเจอ .txt เรียกมาจาก topic_include.js:415

ในบราวเซอร์อื่นๆ กระบวนการนี้สามารถดูได้จาก Firebug > Network ของ Firefox หรือ Internet Explorer Developer Tools แถบ Network เหมือนกันครับ

ขอให้โชคดีครับ

By: N_Kongkotchawan
Windows
on 16 February 2012 - 20:31 #384587 Reply to:384185

ขอบคุณมากครับ เดี๋ยวจะไปลองดูนะครับ