TensorFlow เพิ่มโมเดลที่มาพร้อมกับโครงการอันล่าสุดคือ Skip-Thought โมเดลสำหรับการหาประโยคที่มี "ความหมาย" ใกล้เคียงกับประโยคที่ให้ไป แม้ว่าตัวข้อความตามตัวอักษรจะไม่คล้ายกันก็ตามที
ตัวอย่างการใช้งานที่ TensorFlow แสดงคือการหาข้อความคล้ายๆ กันในการรีวิวภาพยนตร์ หากใครจะนำไปใช้สำหรับการรีวิวอื่นๆ ก็น่าจะใช้งานได้เช่นเดียวกัน เช่นทุกวันนี้ที่เว็บรีวิวมันจับกลุ่มการรีวิวข้อความคล้ายๆ กันเป็นสรุปให้กับผู้ใช้ที่กำลังเลือกซื้อสินค้าหรือติดตั้งแอป
ตัวโมเดลมาพร้อมกับ checkpoints ที่ฝึกกับข้อมูลชุด BookCorpus มาแล้ว หากฝึกเองจะใช้เวลาประมาณ 9 วันเมื่อใช้การ์ด GeForce GTX 1080 ตัวข้อมูลที่ฝึกลดรูปคำศัพท์เหลือเพียง 20,000 คำ พร้อมคู่มือการเพิ่มคำศัพท์
ที่มา - TensorFlow
Comments
ว่าแต่ไอ้ที่บอกว่ารันบน GTX ได้ นี่แก้บั๊คหรือยัง 555555555555555555 (เห็นคนไปโวยกันเต็ม Github แถมผมก็เจอกับตัว)
ได้ข่าวว่ายังบั๊คอยู่หนิท่าน ถ้ารันบนการ์ดจอ เพราะการ์ดจอมันฟ้องว่าแรมการ์ดจอเต็ม(ไม่ใช่บั๊คของ CUDA และ cuDNN ด้วย เพราะรันบน Theano รันได้ปกติ)
ผมก็เจอนะโมเดลที่บอกไว้ว่า 3GB แต่รันบน GTX 1060 3GB ไม่ผ่าน
มันก็เรื่องปกติของของซอฟต์แวร์ที่ออก release ถี่ๆ นะครับ ก็แก้กันไป
lewcpe.com, @wasonliw
ปัญหาของ TensorFlow ไม่ใช่ออกถี่นะครับ Lib อื่นก็ออกถี่เหมือนกัน Scikit-learn นั่นก็ถี่เหมือนกัน
ปัญหาตอนนี้คือคุณรันบนการ์ดจอไม่ได้เลย(ย้ำนะครับ ไม่ได้เลยจริงๆ มันโวยวายยาวมาก(ให้ตายเถอะโรบิ้น หากูเกิ้ลทีก็ต้องก็อบทั้งหมดไป)) ไม่ใช่รันไม่ได้บ้างแบบของคุณ ตอนที่ผมไปอ่าน Github หลายคนก็มาโวย บางเคสถึงขั้น server เลยก็มี มันไม่ใช่ปกติแล้วนะครับ มันเรื่องใหญ่มากเลยแหละแถมถอยไป ver0.12 พี่ท่านก็ยังบั๊ค อาการเดียวกันเป๊ะๆเลย(ให้ตายเถอะซาร่า) เพราะถ้า Bug เรื่องไม่รันการ์ดจอนี่ไม่ต้องทำอะไรแล้วคุณ เลิกทำเลย Deep Learning อะ(ผมถึงบอกคุณว่ามันไม่ปกติ ผมเคยเจอปัญหานี้มา ถึงขั้นเป็นลมเลย ต้องแก้ Backend ของ Keras ใหม่หมด)
ทุกวันนี้ TensorFlow มีคนบ่นว่าห่วยลงนะฮะ แล้วก็ปัญหาอีกอย่างของ TensorFlow คือมันจะไปจองแรมการ์ดจอจนเต็มเลย(มีเท่าไรจองหมด) ซึ่งมันไม่ควรจะเป็น มันควรจะพอทำงานถึงไปจอง พอรันเสร็จค่อยคืน แต่นี่เล่นจองยังกับคนเอาปากกาไปวางตามร้านอ่านหนังสือ(ถ้าคุณสั่ง nvidia-smi มันจะขึ้นเลยว่าพี่ท่านจองแรมหมด)
ลอง set per_process_gpu_memory_fraction ยังครับ
เอ สงสัยผมยังไม่ได้อัพเดตแฮะ แต่พวกโมเดลเล็กๆ อย่างพวก image label ผมยังรันผ่านอยู่นะ แต่ลองเซ็ดอัพ env มาลองโมเดลใหม่ๆ แล้วพัง
จะย้ายไปไหนบอกด้วยแล้วกันครับ ผมว่าจะหาอีกสัก framework เล่นเหมือนกัน mxnet ก็ดูน่าสนใจดี
lewcpe.com, @wasonliw
pytorch โลดครับ
เอามา train ให้รู้จักภาษาไทยได้มั๊ยนิ?
ภาษาไทยเอาแค่ตัดคำก่อนครับ แต่ที่รู้มาตอนนี้ตัวตัดคำภาษาไทยไม่ได้เขียนด้วย TensorFlow ครับ เพราะ TensorFlow มันถนัดแต่โครงสร้าง Static แถมตอนนี้มี Lib ที่เขียนง่ายมันเยอะ