Tags:
Google

น่าทึ่งที่หลายครั้งผลงานที่มนุษย์สร้างขึ้นก็สามารถทำอะไรได้มากกว่าที่ผู้สร้างเคยคิดไว้ ตัวอย่างหนึ่งดังเช่น อัลกอริทึมของ Google ที่ถูกพัฒนาขึ้นมาใช้งานกับระบบโฆษณา AdWords ได้ตรวจสอบพบแก๊งมิจฉาชีพต้มตุ๋นและกลุ่มโจรขโมยรถยนต์ในประเทศจีน

AdWords เป็นบริการที่ทำรายได้สำคัญให้แก่ Google โดยในแต่ละวันมีลูกค้าจำนวนมหาศาลที่ต้องการจะลงโฆษณาที่ยิงตรงสู่ผู้ใช้คอมพิวเตอร์ผ่านเว็บเบราว์เซอร์อันนี้ ด้วยเหตุดังกล่าว Google จึงต้องพัฒนาเครื่องมือที่จะช่วยคัดกรองเนื้อหาโฆษณาอันไม่พึงประสงค์ออกจากข้อมูลจำนวนมากเหล่านี้ จนเป็นที่มาของอัลกอริทึมที่ใช้ตรวจสอบหาโฆษณาขายสินค้าที่เป็นของทำปลอมหรือเลียนแบบ รวมทั้งตรวจสอบโฆษณาที่จะนำผู้ใช้งานอินเทอร์เน็ตไปสู่เว็บไซต์อันตราย และกรองสแปมต่างๆ ออกไปจากระบบ

Bing

ไมโครซอฟท์ประกาศปรับปรุงระบบแยกแยะและวิเคราะห์เสียงของ Windows Phone (ที่ใช้เอนจินของ Bing) ให้มีความแม่นยำมากขึ้นกว่าเดิมแม้ในสภาพที่มีเสียงรบกวนมากๆ และทำงานแยกแยะเสียงได้เร็วกว่ารุ่นก่อน 15%

เบื้องหลังการปรับปรุงฟีเจอร์นี้มาจากผลงานของทีม Microsoft Research ในปักกิ่งและสหรัฐ ที่ใช้เทคนิค deep neural networks (DNNs) จำลองการทำงานของเส้นประสาทในสมอง ผนวกกับฐานข้อมูลขนาดใหญ่ของ Bing ทำให้เทคนิคการวิเคราะห์เสียงพูดของค่ายไมโครซอฟท์พัฒนาขึ้นอีกมาก

ไมโครซอฟท์ยังให้ข้อมูลว่าเทคนิค DNN สามารถใช้กับภาษาอื่นๆ ที่ไม่ใช่ภาษาอังกฤษได้ด้วย ทำให้ไมโครซอฟท์สามารพัฒนาและสอน DNN ให้เข้าใจภาษาอื่นๆ ต่อไปในอนาคตได้

ที่มา - Inside Microsoft Research

Tags:
Google

กูเกิลเปิดตัวอัลกอริทึมสำหรับบีบอัดไฟล์แบบใหม่ชื่อ Zopfli จุดเด่นของมันคือประสิทธิภาพในการบีบอัดไฟล์ที่ดีกว่า zlib/gzip และ 7-zip ในปัจจุบันประมาณ 3-8%

อย่างไรก็ตาม Zopfli ไม่ใช่ทางเลือกของการบีบอัดไฟล์ทุกประเภท เพราะการบีบอัดที่ดีขึ้นเล็กน้อย กลับต้องแลกมาด้วยระยะเวลาในการคำนวณที่เพิ่มขึ้นถึง 81 เท่าตัว (เทียบกับ gzip แบบอัดมากที่สุดระดับ -9) ส่วนระยะเวลาคลายการบีบอัด (uncompress) กลับใกล้เคียงกันมาก

กูเกิลบอกว่า Zopfli ออกแบบมาสำหรับการบีบอัดไฟล์แบบ static ที่บีบครั้งเดียวแล้วส่งไฟล์นั้นไปหลายๆ สำเนา (เพื่อลดผลเสียเรื่องเวลาในการบีบอัดไฟล์) เป้าหมายก็คือลดปริมาณข้อมูลที่ต้องใช้ส่งผ่านอินเทอร์เน็ตให้มากที่สุดเท่าที่เป็นไปได้ ตามสไตล์ของกูเกิลนั่นเอง

ตอนนี้ Zopfli เปิดซอร์สให้โปรแกรมอื่นๆ เรียกใช้ได้แล้ว มันเขียนด้วยภาษาซี และเป็นผลงานจากเวลาว่าง 20% ของพนักงานคนหนึ่งของกูเกิลครับ

ที่มา - Google Developers Blog

Tags:
MIT

การทำนายเทรนด์ต่างๆ อาจดูเหมือนเป็นไปไม่ได้ก็จริง แต่ในวันนี้คณาจารย์และนักศึกษาจาก MIT ทำสำเร็จแล้ว โดยการใช้อัลกอริทึมในการทำนายเทรนด์ของ Twitter ใน 1 ชั่วโมงถึง 1 ชั่วโมง 30 นาทีต่อมาโดยมีอัตราความแม่นยำถึง 95 เปอร์เซนต์ และยังพบว่าสามารถทำนายเทรนด์ได้ถึง 4-5 ชั่วโมงต่อมาโดยที่มีอัตราความแม่นยำใกล้เคียงกัน

ประโยชน์การใช้งานของอัลกอริทึมนี้ อาจไม่ได้มีแค่เอาไว้อวดเพื่อนเท่ๆ เพียงอย่างเดียว แต่ยังเป็นประโยชน์กับทาง Twitter ในด้านของการโฆษณา คือ โฆษณาให้ตรงกับเทรนด์ของทวิตเตอร์ในเวลานั้นๆ อีกด้วย โดยอัลกอริทึมนี้จะเปิดตัวอย่างเป็นทางการในสัปดาห์หน้า ณ Workshop ที่เกี่ยวกับ Social Network ของทาง MIT ครับ

ที่มา : Engadget

Tags:
Google

ปัญหาใหญ่ของบริษัทเทคโนโลยีนอกจากการแข่งขันกันสูงแล้ว ยังมีอีกหนึ่งปัญหาที่ส่วนมากเป็นกันถ้วนหน้า ตั้งแต่บริษัทเล็กๆ ไปจนถึงบริษัทยักษ์ใหญ่ แม้แต่กูเกิลเองก็ยังออกมายอมรับแล้วว่าพนักงานหญิงในบริษัทนั้นน้อยกว่าผู้ชายมาก และยังมีอัตราการออกจากบริษัทมากกว่าผู้ชาย (หนึ่งในนั้นก็คือ Marissa Mayer ที่เพิ่งย้ายไปยาฮู) จนถึงตอนนี้พนักงานหญิงในกูเกิลเหลือเพียงหนึ่งในสามของทั้งหมด หรือราวๆ 34,300 คนแล้ว

แน่นอนว่ากูเกิลไม่ได้นิ่งนอนใจกับปัญหานี้ ผู้บริหารเองก็กังวลกับตัวเลขของเหล่าผู้สมัครหญิงที่ตกสัมภาษณ์จำนวนมาก และพนักงานหญิงที่เลื่อนตำแหน่งในอัตราที่ต่ำกว่าผู้ชาย พวกเขาจึงสร้างอัลกอริทึมชุดหนึ่งขึ้นมาเพื่อปกป้องไม่ให้บริษัทต้องสูญเสียพนักงานส่วนน้อยของบริษัทไปมากกว่านี้

วิธีการของกูเกิลเริ่มตั้งแต่การปรับให้มีผู้หญิงเข้าไปเป็นคนสัมภาษณ์ผู้สมัครมากขึ้น ผลักดันให้มีเวิร์คช็อปโดยพนักงานหญิงเพื่อให้ได้เลื่อนขั้นมากขึ้น โดยรวมแล้วคือการปรับทัศนคติของบริษัทให้เข้าใจผู้หญิงมากขึ้นนั่นเอง

กูเกิลเริ่มการเปลี่ยนแปลงครั้งนี้ได้ซักพักแล้ว จนถึงตอนนี้ยังบอกไม่ได้ว่าวิธีนี้ได้ผลแค่ไหน แต่เป้าหมายของกูเกิลคือทำให้อัตราส่วนพนักงานทั้งสองเพศใกล้เคียงกันที่สุด

ที่มา - Gizmodo

Tags:

แม้ว่าเราจะได้เห็นหุ่นยนต์ที่ถูกสร้างขึ้นออกมาให้เลียนแบบมนุษย์ในหลาย ๆ ด้านแล้วก็ตาม แต่การที่จะสอนคอมพิวเตอร์ให้เข้าใจความน่าเสียดายนั้นดูเหมือนจะเป็นเรื่องใหม่ที่ยังไม่มีใครได้พบเห็นมาก่อน

นักวิจัยจากมหาวิทยาลัย Tel Aviv ของประเทศอิสราเอลได้รับการสนับสนุนทางการเงินจากกูเกิล ให้พยายามค้นคว้าอัลกอริธึมที่สามารถที่จะสอนให้คอมพิวเตอร์เรียนรู้จากประสบการณ์ของตัวเองในกรณีต่าง ๆ เช่น การบริหาร ทราฟฟิกของเครือข่ายหรืออินเทอร์เน็ตให้มีประสิทธิภาพ

Tags:
Google

หลังจากที่ The New York Times ตีพิมพ์เรื่องของลูกค้าที่ซื้อแว่นตา Lafont ผ่านเว็บโดยการค้นหาข้อมูลด้วยกูเกิล และสรุปความว่ายิ่งลูกค้าด่ามากเท่าไหร่เว็บก็ยิ่งขายดีนั้น ทางกูเกิลก็ไม่นิ่งนอนใจ ได้ออกมาชี้แจงผ่านบลอกของกูเกิลว่า นี่เป็นปัญหาที่ไม่ควรเกิดขึ้นและตอนนี้กูเกิลก็ได้ตั้งทีมมาดูแลปัญหานี้โดยเฉพาะ รวมถึงปรับปรุงอัลกอริธึมใหม่ที่จะป้องกันปัญหานี้

Tags:
Shazam

ผู้อ่าน Blognone คงรู้จักโปรแกรม Shazam ที่เอาไว้ฟังเพลงแล้วให้มันบอกว่าเพลงนี้ชื่ออะไร ถ้าใครเคยลองจะรู้ว่ามันแม่นมาก (โดยเฉพาะเพลงภาษาอังกฤษ)

ทางเว็บไซต์ Gizmodo สงสัยว่ากระบวนการทำงานของ Shazam เป็นอย่างไร จึงไปขุดในเปเปอร์วิจัยของหนึ่งในผู้ก่อตั้ง Shazam ที่เผยแพร่ต่อสาธารณะ ขั้นตอนการทำงานมีดังนี้

  • Shazam จะสร้าง fingerprint ของเพลงเก็บไว้ในฐานข้อมูลของตัวเอง
  • ผู้ใช้เปิดเพลงให้ Shazam ฟังเป็นเวลา 10 วินาที
  • โปรแกรม Shazam คำนวณ fingerprint แล้วส่งไปเทียบกับฐานข้อมูล
  • ถ้าตรวจแล้วเจอก็ตอบชื่อเพลงกลับมายังผู้ใช้

ในบทความต้นฉบับยังมีรายละเอียดอื่นๆ เช่น หน้าตาของ fingerprint, วิธีการเก็บข้อมูล fingerprint (เก็บเป็น hash โดยใช้ความถี่เป็น first key), วิธีการคำนวณความใกล้เคียง ฯลฯ ใครสนใจเรื่อง data structure และการออกแบบระบบ สมควรอ่านอย่างยิ่ง

ที่มา - Gizmodo

Tags:

โจเซฟ ครูสกัล (Joseph Kruskal) ผู้คิดค้นอัลกอริทึมของครูสกัลที่ใช้ในการหาต้นไม้ทอดข้ามน้อยที่สุด (Minimum Spanning Tree) ได้เสียชีวิตแล้วเมื่อวันที่ 19 กันยายน 2010

ถ้าใครเรียนวิชาอัลกอริทึมมาคงจะคุ้นๆ กับชื่ออัลกอริทึมนี้อยู่บ้างเพราะมักถูกใช้เป็นตัวอย่างของอัลกอริทึมเชิงละโมบอยู่เสมอ

ที่มา - Computational Complexity

Tags:
Atom

ทีมวิจัยจากมหาวิทยาลัย Goethe และสถาบันเทคโนโลยี Karlsruhe ได้แสดงประสิทธิภาพของเครื่องที่ประกอบจากซีพียู Atom และไดรฟ์ SSD ประกอบเป็นระบบที่ชื่อว่า EcoSort สามารถทำประสิทธิภาพได้ถึงสามเท่าจากสถิติเดิม

สถิติใหม่นี้สามารถเรียงข้อมูลจำนวน 36,400 เรคคอร์ดต่อจูลส์ ขณะที่สถิติเดิมใช้ซีพียู Opteron สามารถทำได้เพียง 11,600 เรคคอร์ดต่อจูลส์เท่านั้น

สเปคเครื่องของ EcoSort ใช้ Atom 330 แรม 4GB และ SSD ขนาด 256GB ของ Super Talent Technology

แค่ SSD อย่างเดียวงานนี้ก็ลูกละสองหมื่นครับ

ปล. การทดสอบทำด้วยการรัน Sort Benchmark ที่คิดค้นโดย Jim Gray นักวิทยาศาสตร์ของไมโครซอฟท์ผู้สูญหายไปในการล่องทะเล

ที่มา - IT News

Tags:

SHA นั้นเป็นมาตรฐานการแฮช (hash) แบบทางเดียวที่ได้รับความนิยมในวงกว้าง และการแข่งขันเสนออัลกอลิธึ่มเพื่อจะได้รับการประกาศเป็นมาตรฐาน SHA-3 นั้นกำลังเข้าสู่รอบที่สอง

อัลกอลิธึ่มที่ผ่านเข้ารอบสองนั้นมีทั้งสิ้น 14 อัลกอลิธึ่ม โดยมีการเปิดความคิดเห็นจากรอบแรกให้ผู้ที่เสนออัลกอลิธึ่มเข้ามาสามารถปรับแก้กันได้ถึงวันที่ 15 กันยายนนี้ ก่อนจะตัดสินในรอบต่อไป

การแฮชแบบทางเดียวเป็นส่วนสำคัญในระบบการรักษาความปลอดภัยในทุกว้นนี้ โดยการเจาะการเข้ารหัสเว็บแบบ SSL ที่ทำได้เมื่อปลายปีที่แล้วนั้นก็อาศัยช่องโหว่ของ MD5 ซึ่งเป็นอัลกอลิธึ่มแฮชแบบทางเดียวแบบหนึ่ง (ที่ไม่ปลอดภัยนัก)

ที่มา - NIST

Tags:
Google

ปัจจุบันพนักงานเก่าๆตั้งแต่ก่อตั้ง Google เริ่มจะลาออกจากบริษัทมากขึ้นเรื่อยๆ และ Google เองก็กังวลว่าการลาออกของพนักงานระดับหัวกะทิจะส่งผลกระทบระยะยาวกับบริษัทได้
ทำให้ Google คิดค้น Algorithm ที่จะค้นหาพนักงานที่มีแนวโน้มจะลาออกจากบริษัทขึ้นมา

Google กล่าวว่า Algorithm นี้สามารถค้นหาได้ว่า ในพนักงาน 20,000 กว่าคน มีคนไหนที่มีแนวโน้มจะลาออกบ้าง. Google ยังไม่เปิดเผยสมการที่ใช้ แต่มีการเปิดเผยว่าปัจจุบันนี้สามารถค้นหาได้แล้วว่าพนักงานคนไหนมีแนวโน้มจะลาออกสูงและพนักงานคนไหนที่รู้สึกว่าตัวเองได้ทำงานน้อยกว่าที่คาดหวัง ซึ่งว่ากันว่าเป็นสาเหตุอันดับต้นๆของการที่พนักงานจะลาออก

HR ของ Google, Laszlo Bock กล่าวว่า "(Algorithm นี้) สามารถอ่านได้ลึกถึงในสมองของแต่ละคน ก่อนที่เค้าจะรู้ตัวว่าตัวเองจะลาออกด้วยซ้ำ"

ที่มา: DailyTech