By arjin Writer on Tag: Google Research, Google, Artificial Intelligence, Algorithm
Google Research

Google Research เผยแพร่งานวิจัย TurboQuant อัลกอริทึมบีบอัดข้อมูลที่ลดขนาดลงได้มาก มีเป้าหมายใช้สำหรับงานรับส่งข้อมูลสำหรับการประมวลผล AI โดยเฉพาะ

ในการประมวลผลข้อมูล AI นั้น Vector เป็นพื้นฐานที่โมเดลใช้ในการเชื่อมโยงข้อมูลต่าง ๆ ซึ่งมีขนาดใหญ่ขึ้นหากเป็นข้อมูลที่มีความซับซ้อนเช่นรูปภาพ แต่ก็ใช้งานหน่วยความจำมากขึ้นสำหรับการทำแคช อัลกอริทึม TurboQuant จึงถูกเสนอเพื่อลดขนาดข้อมูลสำคัญในระหว่างการประมวลผล Vector โดยไม่สูญเสียความถูกต้องและประสิทธิภาพการทำงานโดยรวม

By jaideejung007 Contributor on Tag: YouTube, Spam, Artificial Intelligence, Algorithm
YouTube

YouTube เริ่มมาตรการกวาดล้างคอนเทนต์คุณภาพต่ำครั้งใหญ่ที่สุดครั้งหนึ่ง โดยมุ่งเป้าไปที่วิดีโอที่ถูกสร้างขึ้นโดยปัญญาประดิษฐ์ในลักษณะสแปมหรือที่เรียกกันว่า AI Slop ซึ่งส่งผลให้ยอดวิวรวมบนแพลตฟอร์มหายไปทันทีกว่า 4.7 พันล้านวิว

รายงานระบุว่าการลบวิดีโอครั้งนี้ไม่ได้เกิดขึ้นแบบสุ่ม แต่เป็นการจัดการกับเครือข่ายช่องที่ใช้เครื่องมือ Generative AI ในการผลิตวิดีโอจำนวนมหาศาลออกมาในเวลาสั้นๆ (Mass-produce) เพื่อหวังผลในการโกงอัลกอริทึมและกวาดรายได้จากค่าโฆษณา โดยเนื้อหาเหล่านี้มักเป็นข้อมูลที่ไม่มีคุณภาพ ข่าวปลอม หรือเนื้อหาสำหรับเด็กที่สร้างขึ้นแบบลวกๆ

By boompw Contributor on Tag: YouTube, Algorithm, Digital Content
YouTube

รู้มั้ยว่า YouTube ไม่ได้มีแต่คลิปวิดีโอไวรัล หรือคอนเทนต์จากยูทูบเบอร์ดัง ๆ ระดับโลกเท่านั้น เพราะยังมีอีกด้านหนึ่งที่คนส่วนใหญ่แทบไม่เคยเห็น ซึ่งไม่ใช่เพราะมันเป็นความลับ หรือถูกซ่อนเอาไว้ แต่อัลกอริทึมของแพลตฟอร์มเลือกที่จะไม่แสดงมันให้เห็น

พูดแบบนี้ ครีเอเตอร์มือใหม่คงนอยด์แน่ ๆ แต่มันคือเรื่องจริงที่ระบบแนะนำของ YouTube ถูกออกแบบมาเพื่อดันวิดีโอที่กำลังเป็นกระแส หรือมีคนคลิกเยอะ ๆ พูดง่าย ๆ คือวิดีโอยอดนิยมจะถูกดันขึ้นมาด้านบนของฟีด ส่วนคลิปที่เหลือ ถูกจมอยู่ในเงามืด แทบไม่มีใครเคยดูเลย แม้จะเป็นส่วนใหญ่ของแพลตฟอร์มก็ตาม

By lew Founder on Tag: Mathematics, Algorithm, South Korea, Computer Science
Mathematics

ทีมวิจัยจากมหาวิทยาลัย Waterloo ประกาศความสำเร็จในการแก้ปัญหา traveling salesman (TSP) ด้วยโจทย์ว่าต้องคำนวณหาระยะทางระหว่างบาร์ต่างๆ ในเกาหลีใต้ แล้ววางแผนการเดินทางให้สั้นที่สุดเท่าที่เป็นไปได้ ความยากของโจทย์นี้อยู่ที่จำนวนบาร์ในเกาหลีใต้มีมากถึง 81,998 แห่ง นับเป็นปัญหา TSP ใหญ่ที่สุดที่เคยแก้จนถึงระดับที่ออปติไมซ์ที่สุด

By lew Founder on Tag: Algorithm, Computer Science, Research, Mathematics
Algorithm

ทีมวิจัยระดับปริญญาตรีนำเสนอโครงสร้างข้อมูลแบบใหม่เพื่อปรับปรุงโครงสร้างข้อมูล open-addressing hash table หรือโครงสร้างแฮชที่เก็บข้อมูลในตารางแฮชโดยตรง โดยสามารถสร้างอัลกอริทึมที่เร็วกว่า การคาดคะเนของ Andrew Yao ที่วางข้อจำกัดความเร็วของปัญหาแบบนี้ไว้ตั้งแต่ปี 1985

By mk Founder on Tag: Donald E. Knuth, Computer Science, Algorithm, Stanford
Donald E. Knuth

Donald E. Knuth ปรมาจารย์แห่งวงการคอมพิวเตอร์ และผู้เขียนหนังสือชุด The Art of Computer Programming (ที่ปัจจุบันยังเขียนไม่จบ!) มีธรรมเนียมจะออกมาบรรยาย Christmas Lecture ให้นักศึกษาที่มหาวิทยาลัยสแตนฟอร์ดในช่วงเดือนธันวาคมของทุกปี ซึ่งเขาบรรยายแบบนี้ติดต่อกันมา 30 ปีแล้ว (มีเว้นไปช่วงปี 2020-2021 จากสถานการณ์โควิด)

By lew Founder on Tag: PostgreSQL, Algorithm, Database, Elasticsearch
PostgreSQL

ParadeDB ผู้สร้างดิสโทรของ PostgreSQL เปิดส่วนขยาย pg_bm25 สำหรับการสร้าง search engine ด้วย PostgreSQL โดยมีเป้าหมายคือการทดแทน Elasticsearch

pg_bm25 อาศัยการสร้าง index แบบ BM25 ที่สามารถหาเอกสารโดยไม่ได้เรียงลำดับแค่พบคำค้นหาเท่านั้น แต่ให้คะแนนจำนวนครั้งที่พบคำค้น, ให้ความสำคัญกับคำที่พบได้น้อยเป็นพิเศษ, ให้ความสำคัญกับเอกสารที่สั้นกว่า โดย Elasticsearch เองก็ใช้ BM25 ในการค้นเอกสารเช่นกัน

By Methasit Tubtim Contributor on Tag: Instagram, Algorithm, Meta
Instagram

จากการสืบสวนร่วมกันโดย The Wall Street Journal และนักวิชาการที่ Stanford University และ University of Massachusetts Amherst พบว่าระบบแนะนำบัญชีของ Instagram มีส่วนช่วยโปรโมทให้เครือข่ายกลุ่มคนใคร่เด็ก (pedophile) ด้วยการเชื่อมโยงคนที่ชอบคอนเทนต์ลักษณะนี้ ให้ไปเจอกับกลุ่มผู้ขายคอนเทนต์

By lew Founder on Tag: DeepMind, Programming, Algorithm, Artificial Intelligence
DeepMind

DeepMind เปิดตัว AlphaDev ปัญญาประดิษฐ์พัฒนาโปรแกรมที่ไม่ใช่แค่การเขียนโปรแกรมธรรมดา แต่สามารถออปติไมซ์โปรแกรมจนเกินกว่าที่คนทั่วไปเขียนได้ ในกรณีนี้ทาง DeepMind ใช้ AlphaDev สร้างฟังก์ชั่น sort สำหรับเรียงลำดับข้อมูลที่มีการพัฒนากันมานาน

By lew Founder on Tag: Cloudflare, Algorithm
Cloudflare

Cloudflare ปล่อยโค้ด pingora-limits ตัวนับอีเวนต์ (event) ในพรอกซี่ Pingora ที่ Cloudflare พัฒนาชึ้นมาใช้งานแทน NGINX โดยตัวเซิร์ฟเวอร์ต้องนับสถิติต่างๆ โดยยังต้องมีประสิทธิภาพสูง ไม่ทำให้บริการโดยรวมช้าลง

Pingora ต้องนับสถิติจากอีเวนต์ต่างๆ ถึง 20 ล้านครั้งต่อวินาที เช่น มีเหตุเซิร์ฟเวอร์ไม่ตอบสนอง เกินจำนวนครั้งที่กำหนดก็ต้องตัดเซิร์ฟเวอร์ตัวนั้นออก โดยตัวนับนี้มีเงื่อนไขว่าต้องรองรับการทำงานแบบขนานอย่างหนัก และขณะที่กำลังเพิ่มค่าที่นับไม่ต้องล็อกหน่วยความจำไปทั้งหมด ไม่เช่นนั้นจะกลายเป็นคอขวดของระบบ

By mk Founder on Tag: Twitter, Elon Musk, Open Source, Algorithm
Twitter

หลังจาก Twitter เปิดซอร์สโค้ดอัลกอริทึมของตัวเองขึ้น GitHub เมื่อสัปดาห์ที่แล้ว ก็มีคนแกะโค้ดดูอย่างรวดเร็วว่าการทำงานของ Twitter ในยุค Elon เป็นอย่างไร

สิ่งที่น่าสนใจที่สุดคงเป็นการแยกประเภทของผู้ใช้งานตามมุมมองทางการเมือง (ในสหรัฐ) มีผู้ใช้ 4 กลุ่ม ได้แก่ตัว Elon เอง (author_is_elon), กลุ่มผู้ใช้ระดับสูง (power_user), พรรคเดโมแครต (democrat) และพรรครีพับลิกัน (republican) ซึ่งจะได้รับการปฏิบัติที่แตกต่างกัน มีฟีเจอร์แตกต่างกันไป (ลิงก์ไปดูโค้ดส่วนนี้)

กรณีของ Elon นั้นจะมีการเก็บสถิติด้วยว่าข้อความของเขาถูกมองเห็นมากแค่ไหน ซึ่งตรงตามข่าวหลุดก่อนหน้านี้ ว่า Elon ไม่พอใจที่ข้อความของเขามีคนเห็นน้อยกว่าที่คาด

By lew Founder on Tag: Person, Israel, Algorithm, Death
Person

Jacob Ziv ผู้ร่วมพัฒนาอัลกอริทึม LZ ร่วมกับ Abraham Lempel เสียชีวิตเมื่อวันเสาร์ที่ผ่านมาด้วยวัย 91 ปี Lempel เพิ่งเสียชีวิตเมื่อเดือนกุมภาพันธ์ที่ผ่านมาด้วยวัย 86 ปี

Lempel และ Ziv พัฒนาอัลกอริทึม LZ77 และตีพิมพ์ลงวารสาร IEEE Transactions on Information Theory เมื่อปี 1977 หลังจากนั้น LZ77 กลายเป็นต้นตระกูลของอัลกอริทึมบีบอัดข้อมูลแบบได้ข้อมูลคงเดิม (lossless compression) จำนวนมาก

By arjin Writer on Tag: Facebook, Meta, News Feed, Algorithm, Advertising
Facebook

Meta ประกาศอัพเดตฟีเจอร์ Facebook ที่อธิบายว่า "Why am I seeing this ad?" หรือ "ทำไมฉันจึงเห็นโฆษณานี้" ซึ่งเป็นฟีเจอร์ที่มีมาตั้งแต่ปี 2014 อยู่ที่ปุ่มด้านบนขวาของส่วนโฆษณาที่แสดง เพื่ออธิบายกับผู้ใช้งาน ว่าทำไม Facebook จึงแสดงโฆษณานี้ขึ้นมาจากปัจจัยต่าง ๆ อายุ เมือง ภาษา ความสนใจ

โดยเครื่องมือที่อัพเดตใหม่นี้ จะแสดงข้อมูลแบบสรุปด้วย Machine Learning ทั้งกิจกรรมใน Facebook และกิจกรรมที่เกิดนอก Facebook เช่นการเข้าชมเว็บไซต์ ว่าทำไมโฆษณานี้จึงถูกนำมาแสดง แยกรายละเอียดระดับฝั่งผู้ลงโฆษณา จนถึงกิจกรรมฝั่งผู้ใช้งานที่ตรงกับความต้องการผู้ลงโฆษณา (ดูตัวอย่างท้ายข่าว)

By lew Founder on Tag: Google, Algorithm, Open Source, Programming
Google

กูเกิลโอเพนซอร์สไลบรารีเรียงลำดับข้อมูล (sorting) ที่ใช้ชุดคำสั่งแบบเวคเตอร์ในซีพียู ทำให้ไลบรารีทำงานได้เร็วขึ้น 9-19 เท่าตัวเมื่อเทียบกับ std::sort ในภาษา C++

By lew Founder on Tag: Go, Programming, Algorithm
Go

ภาษา Go เตรียมเปลี่ยนฟังก์ชั่น sort จากเดิมใช้ QuickSort มาเป็น pdqsort หรือ pattern-defeating quicksort อัลกอริทึมเรียงลำดับที่ประสิทธิภาพโดยรวมดีขึ้นมากในหลายกรณี แม้ว่ากรณีที่แย่ที่สุดยังเป็น O(n log n) เช่นเดิมก็ตาม

By sunnywalker Writer on Tag: Instagram, Algorithm
Instagram

Instagram ออกมายืนยันแล้วว่ากำลังพัฒนา Favorites ที่ผู้ใช้งานสามารถเลือกบัญชีที่อยากเห็นบนหน้าฟีดบ่อยๆ ได้ ซึ่งเป็นฟีเจอร์ที่ Facebook มีแล้วเช่นกัน โดยใน Facebook สามารถเลือกได้มากสุด 30 บัญชี ส่วน Instagram นั้นยังไม่ชัดเจนว่าเลือกได้กี่บัญชี

By arjin Writer on Tag: Instagram, Social Network, Algorithm
Instagram

Adam Mosseri หัวหน้าทีมของ Instagram เขียนบล็อกอธิบายรายละเอียดเพิ่มเติม เพื่อให้เข้าใจการทำงานของอัลกอริทึมคัดเลือกเนื้อหาขึ้นมาแสดง สำหรับผู้ใช้งานแต่ละคน ซึ่ง Instagram ได้เปลี่ยนระบบฟีดนี้มาตั้งแต่ 5 ปีที่แล้ว เคยอธิบายหลักการคัดเลือกเนื้อหามาครั้งหนึ่ง แต่รอบนี้ลงรายละเอียดที่มากขึ้น

By arjin Writer on Tag: ByteDance, Algorithm
ByteDance

ByteDance เจ้าของแอป TikTok เปิดตัวบริการใหม่ Volcano Engine เป็นเครื่องมือที่นำอัลกอริทึมมาคัดเลือกเนื้อหาแนะนำเฉพาะบุคคล สำหรับให้ลูกค้าองค์กรนำใช้งานปรับแต่งเอง ซึ่งถือเป็นครั้งแรกที่ ByteDance มีผลิตภัณฑ์ที่เจาะกลุ่มลูกค้าองค์กรโดยเฉพาะ

อัลกอริทึมในการคัดเลือกเนื้อหามาแสดงของ Bytedance นั้น เชื่อว่าเป็นปัจจัยที่สำคัญของความสำเร็จแอป TikTok ในระดับโลก เช่นเดียวกับที่เทคโนโลยีนี้ถูกใช้ในแอป Douyin หรือ TikTok จีน และแอปอ่านข่าวยอดนิยมในจีน Toutiao

By sunnywalker Writer on Tag: Instagram, Palestine, Algorithm, Social Media, Politics
Instagram

Instagram เผยกับ Financial Times ว่า กำลังปรับปรุงอัลกอริทึมใน Stories ให้แสดงเนื้อหาที่อยู่ในสถานการณ์ปัจจุบันมากขึ้น หลังพนักงาน Instagram ร่วม 50 คนแสดงความกังวลว่าผู้ใช้งานมองไม่เห็นเนื้อหาสนับสนุนชาวปาเลสไตน์

โฆษก Instagram ระบุว่า ตอนนี้แพลตฟอร์มกำลังจัดอันดับการแสดงเนื้อหาให้เท่าเทียมกันทั้งเนื้อหาออริจินัล และเนื้อหาที่คนนำไปโพสต์ใหม่ ซึ่งจะช่วยให้โพสต์อิงกับสถานการณ์ด่วนถูกพบเจอมากขึ้น ซึ่งขณะนี้มีผู้ใช้ที่แชร์โพสต์เกี่ยวกับความขัดแย้งล่าสุดในฉนวนกาซาเพิ่มขึ้น แต่วิธีการตั้งค่าแอปของ Instagram ในปัจจุบันมีผลกระทบต่อจำนวนคนที่เห็นโพสต์มากกว่าที่คาดไว้

By sunnywalker Writer on Tag: Facebook, News Feed, Algorithm, Politics
Facebook

Facebook ประกาศทดสอบความเห็นผู้ใช้งานทั่วโลก เกี่ยวกับความรู้สึกเวลาเห็นโพสต์ใดๆ บนหน้าฟีด ซึ่ง Facebook จะนำผลสำรวจไปปรับอัลกอริทึมการแสดงเนื้อหาใหม่ โดย Facebook จะให้ตอบแบบสอบถามด้านล่างโพสต์ว่าคุณรู้สึกอย่างไรกับโพสต์นี้ โพสต์นี้สร้างแรงบันดาลใจหรือไม่ ในระดับใด

Subscribe to Algorithm