Tags:
Topics: 
Node Thumbnail

แอปเปิลออกรายงานระบบรวบรวมข้อมูลจากผู้ใช้เพื่อเรียนรู้พฤติกรรมของผู้ใช้ในกลุ่มใหญ่ โดยไม่ต้องเปิดเผยข้อมูลผู้ใช้คนใดคนหนึ่ง แต่ยังทำให้ระบบสามารถเรียนรู้ข้อมูลเป็นกลุ่มได้ เช่น ข้อมูลอิโมจิยอดนิยม, คำใหม่ๆ ที่เพิ่งเกิดขึ้น, หรือรายงานเว็บมีพฤติกรรมผิดปกติ

ระบบเช่นนี้จะทำงานต่อเมื่อผู้ใช้เปิดตัวเลือกรายงานข้อมูลไปยังแอปเปิล หากปิดตัวเลือกการส่งข้อมูลไว้ก็จะไม่มีข้อมูลใดๆ ส่งกลับไปเลย

ระบบรายงานข้อมูลการใช้งานถูกแบ่งออกเป็นสองฝั่ง คือ ฝั่งอุปกรณ์และฝั่งเซิร์ฟเวอร์ ที่ฝั่งอุปกรณ์จะมีระบบ Privatization รับประกันว่าข้อมูลจะไม่มีข้อมูลส่วนตัวติดไปในระดับหนึ่ง ระบบนี้จะกักข้อมูลไว้ไม่ส่งไปยังเซิร์ฟเวอร์ทันที แต่จะแฮชข้อมูลเป็นชุดๆ (differentially private record) จากนั้นจึงสุ่มเลือกส่งข้อมูลบางชุดไปยังเซิร์ฟเวอร์

หลังจากนั้นจะส่งไปยังเซิร์ฟเวอร์ ที่ระบบ Ingestor โดยจะลบข้อมูลไอพีระหว่างการเก็บออกไป แล้วรวบรวมข้อมูลเพื่อวิเคราะห์

กระบวนการส่งข้อมูลจริงอาศัยอัลอริทึม Private Count Mean Sketch (CMS) สุ่มเลือกกระบวนการแฮชของข้อมูลที่ต้องการส่ง เช่น โดเมนเว็บ แล้วส่งข้อมูลค่าแฮชออกไปยังเซิร์ฟเวอร์ ฝั่งเซิร์ฟเวอร์ต้องรวบรวมข้อมูลแล้วคำนวณค่าแฮชของโดเมนเว็บหนึ่งๆ จากกระบวนการแฮชทุกแบบที่ไคลเอนต์เลือกได้ ข้อมูลที่ได้จะสามารถประมาณการปริมาณการเข้าใช้เว็บโดเมนหนึ่งๆ ได้ดีพอสมควร โดยไม่สามารถนับได้อย่างแม่นยำได้เลย เพราะค่าแฮชจากไคลเอนต์สามารถชนกันได้เสมอ

ที่มา - Apple

No Description

Get latest news from Blognone

Comments

By: agora
Windows
on 7 December 2017 - 20:37 #1022691

อั่นแน่ ตัวเองก็อยากได้ bigdata เหมือนกันซินะ
ข้อมูล มันมีราคาอย่างนี้นี่เอง

By: knott on 8 December 2017 - 00:35 #1022711

นับถือความพยายามของแอปเปิลที่แม้จะใช้ข้อมูลจากลูกค้า แต่ก็มีการปกป้องความเป็นส่วนตัวอย่างเชี่ยวชาญ

By: lew
FounderJusci's WriterMEconomicsAndroid
on 8 December 2017 - 00:53 #1022712 Reply to:1022711
lew's picture

กูเกิลก็ทำงานด้วยแนวคิดเดียวกันครับ แต่เทคนิคต่างออกไป


lewcpe.com, @wasonliw

By: spicydog
ContributoriPhoneAndroidUbuntu
on 18 January 2018 - 22:26 #1029224
spicydog's picture

หลักการการทำ Data anonymization ก็เป็นหัวข้อที่น่าเขียนดีนะครับ


SPICYDOG's Blog