Tags:
Node Thumbnail

ระบบดาวเทียมนำทาง Galileo ของสหภาพยุโรปล่มทั้งระบบตั้งแต่วันศุกร์ที่ผ่านมาหลังจากมีปัญหากับ "โครงสร้างพื้นฐานภาคพื้นดิน"

แหล่งข่าวไม่เปิดเผยตัวตน ระบุกับ BBC ว่าโครงสร้างที่เป็นต้นเหตุคือ ฐานปรับเวลาความแม่นยำสูงในอิตาลี

Galileo เพิ่งยิงครบเครือข่ายเมื่อปีที่แล้ว แต่ยังเปิดใช้งานไม่ครบ โดยตอนนี้มีดาวเทียมทำงานอยู่ 22 ดวง และทั้งโครงการยังอยู่ในช่วง "ทดสอบการทำงาน" ทำให้ยังไม่มีระบบใดพึ่งพา Galileo เต็มตัว และอุปกรณ์ส่วนมากที่รองรับก็มักรองรับระบบดาวเทียมนำทางอื่นๆ เช่น GPS หรือ Glonass ไปพร้อมกัน

Tags:
Node Thumbnail

Twitter ล่มทั่วโลกตั้งแต่ช่วงเวลาเกือบตีสองตามเวลาประเทศไทย โดยผลตรวจสอบพบว่าการล่มนี้เป็นแทบทั้งโลก

เว็บ downdetector.com รายงานเหตุล่มพบว่ากระจายไปตามประเทศที่ใช้งานทวิตเตอร์สูงๆ เช่น สหรัฐฯ, ยุโรป, ญี่ปุ่น, อินเดีย, และบราซิล

ระหว่างล่มผมพบว่า ไม่สามารถโหลดทวีตใหม่ได้ จากนั้นบัญชีถูกล็อกเอาท์เอง และเมื่อพยายามล็อกอินกลับเข้าไปก็พบหน้ารายงานปัญหา

ตั้งแต่ต้นเดือนที่ผ่านมา บริการสำคัญๆ ล่มในเดือนนี้ ได้แก่ Cloudflare, Facebook, และ iCloud

Tags:
Node Thumbnail

บริการ iCloud ของแอปเปิลล่มไปบางส่วน ทำให้บริการหลัก เช่น Drive, Keychain, Mail. Notes ล้วนใช้งานไม่ได้ นอกจากนี้บริการนอกกลุ่ม iCloud บางส่วนก็ได้รับผลกระทบไปด้วย เช่น Apple Pay ไม่สามารถแก้ไขข้อมูลบัตรได้, หรือบริการ Find My ไม่สามารถหาตำแหน่งเครื่องได้เลย

บริการกลุ่มอื่น หลักๆ ยังใช้งานได้ เช่น App Store, iTunes, iMessage

นอกจากบริการส่วนที่เกี่ยวข้องกับผู้ใช้โดยตรงแล้ว ยังมีรายงานว่าปัญหาครั้งนี้กระทบไปถึงร้าน Apple Store ตัวร้านไม่สามารถให้บริการได้ตามปกติ ผู้ใช้รายหนึ่งไม่สามารถส่งสินค้าซ่อมได้

ที่มา - MacRumors

Tags:
Node Thumbnail

ช่วงค่ำที่ผ่านมาเฟซบุ๊กและเว็บในเครือ รวมถึง Messenger และ Instagram มีปัญหาภาพโหลดไม่ขึ้นเป็นวงกว้าง ตอนนี้สองบริการหลักคือเฟซบุ๊กและอินสตาแกรมก็ออกมาประกาศผ่านทวิตเตอร์ว่าทราบปัญหาแล้ว กำลังดำเนินการแก้ไข

เมื่อเดือนมีนาคมที่ผ่านมา ตอนที่เฟซบุ๊กล่มทั้งหมดไปช่วงหนึ่ง ทางเฟซบุ๊กก็ประกาศผ่านทวิตเตอร์เช่นเดียวกัน

เกร็ดเล็กๆ อย่างหนึ่งคือเฟซบุ๊กนั้นจะวิเคราะห์ทุกภาพที่เราอัพโหลดไว้เสมอ และใส่ไว้ในฟิลด์ alt ใน HTML ทำให้เมื่อภาพโหลดไม่ขึ้น เราจะเห็นข้อความว่าเฟซบุ๊กเห็นภาพเราเป็นอะไร เช่น ข้อความ, หน้าคน ฯลฯ

Tags:
Node Thumbnail

Cloudflare เขียนบล็อคชี้แจงเหตุล่มเป็นเวลา 30 นาทีเมื่อวานนี้ โดยระบุว่าไม่ได้เกิดจากการถูก DDoS อย่างที่หลายคนคาดกัน แต่เป็นเพราะคอนฟิกไฟร์วอลล์ของบริษัทเอง และบริษัทขออภัยกับความผิดพลาดนี้

โดยไฟร์วอลล์นี้ อยู่ใน Cloudflare Web Application Firewall (WAF) กฎชุดใหม่ใช้ค้นหาโค้ดจาวาคริปต์ในการโจมตี โดยเขียนด้วย regular expression แต่กลับมีบั๊กทำให้เมื่อนำโค้ดไปใช้งานจริงแล้วซีพียูเต็มร้อยตลอดเวลา

20 นาทีหลังเกิดปัญหา วิศวกรของ Cloudflare รู้ว่าปัญหาเกิดจาก WAF จึงสั่งปิดการทำงาน หลังจากนั้นใช้เวลาค้นหากฎต้นปัญหา และเปิดการทำงาน WAF ใหม่อีกครั้งในอีก 50 นาทีต่อมา

Tags:
Node Thumbnail

ช่วงหัวค่ำประมาณสองทุ่มตามเวลาประเทศไทย Cloudflare ล่มเป็นวงกว้างกระทบเครือข่ายในหลายประเทศรวมถึงประเทศไทย รวมระยะเวลา 30 นาที

ทาง Cloudflare แจ้งสาเหตุว่าระดับซีพียูในเซิร์ฟเวอร์เกิดพุ่งสูงจนเครื่องเริ่มกระบวนการ fail over

การแก้ไขในตอนนี้ทาง Cloudflare ได้ปิดโปรเซสที่กินซีพียูออกไปก่อน และมอนิเตอร์ความผิดปกติของเครื่องเพิ่มเติม

ผลกระทบจากปัญหาครั้งนี้ทำให้บริการ Cloudflare Analytics ไม่ทำงาน, Cloudflare Logs ทำงานช้ากว่าปกติทำให้ผู้ใช้ได้รับข้อมูลย้อนหลัง

ที่มา - Cloudflare

Tags:
Node Thumbnail

Michele Bullock ผู้ช่วยผู้ว่า Reserve Bank of Australia (RBA - ธนาคารกลางออสเตรเลีย) ขึ้นพูดในงาน Central Bank Payments Conference ที่เบอร์ลินเมื่อวานนี้ โดยพูดถึงความเปลี่ยนแปลงในช่วงหลัง โดยมีประเด็นสำคัญคือความทนทานของระบบชำระในออสเตรเลียที่มีปัญหาขึ้นมาก

อัตราการล่มโดยรวมในปี 2018 ของออสเตรเลียสูงถึง 1,838 ชั่วโมง เทียบกับปี 2017 ที่ล่มรวมเพียง 824 ชั่วโมง โดยจำนวนครั้งที่ล่มเพิ่มขึ้นเป็น 295 ครั้ง จาก 210 ครั้ง และแต่ละครั้งล่มนานเฉลี่ย 6.2 ชั่วโมง จาก 3.9 ชั่วโมง

Tags:
Node Thumbnail

เมื่อช่วงหัวค่ำที่ผ่านมา Cloudflare ผู้ให้บริการ CDN รายใหญ่มีปัญหาเครือข่าย และพบภายหลังว่าเป็นปัญหา BGP route leak จากผู้ให้บริการายอื่น

แม้แถลงของ Cloudflare จะไม่พูดว่าเป็นบริษัทใด แต่ทวิตเตอร์ของ Matthew Prince ซีอีโอ Cloudflare กลับระบุชื่อบริษัท Verizon และ Noction โดยคาดว่า Noction เป็นผู้ปล่อยเราท์ผิดพลาด และ Verizon ก็รับเราท์เหล่านั้นทำให้ผู้ใช้อินเทอร์เน็ตเข้าถึง Cloudflare ไม่ได้

Tags:
Node Thumbnail

Salesforce บริการ CRM แบบ software-as-a-service (SaaS) คอนฟิกระบบพลาด ทำให้ผู้ใช้ทุกคนในระบบได้รับสิทธิ์ผู้ดูแลระบบขององค์กร สามารถอ่านและเขียนข้อมูลได้ทั้งระบบ

หลังจากความผิดพลาดนี้ถูกแจ้งไปยัง Salesforce ระยะหนึ่ง ทางบริษัทก็ตัดสินใจปิดระบบในโซนที่ได้รับผลกระทบซึ่งส่วนมากเป็นโหนดในสหรัฐฯ และยุโรป (รายชื่อโหนดทั้งหมดอยู่ในรายงานของ Saleforces) ทำให้องค์กรที่เชื่อมต่ออยู่ถูกตัดขาดใช้งานไม่ได้โดยสมบูรณ์

ปัญหาเริ่มมาตั้งแต่ช่วงเที่ยงคืนที่ผ่านมาจนถึงบ่ายสามตามเวลาประเทศไทยวันนี้ รวมระยะเวลาระบบใช้งานไม่ได้ 15 ชั่วโมง 8 นาที

Tags:
Node Thumbnail

เหตุธนาคารล่มกระทบต่อผู้ใช้ในวงกว้างไม่ได้เป็นปัญหาที่จำกัดเฉพาะในประเทศไทย แม้แต่ประเทศที่เจริญแล้วอย่างอังกฤษก็มีปัญหาอยู่เรื่อยๆ อย่างไรก็ดีท่าทีของหน่วยงานกำกับดูแลนั้นต่างกันไป เหตุใกล้ประเทศไทยสักหน่อยคือ Monetary Authority of Singapore (MAS) หรือหน่วยงานกำกับดูแลของสิงคโปร์ที่มีท่าทีรุนแรงต่อการล่ม โดยเมื่อ 8 ปีที่แล้วในวันที่ 13 กันยายน 2011 ปัญหาเน็ตเวิร์คทำให้ระบบทั้งหมดของธนาคาร OCBC ล่มตั้งแต่เก้าโมงเช้าจนถึงบ่ายโมงสิบห้านาที รวมประมาณ 4 ชั่วโมง

Tags:
Node Thumbnail

สัปดาห์นี้เหตุการณ์ล่มของธนาคารทหารไทย หรือ TMB นับว่าหนักว่าเหตุการณ์ล่มของธนาคารไทยครั้งอื่นๆ เพราะล่มแม้แต่คอลเซ็นเตอร์ 1558 และเว็บหลักของธนาคาร ทำให้ไ่ม่เหลือช่องทางติดต่อธนาคารนอกจากสาขาเลย โดยทางธนาคารชี้แจงสาเหตุว่า "รถบรรทุกชนสายอุปกรณ์เครือข่าย"

Tags:
Node Thumbnail

หลังจากธนาคารทหารไทยหรือ TMB ระบบล่มทั้งหมดตั้งแต่เมื่อคืนที่ผ่านมา ตอนนี้ธนาคารออกมาชี้แจงว่าเกิดจาก "อุบัติเหตุระหว่างการย้ายงานไปยังศูนย์คอมพิวเตอร์แห่งใหม่" และตอนนี้ให้บริการจากศูนย์ข้อมูลสำรองที่ให้บริการได้เพียงบางส่วน สำหรับการทำธุรกรรม ทาง TMB ระบุว่าใช้งานตู้เอทีเอ็มได้ทั้งของ TMB เองและผ่านธนาคารอื่น

ผมสำรวจล่าสุดเว็บไซต์หลักธนาคารคือ tmbbank.com นั้นเข้าใช้งานได้แล้ว แต่เว็บธนาคารออนไลน์ tmbdirect.com ยังเข้าไม่ได้

Tags:
Node Thumbnail

ตั้งแต่วันเสาร์ที่ผ่านมา ระบบออนไลน์ของ KTC ล่มทั้งการใช้บัตรและแอป ทำให้ผู้ใช้ไม่สามารถสั่งจ่าย หรือเช็คยอดการใช้งานได้

ระหว่างช่วงเวลาที่ล่ม ธนาคารแจ้งว่าระบบกลับมาใช้ได้ เช่น เมื่อวานนี้ แต่ก็ "ลบโพส" ออกไป และโพสใหม่ว่าใช้ได้อีกครั้ง แต่ทั้งนั้นแอป KTC Mobile ก็ยังใช้งานไม่ได้

ที่มา - @Ktc Real Privileges

Tags:
Node Thumbnail

หลังจากเมื่อวานนี้แอป NEXT ของธนาคารกรุงไทยมีปัญหาตั้งแต่ช่วงเช้า ต่อเนื่องมาจนถึงวันนี้ เมื่อช่วงหัวค่ำที่ผ่านมา ทางธนาคารกรุงไทยก็มีแถลงว่าจะเพิ่มประสิทธิภาพแอปโดยเร็ว

แถลงการณ์ระบุว่าแอป NEXT ยังสามารถใช้บริการได้ตามปกติ แต่บางช่วงเวลาที่ลูกค้าใช้มาก แล้วจะเกิดการ error โดยแนะนำให้รอสักครู่แล้วทำรายการใหม่

หลังจากแถลงการณ์นี้ ทางธนาคารกรุงไทยก็ประกาศปิดแอป ตั้งแต่ห้าทุ่มวันนี้ถึงตีสองเพื่อปรับปรุงประสิทธิภาพของระบบ

Tags:
Node Thumbnail

เช้าวันนี้แอป NEXT ของธนาคารกรุงไทยล่มอีกครั้ง โดยหากผู้ใช้เข้าใช้งานจะเข้าแอปได้ แต่ไม่สามารถเช็คยอดเงินหรือทำรายการโอนได้ โดยขึ้นข้อความ "ขออภัย! พบข้อผิดพลาดในการติดต่อระบบงาน กรุณาทำรายการในภายหลัง (UNEXPECTED_ERROR)

ทางธนาคารกรุงไทยแจ้งว่ากำลังดำเนินการแก้ไข

ที่มา - @Krungthai_Care

Tags:
Node Thumbnail

สัปดาห์นี้ดูเหมือนอะไรก็ไม่ค่อยสดใสนัก เริ่มตั้งแต่ Gmail และ Google Drive ล่มเมื่อวันพุธ จากนั้น Facebook ก็พบปัญหาในวันถัดมา ล่าสุดเมื่อคืนที่ผ่านมาบริการ iCloud ของแอปเปิลก็พบปัญหาการใช้งานเช่นกัน กระทบกับผู้ใช้งานจำนวนหนึ่ง

ในหน้ารายงานสถานะระบบนั้นระบุว่าปัญหาเริ่มต้นตั้งแต่ 22:00น. ของวันที่ 14 มีนาคม 2019 ตามเวลาในไทย และระบบกลับเป็นปกติตั้งแต่ 2:28น. โดยบริการที่ได้รับผลกระทบมีทั้ง iCloud Drive, Mail, Calendar, Notes, Keychain, Reminders, iWork, Photos, Find My Friends, Find My iPhone ฯลฯ

Tags:
Node Thumbnail

เฟซบุ๊กทวีตถึงสาเหตุที่บริการมีปัญหาตั้งแต่เมื่อคืนที่ผ่านมา และต่อเนื่องมาจนทั้งวัน โดยระบุสาเหตุว่าเกิดจากการ "เปลี่ยนคอนฟิกเซิร์ฟเวอร์" และตอนนี้ได้แก้ปัญหาเรียบร้อยแล้ว

ตอนนี้ผมสำรวจดูพบว่าบริการกลับมาเป็นปกติเกือบทั้งหมดแล้ว โดยสังเกตเห็นคำเตือนที่ยังอยู่ช่วงบ่ายที่ผ่านมา เช่น Facebook Ads Manager ที่ระบุว่าอยู่ระหว่างกู้ระบบ

ไตรมาสสามปี 2018 เฟซบุ๊กมีรายได้ 6,882 ล้านดอลลาร์สหรัฐฯ หรือวันละ 76.4 ล้านดอลลาร์ การที่ระบบมีปัญหาแทบทั้งวันเช่นนี้ หากคิดความสูญเสียรายได้คงประมาณรายได้ทั้งปีของบริษัทขนาดกลางในไทยเลยทีเดียว

Tags:
Node Thumbnail

GitHub รายงานเหตุการณ์เว็บล่มเมื่อวันที่ 22 ตุลาคมที่ผ่านมา พร้อมกับระบุถึงบทเรียนที่ได้จากการล่มครั้งนี้

เรื่องทั้งหมดเริ่มจากการบำรุงรักษาอุปกรณ์ไฟเบอร์ 100G ที่เริ่มทำงานไม่เต็มประสิทธิภาพ โดยการเปลี่ยนอุปกรณ์ทำให้เน็ตเวิร์คที่เชื่อมระหว่างศูนย์ข้อมูลหลัก คือฝั่งตะวันตก (US West) และฝั่งตะวันออก (US East) ดับไปเป็นเวลา 43 วินาที

Tags:
Node Thumbnail

Visa มีปัญหาประมวลผลการจ่ายเงินไม่ได้ทั่วยุโรปและสหราชอาณาจักร ทำให้เกิดวิกฤติเล็กๆ เนื่องจากร้านขายของชำ, ปั๊มน้ำมัน, และทางพิเศษที่จ่ายค่าบริการด้วยบัตรเครดิต กลับไม่สามารถใช้งานได้

ร้านค้าบางร้านต้องประกาศงดรับบัตรเครดิตชั่วคราว บางร้านประกาศรับเฉพาะ MasterCard และ Amex

ผู้ให้บริการเกตเวย์อย่าง Paymentsense และธนาคารผู้ออกบัตรอย่าง HSBC พูดตรงกันว่าปัญหากำลังคลี่คลาย โดย Visa เริ่มประมวลผลการจ่ายเงินได้แล้ว แต่ระหว่างนี้ยังมีรายการค้างในระบบอยู่จำนวนหนึ่ง ทำให้ระบบยังคงหนาแน่นต่อไป

รายงานเป็นทางการล่าสุดจากทวิตเตอร์ของ Visa ยุโรป คือประกาศว่ากำลังแก้ปัญหาเมื่อห้าชั่วโมงที่ผ่านมา

Tags:
Node Thumbnail

Verelox บริษัทโฮสติ้งในเนเธอร์แลนด์ออกมาประกาศฐานข้อมูลถูกอดีตแอดมินลบไปทั้งหมด ทำให้เซิร์ฟเวอร์ใน 3 ประเทศได้แก่ เนเธอร์แลนด์, ฝรั่งเศส, และแคนาดา ไม่สามารถใช้งานได้ โดยตอนนี้อยู่ระหว่างการกู้ข้อมูล และสามารถกู้มาได้แล้วสองศูนย์

ข้อมูลของลูกค้าจำนวนมากสูญหายไปจากการลบข้อมูลของแอดมิน ยกเว้นข้อมูลที่เก็บไว้ใน SSD แยกออกไป และ IPv6 ยังคงใช้งานไม่ได้

ก่อนหน้านี้หนึ่งสัปดาห์ก็มีรายงานโปรแกรมเมอร์ทำฐานข้อมูลของบริษัทหายไป คงเป็นบทเรียนว่าบริษัทไม่ควรวางใจพนักงานคนใดคนหนึ่ง อย่างน้อยที่สุดก็ควรมีระบบสำรองข้อมูลที่แข็งแกร่ง

Tags:
Node Thumbnail

เซิร์ฟเวอร์ของ British Airways ล่มขนานใหญ่กระทบผู้โดยสารถึง 75,000 คนแล้วในตอนนี้ หนังสือพิมพ์ The Times ก็อ้างแหล่งข่าวภายในระบุว่าสาเหตุเกิดจากเจ้าหน้าที่ที่เข้าไปบำรุงรักษาศูนย์ข้อมูลของสายการบิน สับสวิตช์ปิดระบบจ่ายไฟโดยไม่ตั้งใจ

ก่อนหน้านี้ Alex Cruz ระบบในวิดีโอชี้แจงว่าปัญหาของเซิร์ฟเวอร์ล่มมาจากปัญหาระบบจ่ายไฟ แต่จากแหล่งข่าวของ The Times ตอนนี้การสอบสวนมุ่งไปที่ความผิดพลาดของมนุษย์มากกว่าอุปกรณ์

ที่มา - Strait Times

Tags:
Node Thumbnail

สายการบิน British Airways ประสบปัญหาเซิร์ฟเวอร์ล่มขนานใหญ่ทำให้ต้องยกเลิกเที่ยวบินจำนวนมาก โดยเฉพาะเที่ยวบินที่บินออกจากสนามบิน Heathrow และสนามบิน Gatwick ของวันเสาร์ที่ผ่านมา (เวลาอังกฤษ) ขณะที่เที่ยวบินที่ลงจอดยังคงลงจอดได้แต่ก็เกิดความล่าช้า

ระหว่างนี้ทางสายการบินออกประกาศขอร้องให้ผู้โดยสารอย่าไปสนามบิน ยกเว้นว่าจะได้รับคำยืนยันว่าเที่ยวบินของดนสามารถขึ้นบินได้ตามตาราง

สาเหตุของระบบล่มครั้งนี้เกิดจากปัญหา power supply โดย Alex Cruz ซีอีโอของสายการบินระบุว่าไม่มีหลักฐานว่าเป็นการโจมตีไซเบอร์แต่อย่างใด

ที่มา - The Guardian

Tags:
Node Thumbnail

ปัญหา AWS S3 ในโซน US-EAST-1 ล่มเมื่อต้นเดือนที่ผ่านมา พาบริการสำคัญๆ ล่มตามไปด้วยจำนวนมาก ตอนนี้ทีมงาน AWS ก็ออกมาชี้แจงปัญหาที่เกิดขึ้นแล้ว

รายงานระบุว่าทีมงานกำลังแก้ปัญหาระบบ billing อัพเดตช้ากว่าที่ควรจะเป็นโดยการถอดเครื่องบางส่วนออกจากระบบ billing แต่การสั่งสคริปต์ผิดพลาดทำให้ถอดเครื่องในระบบ index (สำหรับการดึงข้อมูลและลบข้อมูล) และระบบ placement (สำหรับการ PUT ข้อมูล) ออกไปเป็นจำนวนมาก

Tags:
Node Thumbnail

เมื่อเซิร์ฟเวอร์ล่ม สิ่งที่เกิดขึ้นเสมอๆ คือลูกค้ามักตามถามผู้ให้บริการว่าจะแก้ปัญหาเสร็จเมื่อใด หลายครั้งก็ถามบ่อยจนกระทั่งทีมงานทำงานได้ลำบาก วันนี้เมื่อบริการ GitLab ล่ม ก็พบการถูกตามอย่างหนักจนหลายครั้งกลายเป็นสแปม แต่ตอนนี้ทีมงานก็มีทางออกใหม่ด้วยการถ่ายทอดสดการทำงานให้ทั่วโลกได้เห็น

สถานะการกู้ข้อมูลล่าสุดของ GitLab อยู่ที่ 68% หลังจากนี้คงกลับมาเปิดใช้งานได้ในไม่ช้า

ที่มา - @gitlabstatus 1, 2