Tags:
Node Thumbnail

ประเด็นหนึ่งที่บริการคลาวด์ถูกโจมตีมาตลอดคือเรื่อง vendor lock-in หรือการถูกบังคับโดยอ้อมให้ต้องอยู่กับผู้ให้บริการคลาวด์เจ้านั้นตลอดไป เพราะการย้ายออกมีต้นทุนแฝงสูงมาก โดยเฉพาะบริการเฉพาะทางของผู้ให้บริการแต่ละราย (เช่น AI หรือ data) ที่ไม่ใช่บริการสามัญ (เช่น compute หรือ storage)

กรณีศึกษาล่าสุดมาจาก Discord แอพแชทยอดนิยมของวงการเกมเมอร์ ที่ระบุว่าย้ายระบบคลังข้อมูล (data warehouse) จากเดิมที่ใช้ Amazon Redshift มาเป็นบริการเทียบเคียงกันคือ BigQuery ของกูเกิล

หมายเหตุ: บทความนี้มาจากบล็อกของกูเกิล (เขียนโดยทีมงาน Discord ในฐานะลูกค้า GCP) ย่อมเชียร์บริการฝั่งกูเกิล แต่นำมาให้อ่านเพื่อเป็นกรณีศึกษาเรื่องการย้ายคลาวด์ข้ามค่าย

No Description

Discord อธิบายว่าย้ายระบบประมวลผลหลักมาอยู่บน Google Cloud Platform มาได้สักระยะหนึ่งแล้ว แต่คลังข้อมูลเดิมยังอยู่บน Redshift ทำให้ต้องย้ายข้อมูลจาก GCP กลับมายัง AWS ให้เสียเวลา-เปลืองค่านำข้อมูลเข้าออกอีก นอกจากนี้ยังมีประเด็นเรื่องค่าใช้จ่ายของ Redshift เองที่แพง (ระดับหลายแสนดอลลาร์ต่อเดือน ไม่รวมค่าสตอเรจและค่าเครือข่าย) กับข้อจำกัดทางเทคนิคของ Redshift เองที่ต้องใช้เครื่องเยอะ ทำให้ Discord ใช้เครื่องเกือบถึงข้อจำกัด 128 โหนดต่อคลัสเตอร์แล้ว

ด้วยเหตุผลข้างต้น ทำให้ Discord หาทางเลือกในการย้ายออกจาก Redshift และมาจบที่ BigQuery ด้วยหลายเหตุผล ทั้งเรื่องการอยู่บนระบบ GCP อยู่แล้ว, เป็น serverless ไม่ต้องดูแลเครื่องเอง, เรื่องการสเกลรองรับโหลดขนาดใหญ่ๆ (มีลูกค้ารายใหญ่กว่า Discord อยู่แล้ว) และฟีเจอร์ใหม่ BigQuery Reservations จองคิวใช้งานล่วงหน้าเพื่อให้ค่าบริการถูกลง

การย้ายจาก Redshift มายัง BigQuery ก็ไม่ง่ายนัก แม้บริการทั้งสองตัวเป็นบริการวิเคราะห์ข้อมูลเหมือนกัน แต่ก็มีแนวคิดต่างกันหลายเรื่อง (โดยเฉพาะการ partitioning และ clustering ข้อมูล) รวมถึงต้องแปลงโค้ด SQL เดิมหลายแสนบรรทัดมาเป็นซินแทกซ์ของ BigQuery ที่ทีมงาน Discord ต้องสร้างเครื่องมือแปลงตัวใหม่ขึ้นมาเองด้วย

หลังย้ายแล้ว Discord บอกว่าการทำงานวิเคราะห์ข้อมูลเร็วขึ้น ราบรื่นขึ้น ราคาถูกลง และสามารถใช้ฟีเจอร์ด้าน AI ของ GCP เข้ามาช่วยวิเคราะห์ข้อมูลได้ด้วย นอกจากนี้ทีมงานยังไม่ต้องดูแลเครื่องเอง ลดการรัน maintenance บน Redshift ทุกคืนซึ่งต้องใช้เวลา 12 ชม. และถ้ารันไม่สำเร็จก็จะตกมาตรฐาน SLA ภายในบริษัทด้วย

ที่มา - Google Cloud

Get latest news from Blognone