Tags:
Node Thumbnail

เมื่อสองวันก่อนไมโครซอฟท์เปิดตัว Azure Synapse บริการคิวรีข้อมูลขนาดใหญ่ ที่อัพเกรดมาจาก Azure SQL Data Warehouse ที่งาน Ignite ผมมีโอกาสพูดคุยกับ John Macintyre ผู้จัดการกลุ่มสินค้า Azure Synapse ได้ข้อมูลเพิ่มเติมถึงบริการตัวนี้

John ระบุว่าแม้ Azure จะมีบริการ Data Warehouse อยู่ก่อนแล้ว แต่บริการเป็นแบบคิดค่าใช้งานตามพลังประมวลผลที่จองไว้ล่วงหน้า ซึ่งแนวทางเช่นนี้บริการอื่นๆ แม้แต่ Google BigQuery เองก็มีระบบ slot เช่นเดียวกัน การจองพลังประมวลผลเช่นนี้มีข้อดีคือประสิทธิภาพของการคิวรีคาดเดาได้ ไม่แกว่งไปมาตามความว่างของคลัสเตอร์ในคลาวด์ อย่างไรก็ดีไมโครซอฟท์รับรู้ว่าลูกค้าจำนวนหนึ่งต้องการการคิดค่าใช้งานตามปริมาณข้อมูลแบบเดียวกับ Google BigQuery และ Amazon Athena ทำให้ Synapse จะมีตัวเลือกนี้ด้วย โดยข้อได้เปรียบอย่างหนึ่งคือเมื่อข้อมูลอยู่ใน Synapse การคิวรีจะสามารถเลือกคิดค่าบริการตามขนาดข้อมูล หรือตามพลังประมวลผลที่จองไว้ก็ได้ ไม่ต้องโหลดข้อมูลใหม่แต่อย่างใด

ความต่างสำคัญของ Synapse คือมันพัฒนามาจากเอนจิน SQL ของไมโครซอฟท์แล้วพยายามศึกษาว่าทำอย่างไรจึงรองรับการคิวรีบนคลัสเตอร์ขนาดใหญ่นับพันเครื่องบนข้อมูลระดับเพตาไบต์ พร้อมกับความทนทานในกรณีที่มีเครื่องใดเครื่องหนึ่งพังไประหว่างทำงาน ขณะที่เอนจินอื่นมักพัฒนามาจากการสร้างเอนจินแสกนข้อมูลขนาดใหญ่ๆ เป็นหลัก John จึงเชื่อว่าการคิวรีที่มีความซับซ้อนสูงๆ เช่น ต้อง JOIN ตาราง เอนจินของ Synapse จะได้เปรียบกว่า

เอนจิน Synapse นั้นพัฒนามา 5 ปีแล้ว และเริ่มใช้งานภายในไมโครซอฟท์เองมาก่อน แต่การพัฒนาอินเทอร์เฟซเพื่อให้เป็นมิตรกับผู้ใช้ภายนอกนั้นใช้เวลาประมาณ 18 เดือนก่อนจะเปิดบริการได้ในสัปดาห์นี้

แนวทางการคิดค่าบริการตามขนาดข้อมูลที่คิวรียังอยู่ในช่วงพรีวิว และไมโครซอฟท์ยังไม่เปิดเผยราคาออกมา ข้อจำกัดอีกอย่างหนึ่งคือ Synapse ต้องวางฐานข้อมูลบนสตอเรจประสิทธิภาพสูงค่าสตอเรจ 135.17 ดอลลาร์ต่อเทราไบต์ต่อเดือน เทียบกับ Google BigQuery ที่ราคา 20 ดอลลาร์ต่อเทราไบต์ต่อเดือน

ที่มา - การสัมภาษณ์ John Macintyre, เอกสาร Azure Synapse

No Description

Get latest news from Blognone