Tags:
Node Thumbnail

ที่งาน SC13 อินเทลเปิดเผยรายละเอียดของหน่วยประมวลผลสำหรับงานประสิทธิภาพสูงที่ต้องการการคำนวณขนานจำนวนมาก เป็นหน่วยประมวลผลที่พัฒนาต่อจาก Xeon Phi โดยมีชื่อรหัสว่า Knight's Landing (KNL)

อินเทลระบุว่าแนวคิดการใช้หน่วยประมวลผลหลัก ร่วมกับหน่วยประมวลผลเฉพาะเพื่อมาทำงานขนานสร้างความยุ่งยากในการพัฒนาอย่างมาก เพราะนักพัฒนาต้องมานั่งคิดว่างานใดจะอยู่บนหน่วยประมวลผลหลัก งานใดต้องโยกไปให้หน่วยประมวลผลเสริม

ทุกวันนี้การทั้ง AMD และ NVIDIA ล้วนเสนอแนวทางการ "แก้ปัญหา" ความยุ่งยากของการย้ายงานไปอยู่บนหน่วยประมวลผลเสริม ด้วยการทำให้หน่วยความจำเป็นผืนเดียวกัน เช่น HSA ของ AMD และ CUDA 6 ของ NVIDIA

Tags:
Node Thumbnail

ผลการจัดอันดับซูเปอร์คอมพิวเตอร์ที่เร็วที่สุดในโลก 500 อันดับแรก (หรือ TOP500) ครั้งที่ 42 ได้ประกาศออกมาเป็นทางการแล้ว ในผลครั้งนี้ Tianhe-2 จากจีนยังคงครองแชมป์โลกเป็นครั้งที่สอง ด้วยสมรรถนะการประมวลผลสูงสุดถึง 33.86 petaflop/s และสมรรถนะทางทฤษฎี (Rpeak) อยู่ที่ 54.9 petaflop/s

Tags:
Node Thumbnail

ที่งาน SC13 ปีนี้พระเอกของงานคงย้ายไปอยู่ที่ผู้ผลิตชิปกราฟิก ที่ได้รับความนิยมในซุปเปอร์คอมพิวเตอร์รุ่นใหม่ๆ อย่างมาก สามวันก่อนหน้านี้ เอเอ็มดีเปิดตัว FirePro S10000 รุ่นแรม 12GB ในวันนี้เองทาง NVIDIA ก็ออกมาเปิดตัว Tesla K40 รุ่นอัพเกรดจาก K20 ให้มีแรม 12GB เท่ากัน

การใช้งานชิปกราฟิกเพื่องานจำลองทางการเงิน, ฟิสิกส์, หรือเคมี นั้นต่างจากการประมวลผลกราฟิกทั่วไป แม้งานจะประมวลผลขนานเหมือนกันทำให้ที่ผ่านมาเราสามารถใช้ชิปกราฟิกมาเร่งความเร็วได้ แต่การจำลองเหล่านี้มักมีชุดข้อมูลขนาดใหญ่มากการที่การ์ดกราฟิกมีหน่วยความจำจำกัดทำให้ต้องย้ายข้อมูลเข้าออกบ่อยครั้ง เสียประสิทธิภาพไปมาก

Tags:
Node Thumbnail

เมื่อช่วงต้นเดือนที่ผ่านมา Blognone มีงานเสวนาที่ไม่ได้ประกาศภายนอก โดยเชิญผู้ร่วมงานเป็นกลุ่มตัวแทนของผู้ดูแลเว็บขนาดใหญ่จำนวนหนึ่ง เช่น Sanook.com, Kapook, MThai, ไทยรัฐ, Thaitrend, Tarad.com, และ Pantip.com ทั้งหมดได้ร่วมพูดคุยกันถึงประสบการณ์ปัญหาต่างๆ ที่เคยเจอมาว่าในการทำเว็บที่ใหญ่ขึ้นเรื่อยๆ เคยเจอปัญหากันอย่างไร และมีประสบการณ์การแก้ไขกันอย่างไรมาแล้วบ้าง

Tags:
Node Thumbnail

ออราเคิลเปิดตัวชิป SPARC M6 รุ่นล่าสุดที่งาน Hot Chip โดยมีฟีเจอร์สำคัญที่สุดคือการขยายจำนวนซ็อกเก็ตต่อเครื่องได้ถึง 96 ซ็อกเก็ต รวมจำนวนคอร์ถึง 1,152 คอร์ และ 9,216 เธรดในเครื่องเดียว

ชิป M6 นั้นมาพร้อมกับส่วนเชื่อมต่อสองฝั่ง ได้แก่ Scalability Links จำนวน 6 ชุด เอาไว้เชื่อมต่อกับซีพียูในโดเมนเดียวกัน ทำให้ซีพียูแต่ละกลุ่มสามารถจัดเป็นชุดได้ชุดละ 8 ตัว ขณะเดียวกันก็มีช่องทาง Coherence Links ไว้เชื่อมต่อกับซีพียูนอกกลุ่มผ่านระบบแลกเปลี่ยนข้อมูลที่เรียกว่า Bixby มันสามารถส่งข้อมูลหลายทอด (multiple hops) เพื่อเรียกข้อมูลจากหน่วยความจำที่อยู่บนซ็อกเก็ตอื่นๆ ได้ ทำให้สามารถขยายจำนวนซ๊อกเก็ตไปได้สูงสุด 96 ซ๊อกเก็ต

Node Thumbnail

ไมโครซอฟท์ประกาศเพิ่มฟีเจอร์ใหม่ของ Windows Azure อีกหลายอย่าง สำหรับฟีเจอร์ใหญ่ๆ แบ่งได้เป็น 4 อย่างตามนี้ครับ

  1. SQL Server AlwaysOn Support
  2. Notification Hubs
  3. AutoScale
  4. Virtual Machines Load Balancer

SQL Server AlwaysOn Support

มันคือการใช้ฟีเจอร์ด้าน AlwaysOn Availability Group ของ SQL Server 2012 ขึ้นไป ที่ไมโครซอฟท์นำมาใช้กับแพลตฟอร์ม Windows Azure ด้วย

Tags:
Node Thumbnail

การ์ด Intel Phi เป็นการ์ดคำนวณประสิทธิภาพสูง กระบวนการทำงานออกแบบสำหรับการคำนวณกับข้อมูลขนาดใหญ่ๆ ที่มีกระบวนการคำนวณเป็นแบบเดียวกันเป็นชุดๆ ตัว Intel Phi เองแม้จะราคาไม่แพงเกินไป (ต่ำกว่าแสน) แต่ก็ไม่ใช่ของที่เราจะเห็นกันได้ทั่วไปเหมือนการ์ดกราฟิก แนวทางของอินเทลจึงเป็นอาศัยการตั้งศูนย์ทดสอบเพื่อให้นักพัฒนาเข้าไปลองใช้งานการ์ดนี้กัน และตอนนี้การ์ดใบนี้ก็มาตั้งเป็นศูนย์ทดสอบในเมืองไทยแล้วที่มหาวิทยาลัยเกษตรศาสตร์

ศูนย์ทดสอบนี้เพิ่งจัดสัมมนาไปเมื่อสัปดาห์ที่ผ่านมา โดยส่วนมากผู้เข้าร่วมจะเป็นอาจารย์มหาวิทยาลัยต่างๆ แต่ศูนย์นี้ก็เปิดให้คนภายนอกเข้าไปทดลองใช้งานได้โดยเขียนข้อเสนอโครงการคร่าวๆ ว่าจะใช้ Phi เพื่อทำอะไรแล้วอีเมลเข้าไปยังโครงการ

Tags:

Green500 ผู้ที่คอยจัดอันดับซูเปอร์คอมพิวเตอร์ประหยัดพลังงาน ได้เผยผลการจัดอันดับประจำเดือนมิถุนายน 2013 (Green500 จะจัดอันดับโดยใช้เกณฑ์ด้านอัตราการใช้พลังงาน แทนการจัดอันดับโดยใช้เกณฑ์ด้านสมรรถนะของ TOP500 โดยทาง Green500 จะสรุปผลการจัดอันดับปีละ 2 ครั้งคือ ในเดือนมิถุนายนกับเดือนพฤศจิกายน)

โดยอันดับ 1 ของครั้งนี้เป็นของ Eurora จากสหภาพยุโรปซึ่งมีประสิทธิภาพสูงถึง 3.21 gigaflops/watt (เครื่องนี้มีสมรรถนะอยู่ที่ 100.9 TFlop/s และสามารถเร่ง peak load ได้ถึง 175.7 TFlop/s โดยถูกจัดเป็นซูเปอร์คอมพิวเตอร์อันดับที่ 467 ตามผลการจัดอันดับล่าสุดของ TOP500)

Tags:
Node Thumbnail

การ์ด Phi เพิ่งทำให้เครื่อง Tianhe-2 ขึ้นที่หนึ่งซุปเปอร์คอมพิวเตอร์ที่เร็วที่สุดในโลกไป อินเทลก็อาศัยโอกาสนี้เปิดตัวการ์ด Phi รุ่นใหม่อีกส่ามรุ่น คือ 7120, 3120, และ 5120D

Phi 7120 จะเป็นรุ่นใหญ่สุดในบรรดการ์ด Phi ที่อินเทลขายอยู่ตอนนี้ จุดเด่นของมันคือการเพิ่มแรมบนการ์ดเป็น 16GB ทำให้มีแรมสำหรับแต่ละคอร์เพิ่มขึ้นมาก ความเร็วในการคำนวณเพิ่มขึ้นเล็กน้อยเป็น 1.2 TFLOP สำหรับการคำนวณตัวเลข double precision (DP) แต่ในการใช้งานจริงก็จะใช้งานง่ายขึ้นมาก แยกสองรุ่นคือรุ่น P จะมีพัดลมระบายความร้อนมาด้วย ส่วนรุ่น X ไม่มีให้

Tags:
Node Thumbnail

ต่อจากข่าว ซูเปอร์คอมจีน Tianhe-2 แซงหน้าอเมริกาด้วยความแรง 54.9 petaflop ล่าสุดอันดับซูเปอร์คอมพิวเตอร์โลก TOP500 ประจำรอบเดือนมิถุนายน 2013 (จัดทุกครึ่งปี) ออกแล้ว และไม่มีพลิกโผใดๆ Tianhe-2 เป็นแชมป์ใหม่ตามคาด

Tianhe-2 หรือ "Milky Way 2" ใช้ซีพียู Xeon 32,000 ตัว ร่วมกับหน่วยประมวลผลร่วม (co-processor) Xeon Phi 48,000 และระบบเชื่อมต่อ (interconnect) ที่จีนพัฒนาเองเรียกว่า TH Express-2, มีหน่วยความจำรวม 1 petabyte, ระบบปฏิบัติการ Kylin Linux

Tags:
Node Thumbnail

จีนเคยผงาดขึ้นเป็นแชมป์โลกด้านซูเปอร์คอมพิวเตอร์ครั้งหนึ่งเมื่อปี 2010 ด้วยซูเปอร์คอมฯ Tianhe-1A ความแรง 2.57 petaflop จากนั้นสหรัฐก็ทวงบัลลังก์คืนและครองแชมป์มาโดยตลอด (แชมป์ปัจจุบันคือ Cray Titan)

อย่างไรก็ตาม ผู้สืบทอดของซูเปอร์คอมสัญชาติจีน Tianhe-2 เสร็จสมบูรณ์แล้ว สมรรถนะในการประมวลผลของมันสูงถึง 54.9 petaflop มากกว่าแชมป์ปัจจุบัน Titan ที่ทำได้ 18 petaflop ประมาณสามเท่าตัว ขุมพลังของมันคือซีพียู Intel Xeon ยุค Ivy Bridge จำนวนทั้งหมด 32,000 คอร์ และการ์ดช่วยประมวลผล Xeon Phi อีก 48,000 ตัว

Tags:
Node Thumbnail

ตลาดซุปเปอร์คอมพิวเตอร์นั้นเดิมจำกัดอยู่ในหน่วยงานรัฐหรือหน่วยงานการทหารเป็นหลัก แม้ช่วงหลังจะเริ่มมีความต้องการคอมพิวเตอร์ประสิทธิภาพสูงจากภาคธุรกิจมมากขึ้น บริษัทที่ขายซุปเปอร์คอมพิวเตอร์เป็นหลักอย่าง Cray เตรียมบุกตลาดนี้ด้วยเครื่อง XC30-AC ที่มีพลังคำนวณ 22 ถึง 176 เทราฟลอป ราคาอยู่ในช่วง 500,000 ถึง 3,000,000 ดอลลาร์

เครื่องทั้งหมดใช้ชิป Xeon 5400 เชื่อมต่อกันด้ววยชุดเชื่อมต่อ Aries ที่เป็น PCIc-3 เชื่อมตรงระหว่างซีพียูเข้าด้วยกัน รวมซีพียูในแต่ละเบลดรองรับ 8 ซ็อกเก็ต และหนึ่งตู้จะใส่ได้ 16 เบลด ทำให้ทั้งหมดมี 128 ซ็อกเก็ตในแต่ละตู้ พร้อมพื้นที่ข้อมูลอีก 30 TB ชุด 3,000,000 ดอลลาร์คือชุด 8 ตู้ แต่มีพื้นที่เก็บข้อมูลให้ 140 TB

Tags:
Node Thumbnail

อินเทลอัพเดตคอมไพเลอร์ ispc ที่ออกแบบมาเพื่อการคอมไพล์ให้ใช้ชุดคำสั่งแบบ SIMD ให้สามารถทำงานบนชิป Xeon และ Xeon Phi ได้

ispc เป็นคอมไพเลอร์ภาษาพิเศษโค้ดคล้ายกับภาษา C แต่การเรียกฟังก์ชั่นจะเป็นการแตกข้อมูลออกเป็นชุดๆ เพื่อรันบนชุดคำสั่งแบบเวคเตอร์ เช่น ชุดคำสั่ง SSE หรือชุดคำสั่ง AVX โดยอาศัยการ "คลี่" ลูปออกมา

Tags:
Node Thumbnail

เมื่อไม่นานมานี้ บริการกลุ่มเมฆ EC2 ของ Amazon ได้เปิดตัวเซิร์ฟเวอร์ประเภทใหม่ในชื่อว่า High Memory Cluster Eight Extra Large ซึ่งใช้ชื่อย่อว่า cr1.8xlarge ดูจากชื่อก็บอกได้ว่า เป็นเซิร์ฟเวอร์ที่มีหน่วยความจำขนาดใหญ่พร้อมกับหน่วยประมวลผลสมรรถนะสูง โดยสเปคของ cr1.8xlarge มีดังนี้

Tags:
Node Thumbnail

ในงานแถลงข่าวของ NVIDIA ที่งาน CES 2013 นอกจากเปิดตัว Tegra 4 และเครื่องเล่นเกม Project SHIELD แล้วยังมีผลิตภัณฑ์ใหม่อีก 1 ตัวครับ

ชื่อของมันคือ NVIDIA Grid อธิบายง่ายๆ มันเป็นแร็คที่ประกอบด้วยเซิร์ฟเวอร์สีเขียว-ดำ 20 ตัว ภายในอัด GeForce มาทั้งหมด 240 ตัว (ไม่ระบุรุ่น) พลังประมวลผลรวมกัน 200 TFLOPS เทียบได้กับ Xbox 360 จำนวน 700 เครื่อง

Tags:
Node Thumbnail

ไมโครซอฟท์เปิดเผยความสามารถใหม่ของบริการ Windows Azure ในชื่อว่า Big Compute ซึ่งเป็น virtual machine สำหรับรองรับการประมวลผลสมรรถนะสูง ในเบื้องต้น Big Compute จะรองรับเพียงแค่ระบบปฏิบัติการ Windows และจัดเตรียม virtual machine มาให้ 2 รุ่นด้วยกัน คือ รุ่นซีพียู 8 คอร์พร้อมแรม 60 กิกะไบต์ และรุ่นซีพียู 16 คอร์พร้อมแรม 120 กิกะไบต์ โดยขณะนี้ ไมโครซอฟท์ยังไม่เปิดเผยรายละเอียดเกี่ยวกับราคาบริการของ Big Compute

Tags:
Node Thumbnail

TOP500 ได้ประกาศผลการจัดอันดับระบบคอมพิวเตอร์ที่เร็วที่สุดในโลก 500 อันดับแรกครั้งที่ 40 โดยแชมป์ครั้งนี้ตกเป็นของซูเปอร์คอมพิวเตอร์ในนามว่า Titan จากบริษัท Cray ด้วยจำนวนโปรเซสเซอร์ถึง 560,640 หน่วย ประกอบไปด้วยชิปเร่งการประมวลผลกราฟิก NVIDIA Tesla K20X ถึง 261,632 คอร์ ทำให้ Titan มีสมรรถนะการประมวลผลถึง 17.59 เพตาฟลอป เอาชนะ Sequoia ซูเปอร์คอมพิวเตอร์พลัง​ IBM BlueGene/Q แชมป์ TOP500 ครั้งที่ 39 ไปอย่างขาดลอย (ข่าวเก่า)

ในผลการจัดอันดับของ TOP500 ครั้งที่ 40 มีข้อมูลที่น่าสนใจ ดังนี้

Tags:
Node Thumbnail

ตำนานชิป 60 คอร์ที่เริ่มต้นมาตั้งแต่ Larrabee ในปี 2010 จนตอนนี้ก็ยังไม่มีสินค้าให้ซื้อได้จริงจนในที่สุด อินเทลก็ประกาศวางจำหน่าย Xeon Phi ต้นปี 2013 แล้ว โดยราคาการ์ดเริ่มต้น Xeon Phi 3100 จะอยู่ที่ 2,649 ดอลลาร์

Xeon Phi เป็นส่วนเติมเต็มที่เข้ามาเสริมอินเทลให้สามารถขายโซลูชั่นครบวงจรในตลาดซุปเปอร์คอมพิวเตอร์ได้ จากที่ทุกวันนี้เครื่องส่วนมากจะติดตั้งการ์ดกราฟิกของ NVIDIA หรือ AMD ไว้ในเครื่องเพื่อเร่งความเร็วทั้งสิ้น

อินเทลระบุว่าในเวลานี้เอง มีเครื่องที่ใช้ Xeon Phi อยู่ในรายการ Top500 แล้ว 6 เครื่อง

การ์ดสามรุ่นแรกที่จะวางจำหน่ายคือ Xeon Phi 3100, 3100T (เหมือนกัน แค่รุ่น T ไม่มีพัดลม), และ 5110P

Tags:
Node Thumbnail

Intel Xeon Phi เปิดตัวมานาน แม้เราจะรู้ว่ามันเป็นชิปในตระกูล MIC แต่ก็ไม่เคยมีรายละเอียดออกมาจริงจังว่าสถาปัตยกรรมภายในเป็นอย่างไร แต่หลังจากงาน Hotchips ปีนี้อินเทลก็เริ่มเปิดเผยรายละเอียดภายในของ Phi แล้ว

George Chrysos หัวหน้าฝ่ายสถาปัตยกรรมของ Phi ระบุว่าการออกแบบทำเพื่อจุดมุ่งหมายสามประการ คือ

Tags:
Node Thumbnail

ใกล้งานสัมมนาด้านการออกแบบซีพียูประสิทธิภาพสูง Hot Chips (27-29 ส.ค. นี้) ทางยักษ์ใหญ่อย่าง IBM ก็ออกมาเผยรายละเอียดบางส่วนของซีพียูระดับสูงรุ่นถัดๆ ไปของบริษัท ดังนี้

  • ตอนนี้ IBM ประสบความสำเร็จกับการเพิ่มความถี่สัญญาณนาฬิกาของซีพียู "zNext" สำหรับเมนเฟรมตระกูล System z ขึ้นไปที่ 5.5GHz แล้ว (ของเดิม 5.2GHz)
  • ซีพียู POWER7 ในปัจจุบัน มีความถี่ขึ้นไปที่ 4.14GHz
  • สำหรับซีพียูตระกูล POWER ตัวถัดไปคือ POWER7+ จะมีประสิทธิภาพดีกว่าเดิม 10-20%

รายละเอียดสำหรับซีพียูเหล่านี้จะเปิดเผยในงาน Hot Chips ช่วงปลายเดือนนี้ครับ

Tags:
Node Thumbnail

เครื่องซุปเปอร์คอมพิวเตอร์ BlueGene/Q ขึ้นที่หนึ่งของรายการ TOP500 อีกครั้งหลังจากเสียแชมป์ไปนานหกเดือนให้กับเครื่อง K computer จากญี่ปุ่น โดยเครื่อง BlueGene/Q นั้นสามารถเข้ามาใน 5 อันดับแรกได้ถึงสองเครื่องพร้อมๆ กัน แถมด้วย iDataPlex มาเป็นอันดับที่ 4 อีกเครื่อง

Tags:
Node Thumbnail

อินเทลเปิดตัวการ์ดช่วยประมวลผล Intel® Xeon® Phi™ ช่วยให้เครื่องคอมพิวเตอร์เพียงเครื่องเดียวมีพลังประมวลผล 1 เทราฟลอป คาดว่าการ์ด Phi นั้นคือชื่อทางการของ Knights Ferry และ Knights Corners ที่ประกาศออกมาโดยไม่มีสินค้าวางขาย (แต่ให้กับพาร์ทเนอร์สำคัญไปทดลองเท่านั้น)

Node Thumbnail

ข่าวนี้เก่าไปหลายเดือน แต่น่าจะเป็นประโยชน์สำหรับคนที่อยากรู้ว่าบริการยอดฮิตอย่าง Instagram สามารถรองรับโหลดปริมาณมหาศาลจากผู้ใช้ทั่วโลกได้อย่างไร

เรื่องนี้มีอธิบายไว้ในบล็อก Instagram Engineering

เซิร์ฟเวอร์

  • Instagram ใช้เซิร์ฟเวอร์เสมือน คือเช่าบริการ Amazon EC2 ทั้งหมด ด้วยเหตุผลว่าปริมาณวิศวกรที่มี ไม่พอสำหรับการตั้งเซิร์ฟเวอร์เอง ดังนั้นเลือกเช่าใช้งาน EC2 ง่ายกว่า
  • ระบบปฏิบัติการเซิร์ฟเวอร์เป็น Ubuntu 11.04 โดยทีมงานบอกว่า Ubuntu รุ่นก่อนๆ มีปัญหากับ EC2 แต่ในรุ่นนี้ไม่มีแล้ว

    Load Balancing

  • เดิมที Instagram ใช้เซิร์ฟเวอร์ NGINX สองตัว สลับกันแบบ DNS Round-Robin

Tags:

ซูเปอร์คอมพิวเตอร์ที่แรงที่สุดในโลกตอนนี้คือ K Computer มีสมรรถนะในการประมวลผล 10 เพตะฟลอป (1 petaFLOPS = 1015 FLOPS) เป้าหมายต่อไปของมนุษยชาติจึงอยู่ที่ซูเปอร์คอมพิวเตอร์หลักเอ็กซะฟลอป (1 exaFLOPS = 1018 FLOPS) หรือที่เรียกกันว่า exascale computing

Pages