Tags:
Node Thumbnail

Blue Gene เป็นชื่อโครงการพัฒนาซูเปอร์คอมพิวเตอร์ของ IBM ซึ่งที่ผ่านมาก็มี "สถาปัตยกรรม" ซูเปอร์คอมออกมาแล้วหลายรุ่น เช่น รุ่นแรก Blue Gene/L ที่เคยโค่น Earth Simulator เป็นคอมพิวเตอร์ที่เร็วที่สุดในโลก, รุ่นสอง Blue Gene/P ที่ใช้กับซูเปอร์คอมที่เร็วที่สุดในยุโรป

ตอนนี้ IBM กำลังพัฒนาสถาปัตยกรรมรุ่นที่สาม Blue Gene/Q ซึ่งจะใช้ในซูเปอร์คอมพิวเตอร์ชื่อ Sequoia ที่มีพลังประมวลผลสูงถึง 20 PetaFLOPS (แชมป์ปัจจุบัน K Computer ของฟูจิตสึ อยู่ที่ 8.1 PetaFLOPS)

ในงานสัมมนาวิชาการด้านหน่วยประมวลผล Hot Chips เมื่อกลางเดือนสิงหาคมที่ผ่านมา วิศวกรของ IBM ได้เผยรายละเอียดซีพียูของ Blue Gene/Q ที่ออกแบบมาเป็นพิเศษ (โดยอิงอยู่บนสถาปัตยกรรม Power ของ IBM) ที่น่าสนใจคือมันมีจำนวนคอร์แปลกๆ ที่ 18 คอร์

คอร์

ซีพียูของ Blue Gene/Q จะประกอบด้วย "คอร์" ย่อยๆ ตามแนวทางการออกแบบซีพียูสมัยใหม่ โดย "คอร์" ที่ว่าจะใช้สถาปัตยกรรม Power A2 ที่ IBM สร้างขึ้นมาสำหรับอุปกรณ์เครือข่าย

คอร์ Power A2 ใช้ชุดคำสั่งแบบ 64 บิต หนึ่งคอร์มี 4 เธร็ด และแคช L1 จำนวน 32KB (แบ่งครึ่งสำหรับ data/instruction) ทำงานที่ 1.6GHz

ประเด็นที่น่าสนใจอีกอันคือ IBM เลือกจะลดความเร็วสัญญาณนาฬิกา และพลังไฟฟ้าลงที่ 0.8V เพื่อประหยัดพลังงาน ข้อเสียคือประสิทธิภาพต่อคอร์ลดลง ข้อดีคือการจ่ายไฟสม่ำเสมอกว่าเดิม และการซิงก์การทำงานของคอร์ทั้งหมดของระบบ (จำนวน 1.57 ล้านคอร์) ง่ายขึ้น ประหยัดไฟมากขึ้น

รายละเอียดเพิ่มเติมอ่านกันตามลิงก์นะครับ คงลงลึกแค่นี้

ซีพียู

ส่วนตัวซีพียูจะนำคอร์ Power A2 จำนวน 18 คอร์มารวมกัน โดยแบ่งงานกันดังนี้

  • 16 คอร์สำหรับงานประมวลผลทั่วไป
  • 1 คอร์สำหรับรันเซอร์วิสของลินุกซ์โดยเฉพาะ (ใช้ Red Hat Enterprise Linux) เพื่อไม่ให้งานของเซอร์วิสไปกระทบกับภาระงานในการประมวลผลหลัก ถือเป็นการออกแบบพิเศษตามลักษณะการใช้งานของ Blue Gene/Q
  • 1 คอร์สุดท้ายมีทิ้งไว้เฉยๆ เพื่อแก้ปัญหาเรื่องอัตราความสำเร็จในการผลิต (yield rate) อธิบายง่ายๆ ว่าผลิตชิป 17 คอร์ให้ใช้ได้ 100% มันยาก ผลิตชิป 18 คอร์ที่เสียตัวนึงแล้วเหลือให้ใช้ 17 คอร์นั้นง่ายกว่ามาก

นอกจากคอร์ทั้ง 18 แล้ว ในซีพียูยังมีส่วนประกอบอื่นๆ เช่น แคช L2, memory controller โดยทุกอย่างเชื่อมกันผ่าน crossbar (xbar switch) ดูรูปประกอบกันได้ตามลิงก์

การประกอบซีพียู

อันนี้เป็นอีกประเด็นที่น่าสนใจ หลังจากได้ซีพียูมา 1 ตัวแล้ว มันจะถูกรวมกับแรม DDR3 16GB เป็น "compute card" หนึ่งแผ่น จากนั้นจะเอา compute card จำนวน 32 ชุดรวมเป็น "node card" หนึ่งอัน (ขนาดเทียบได้กับเซิร์ฟเวอร์ 1U อันนี้ผมกะขนาดด้วยสายตาคร่าวๆ)

หนึ่งตู้แร็คจะใช้ node card รวม 32 ชุด และส่วนของ I/O อีกต่างหาก จากนั้นจึงจะนำแร็คไปรวมกันเป็นซูเปอร์คอมพิวเตอร์ต่อไป (ภาพประกอบตามลิงก์)

ซูเปอร์คอมพิวเตอร์

ตอนนี้มีลูกค้าของ IBM เตรียมจะใช้ Blue Gene/Q สองราย ได้แก่

  • ห้องปฏิบัติการวิจัย Lawrence Livermore ระบบชื่อ Sequoia พลังประมวลผล 20 PetaFLOPS กำหนดเสร็จปี 2012
  • ห้องปฏิบัติการวิจัย Argonne ระบบชื่อ Mira พลังประมวลผล 10 PetaFLOPS กำหนดเสร็จปี 2012 เช่นกัน

ที่มา - The Register

Get latest news from Blognone

Comments

By: adente
ContributorSUSESymbianWindows
on 25 August 2011 - 14:44 #326440
adente's picture

"•1 คอร์สุดท้ายมีทิ้งไว้เฉยๆ เพื่อแก้ปัญหาเรื่องอัตราความสำเร็จในการผลิต (yield rate) อธิบายง่ายๆ ว่าผลิตชิป 17 คอร์ให้ใช้ได้ 100% มันยาก ผลิตชิป 18 คอร์ที่เสียตัวนึงแล้วเหลือให้ใช้ 17 คอร์นั้นง่ายกว่ามาก"

ผมอ่านแล้วงงครับ ตรงนี้ = =

By: varavut
ContributorWindows PhoneAndroidBlackberry
on 25 August 2011 - 14:51 #326445 Reply to:326440

ประมาณว่าผลิตของที่สมบูรณ์ 100 % มันยากครับ เลยผลิตให้เกินไป 1 คอร์ ถึงเสียไป 1 คอร์ก็ไม่เป็นไร
เช่นถ้าเราผลิต 17 คอร์ แล้วต้องการใช้ทั้ง 17 คอร์เนี่ย ของเสียก็มีตั้งแต่ เสีย 1 คอร์จนถึงเสีย 17 คอร์เลย
แต่ถ้าเราผลิตเผื่อไว้ เป็น 18 คอร์ ของเสียคืออันที่เสียตั้งแต่ 2 คอร์ขึ้นไป


2bedev.com เขียนโปรแกรมระดับรากหญ้า

By: adente
ContributorSUSESymbianWindows
on 25 August 2011 - 15:00 #326450 Reply to:326445
adente's picture

อ้อ ขอบคุณครับ เข้าใจแล้ว

By: LuvStry
ContributorAndroid
on 25 August 2011 - 14:45 #326442
LuvStry's picture

เออเข้าใจคิด ในเมื่อ 17 คอร์มาไม่เต็ม ก็ทำ 18 มันซะเลย ถึงมาไม่เต็ม แต่ก็ได้ตั้ง 17 คอร์ :P


Blognone = 138.1 news/w เยอะมากๆ

By: AlninlA
ContributorAndroidUbuntu
on 25 August 2011 - 15:11 #326456
AlninlA's picture

compute card จำนวน 16 ชุดรวมเป็น "node card" หนึ่งอัน

น่าจะเป็น 32 compute card = 1 node card รึเปล่าครับ (พิจารณาจากรูป)

By: mk
FounderAndroid
on 25 August 2011 - 19:33 #326612 Reply to:326456
mk's picture

แก้แล้วครับ

By: kitarotao
iPhoneWindows PhoneAndroidBlackberry
on 25 August 2011 - 15:16 #326460
kitarotao's picture

งั้นทำ 20 cores เลย ใช้ทำงาน 18 cores เหลือไว้ 2 cores

By: spicydog
ContributoriPhoneAndroidUbuntu
on 25 August 2011 - 15:33 #326469 Reply to:326460
spicydog's picture

คาดว่าเขาคงมีจุด Optimize นะครับ


SPICYDOG's Blog

By: neon02
Contributor
on 25 August 2011 - 15:39 #326470
neon02's picture

ก็คล้าย ๆ HDD ที่ผลิตมาที่ความจุเดียว แต่อันไหน QC ความจุสูงสุดไม่ผ่านก็ไปขายเป็นรุ่นความจุต่ำ แล้ว block พื้นที่เสียไว้

By: TeamKiller
ContributoriPhone
on 25 August 2011 - 16:59 #326518
TeamKiller's picture

จะรู้ได้ไงว่าคอร์ไหนเสียหว่า ถ้ามันเกิดเสียจริงๆ

By: Go-Kung
iPhoneWindows PhoneAndroidBlackberry
on 25 August 2011 - 18:43 #326589 Reply to:326518

ผลิตเสร็จแล้วมีกระบวนการทดสอบครับ

เหมือน CPU AMD ที่มีบางรุ่นเปิด Core เพิ่มได้ แสดงว่าเป็นผลผลิตจากการผลิตรุ่นที่ Core เยอะกว่า แล้วก็เทสไม่ผ่านเลยปิดบาง Core ลดลงมาขายเป็นรุ่นต่ำ

(เช่น Phenom II x4 955 กับ Phenom II x2 555)

By: เดวิลแมน on 25 August 2011 - 17:20 #326535

อินเทลกำลังโหมโฆษณา 8 คอร์ เจอไอบีเอ็มเข้าไปโม้ไม่ออก

By: Go-Kung
iPhoneWindows PhoneAndroidBlackberry
on 25 August 2011 - 18:45 #326593 Reply to:326535

คนละตลาดกันกระมังครับ

อันนี้ Mainframe, Super Computer ที่ IBM เป็นเต้ยมาแต่ไหนแต่ไรแล้ว

ส่วน 8 Core ที่ Intel, AMD กำลังซัดกันอยู่ที่ตลาด Consumer, Server ทั่วไปนะครับ

By: godhao
Windows PhoneAndroidWindows
on 25 August 2011 - 17:43 #326555
godhao's picture

ทศกัณฐ์ยังมีแค่ 10 คอ เอง LOL

By: viroth
ContributorBlackberryIn Love
on 25 August 2011 - 19:01 #326603 Reply to:326555
viroth's picture

ทศกัณฐ์มี 1 คอ 10 เธรด(หน้า)

By: Thaina
Windows
on 26 August 2011 - 00:07 #326718 Reply to:326603

จริงๆแล้ว ทศ แปลว่า 10 กัณฑ์ แปลว่า คอ ครับ

ไปดูดีไซจ์ทศกัณฑ์ต้นแบบแล้วจะหลอน

By: nununu
Windows Phone
on 25 August 2011 - 17:57 #326567

สงสัยจะได้เห็นการเปิดหัวกันอีก

By: mr_tawan
ContributoriPhoneAndroidWindows
on 25 August 2011 - 21:04 #326646
mr_tawan's picture

จริง ๆ วิธีปิดไปคอร์นึงนี้ก็ใช้ใน IBM Cell ด้วยนะ (แต่รายนี้มี 8 คอร์ ปิดไปหนึ่ง)


  • 9tawan.net บล็อกส่วนตัวฮับ
By: OXYGEN2
ContributoriPhoneAndroidWindows
on 25 August 2011 - 21:41 #326664
OXYGEN2's picture

แนวคิดการผลิตคล้ายๆ AMD แต่คงจะไม่มีการเปิดหัวได้แบบ AMD


oxygen2.me, panithi's blog

Device: ThinkPad T480s, Thinkpad X1, iPad Pro, iPhone 11 Pro Max, Galaxy Note 20 5G

By: zinazisc
Windows PhoneAndroid
on 25 August 2011 - 22:18 #326678
zinazisc's picture

18 คอร์ 18 คอมเม้น

By: eol
Android
on 26 August 2011 - 10:21 #326803
eol's picture

เดี๋ยวมีข่าวเปิด core แบบ AMD!!!! 555+

/me เพ้อฝัน