IBM

Blue Gene เป็นชื่อโครงการพัฒนาซูเปอร์คอมพิวเตอร์ของ IBM ซึ่งที่ผ่านมาก็มี "สถาปัตยกรรม" ซูเปอร์คอมออกมาแล้วหลายรุ่น เช่น รุ่นแรก Blue Gene/L ที่เคยโค่น Earth Simulator เป็นคอมพิวเตอร์ที่เร็วที่สุดในโลก, รุ่นสอง Blue Gene/P ที่ใช้กับซูเปอร์คอมที่เร็วที่สุดในยุโรป

ตอนนี้ IBM กำลังพัฒนาสถาปัตยกรรมรุ่นที่สาม Blue Gene/Q ซึ่งจะใช้ในซูเปอร์คอมพิวเตอร์ชื่อ Sequoia ที่มีพลังประมวลผลสูงถึง 20 PetaFLOPS (แชมป์ปัจจุบัน K Computer ของฟูจิตสึ อยู่ที่ 8.1 PetaFLOPS)

ในงานสัมมนาวิชาการด้านหน่วยประมวลผล Hot Chips เมื่อกลางเดือนสิงหาคมที่ผ่านมา วิศวกรของ IBM ได้เผยรายละเอียดซีพียูของ Blue Gene/Q ที่ออกแบบมาเป็นพิเศษ (โดยอิงอยู่บนสถาปัตยกรรม Power ของ IBM) ที่น่าสนใจคือมันมีจำนวนคอร์แปลกๆ ที่ 18 คอร์

คอร์

ซีพียูของ Blue Gene/Q จะประกอบด้วย "คอร์" ย่อยๆ ตามแนวทางการออกแบบซีพียูสมัยใหม่ โดย "คอร์" ที่ว่าจะใช้สถาปัตยกรรม Power A2 ที่ IBM สร้างขึ้นมาสำหรับอุปกรณ์เครือข่าย

คอร์ Power A2 ใช้ชุดคำสั่งแบบ 64 บิต หนึ่งคอร์มี 4 เธร็ด และแคช L1 จำนวน 32KB (แบ่งครึ่งสำหรับ data/instruction) ทำงานที่ 1.6GHz

ประเด็นที่น่าสนใจอีกอันคือ IBM เลือกจะลดความเร็วสัญญาณนาฬิกา และพลังไฟฟ้าลงที่ 0.8V เพื่อประหยัดพลังงาน ข้อเสียคือประสิทธิภาพต่อคอร์ลดลง ข้อดีคือการจ่ายไฟสม่ำเสมอกว่าเดิม และการซิงก์การทำงานของคอร์ทั้งหมดของระบบ (จำนวน 1.57 ล้านคอร์) ง่ายขึ้น ประหยัดไฟมากขึ้น

รายละเอียดเพิ่มเติมอ่านกันตามลิงก์นะครับ คงลงลึกแค่นี้

ซีพียู

ส่วนตัวซีพียูจะนำคอร์ Power A2 จำนวน 18 คอร์มารวมกัน โดยแบ่งงานกันดังนี้

  • 16 คอร์สำหรับงานประมวลผลทั่วไป
  • 1 คอร์สำหรับรันเซอร์วิสของลินุกซ์โดยเฉพาะ (ใช้ Red Hat Enterprise Linux) เพื่อไม่ให้งานของเซอร์วิสไปกระทบกับภาระงานในการประมวลผลหลัก ถือเป็นการออกแบบพิเศษตามลักษณะการใช้งานของ Blue Gene/Q
  • 1 คอร์สุดท้ายมีทิ้งไว้เฉยๆ เพื่อแก้ปัญหาเรื่องอัตราความสำเร็จในการผลิต (yield rate) อธิบายง่ายๆ ว่าผลิตชิป 17 คอร์ให้ใช้ได้ 100% มันยาก ผลิตชิป 18 คอร์ที่เสียตัวนึงแล้วเหลือให้ใช้ 17 คอร์นั้นง่ายกว่ามาก

นอกจากคอร์ทั้ง 18 แล้ว ในซีพียูยังมีส่วนประกอบอื่นๆ เช่น แคช L2, memory controller โดยทุกอย่างเชื่อมกันผ่าน crossbar (xbar switch) ดูรูปประกอบกันได้ตามลิงก์

การประกอบซีพียู

อันนี้เป็นอีกประเด็นที่น่าสนใจ หลังจากได้ซีพียูมา 1 ตัวแล้ว มันจะถูกรวมกับแรม DDR3 16GB เป็น "compute card" หนึ่งแผ่น จากนั้นจะเอา compute card จำนวน 32 ชุดรวมเป็น "node card" หนึ่งอัน (ขนาดเทียบได้กับเซิร์ฟเวอร์ 1U อันนี้ผมกะขนาดด้วยสายตาคร่าวๆ)

หนึ่งตู้แร็คจะใช้ node card รวม 32 ชุด และส่วนของ I/O อีกต่างหาก จากนั้นจึงจะนำแร็คไปรวมกันเป็นซูเปอร์คอมพิวเตอร์ต่อไป (ภาพประกอบตามลิงก์)

ซูเปอร์คอมพิวเตอร์

ตอนนี้มีลูกค้าของ IBM เตรียมจะใช้ Blue Gene/Q สองราย ได้แก่

  • ห้องปฏิบัติการวิจัย Lawrence Livermore ระบบชื่อ Sequoia พลังประมวลผล 20 PetaFLOPS กำหนดเสร็จปี 2012
  • ห้องปฏิบัติการวิจัย Argonne ระบบชื่อ Mira พลังประมวลผล 10 PetaFLOPS กำหนดเสร็จปี 2012 เช่นกัน

ที่มา - The Register

Comments

By: adente
iPhoneWindows PhoneAndroidBlackberry
adente's blog
on 25/08/11 13:44 #326440 toggle
adente's picture

"•1 คอร์สุดท้ายมีทิ้งไว้เฉยๆ เพื่อแก้ปัญหาเรื่องอัตราความสำเร็จในการผลิต (yield rate) อธิบายง่ายๆ ว่าผลิตชิป 17 คอร์ให้ใช้ได้ 100% มันยาก ผลิตชิป 18 คอร์ที่เสียตัวนึงแล้วเหลือให้ใช้ 17 คอร์นั้นง่ายกว่ามาก"

ผมอ่านแล้วงงครับ ตรงนี้ = =


ในที่สุดวันนี้ก็มาถึง...

By: varavut
Windows PhoneUbuntuWindows
varavut's blog
on 25/08/11 13:51 #326445 Reply to:326440 toggle
varavut's picture

ประมาณว่าผลิตของที่สมบูรณ์ 100 % มันยากครับ เลยผลิตให้เกินไป 1 คอร์ ถึงเสียไป 1 คอร์ก็ไม่เป็นไร เช่นถ้าเราผลิต 17 คอร์ แล้วต้องการใช้ทั้ง 17 คอร์เนี่ย ของเสียก็มีตั้งแต่ เสีย 1 คอร์จนถึงเสีย 17 คอร์เลย แต่ถ้าเราผลิตเผื่อไว้ เป็น 18 คอร์ ของเสียคืออันที่เสียตั้งแต่ 2 คอร์ขึ้นไป

By: adente
iPhoneWindows PhoneAndroidBlackberry
adente's blog
on 25/08/11 14:00 #326450 Reply to:326445 toggle
adente's picture

อ้อ ขอบคุณครับ เข้าใจแล้ว


ในที่สุดวันนี้ก็มาถึง...

By: LuvStry
ContributorAndroid
LuvStry's blog
on 25/08/11 13:45 #326442 toggle
LuvStry's picture

เออเข้าใจคิด ในเมื่อ 17 คอร์มาไม่เต็ม ก็ทำ 18 มันซะเลย ถึงมาไม่เต็ม แต่ก็ได้ตั้ง 17 คอร์ :P


Blognone = 138.1 news/w เยอะมากๆ

By: AlninlA
ContributorAndroidUbuntu
AlninlA's blog
on 25/08/11 14:11 #326456 toggle
AlninlA's picture

compute card จำนวน 16 ชุดรวมเป็น "node card" หนึ่งอัน

น่าจะเป็น 32 compute card = 1 node card รึเปล่าครับ (พิจารณาจากรูป)

By: mk
FounderAndroidRed HatWindows
mk's blog
on 25/08/11 18:33 #326612 Reply to:326456 toggle
mk's picture

แก้แล้วครับ


my disclaimer

By: kitarotao
iPhoneWindows PhoneAndroidBlackberry
kitarotao's blog
on 25/08/11 14:16 #326460 toggle
kitarotao's picture

งั้นทำ 20 cores เลย ใช้ทำงาน 18 cores เหลือไว้ 2 cores

By: spicydog
ContributorAndroidUbuntuWindows
spicydog's blog
on 25/08/11 14:33 #326469 Reply to:326460 toggle
spicydog's picture

คาดว่าเขาคงมีจุด Optimize นะครับ


แนะนำ App Android ที่ผมใช้อยู่

By: neon02
Contributor
neon02's blog
on 25/08/11 14:39 #326470 toggle
neon02's picture

ก็คล้าย ๆ HDD ที่ผลิตมาที่ความจุเดียว แต่อันไหน QC ความจุสูงสุดไม่ผ่านก็ไปขายเป็นรุ่นความจุต่ำ แล้ว block พื้นที่เสียไว้

By: TeamKiller
ContributorWindows PhoneWindows
TeamKiller's blog
on 25/08/11 15:59 #326518 toggle
TeamKiller's picture

จะรู้ได้ไงว่าคอร์ไหนเสียหว่า ถ้ามันเกิดเสียจริงๆ

By: Go-Kung
Android
Go-Kung's blog
on 25/08/11 17:43 #326589 Reply to:326518 toggle
Go-Kung's picture

ผลิตเสร็จแล้วมีกระบวนการทดสอบครับ

เหมือน CPU AMD ที่มีบางรุ่นเปิด Core เพิ่มได้ แสดงว่าเป็นผลผลิตจากการผลิตรุ่นที่ Core เยอะกว่า แล้วก็เทสไม่ผ่านเลยปิดบาง Core ลดลงมาขายเป็นรุ่นต่ำ

(เช่น Phenom II x4 955 กับ Phenom II x2 555)

By: เดวิลแมน
เดวิลแมน's blog
on 25/08/11 16:20 #326535 toggle
เดวิลแมน's picture

อินเทลกำลังโหมโฆษณา 8 คอร์ เจอไอบีเอ็มเข้าไปโม้ไม่ออก

By: Go-Kung
Android
Go-Kung's blog
on 25/08/11 17:45 #326593 Reply to:326535 toggle
Go-Kung's picture

คนละตลาดกันกระมังครับ

อันนี้ Mainframe, Super Computer ที่ IBM เป็นเต้ยมาแต่ไหนแต่ไรแล้ว

ส่วน 8 Core ที่ Intel, AMD กำลังซัดกันอยู่ที่ตลาด Consumer, Server ทั่วไปนะครับ

By: godhao
Windows PhoneAndroidWindows
godhao's blog
on 25/08/11 16:43 #326555 toggle
godhao's picture

ทศกัณฐ์ยังมีแค่ 10 คอ เอง LOL

By: viroth
ContributorRed HatSUSEUbuntu
viroth's blog
on 25/08/11 18:01 #326603 Reply to:326555 toggle
viroth's picture

ทศกัณฐ์มี 1 คอ 10 เธรด(หน้า)

By: Thaina
Windows
Thaina's blog
on 25/08/11 23:07 #326718 Reply to:326603 toggle
Thaina's picture

จริงๆแล้ว ทศ แปลว่า 10 กัณฑ์ แปลว่า คอ ครับ

ไปดูดีไซจ์ทศกัณฑ์ต้นแบบแล้วจะหลอน


My Blog

By: nununu
Windows Phone
nununu's blog
on 25/08/11 16:57 #326567 toggle
nununu's picture

สงสัยจะได้เห็นการเปิดหัวกันอีก

By: mr_tawan
ContributoriPhoneAndroidWindows
mr_tawan's blog
on 25/08/11 20:04 #326646 toggle
mr_tawan's picture

จริง ๆ วิธีปิดไปคอร์นึงนี้ก็ใช้ใน IBM Cell ด้วยนะ (แต่รายนี้มี 8 คอร์ ปิดไปหนึ่ง)


By: OXYGEN2
iPhoneAndroidWindows
OXYGEN2's blog
on 25/08/11 20:41 #326664 toggle
OXYGEN2's picture

แนวคิดการผลิตคล้ายๆ AMD แต่คงจะไม่มีการเปิดหัวได้แบบ AMD


OXYGEN2's Blog

By: zinazisc
Windows PhoneAndroid
zinazisc's blog
on 25/08/11 21:18 #326678 toggle
zinazisc's picture

18 คอร์ 18 คอมเม้น

By: eol
Android
eol's blog
on 26/08/11 9:21 #326803 toggle
eol's picture

เดี๋ยวมีข่าวเปิด core แบบ AMD!!!! 555+

/me เพ้อฝัน