Blue Gene เป็นชื่อโครงการพัฒนาซูเปอร์คอมพิวเตอร์ของ IBM ซึ่งที่ผ่านมาก็มี "สถาปัตยกรรม" ซูเปอร์คอมออกมาแล้วหลายรุ่น เช่น รุ่นแรก Blue Gene/L ที่เคยโค่น Earth Simulator เป็นคอมพิวเตอร์ที่เร็วที่สุดในโลก, รุ่นสอง Blue Gene/P ที่ใช้กับซูเปอร์คอมที่เร็วที่สุดในยุโรป
ตอนนี้ IBM กำลังพัฒนาสถาปัตยกรรมรุ่นที่สาม Blue Gene/Q ซึ่งจะใช้ในซูเปอร์คอมพิวเตอร์ชื่อ Sequoia ที่มีพลังประมวลผลสูงถึง 20 PetaFLOPS (แชมป์ปัจจุบัน K Computer ของฟูจิตสึ อยู่ที่ 8.1 PetaFLOPS)
ในงานสัมมนาวิชาการด้านหน่วยประมวลผล Hot Chips เมื่อกลางเดือนสิงหาคมที่ผ่านมา วิศวกรของ IBM ได้เผยรายละเอียดซีพียูของ Blue Gene/Q ที่ออกแบบมาเป็นพิเศษ (โดยอิงอยู่บนสถาปัตยกรรม Power ของ IBM) ที่น่าสนใจคือมันมีจำนวนคอร์แปลกๆ ที่ 18 คอร์
คอร์
ซีพียูของ Blue Gene/Q จะประกอบด้วย "คอร์" ย่อยๆ ตามแนวทางการออกแบบซีพียูสมัยใหม่ โดย "คอร์" ที่ว่าจะใช้สถาปัตยกรรม Power A2 ที่ IBM สร้างขึ้นมาสำหรับอุปกรณ์เครือข่าย
คอร์ Power A2 ใช้ชุดคำสั่งแบบ 64 บิต หนึ่งคอร์มี 4 เธร็ด และแคช L1 จำนวน 32KB (แบ่งครึ่งสำหรับ data/instruction) ทำงานที่ 1.6GHz
ประเด็นที่น่าสนใจอีกอันคือ IBM เลือกจะลดความเร็วสัญญาณนาฬิกา และพลังไฟฟ้าลงที่ 0.8V เพื่อประหยัดพลังงาน ข้อเสียคือประสิทธิภาพต่อคอร์ลดลง ข้อดีคือการจ่ายไฟสม่ำเสมอกว่าเดิม และการซิงก์การทำงานของคอร์ทั้งหมดของระบบ (จำนวน 1.57 ล้านคอร์) ง่ายขึ้น ประหยัดไฟมากขึ้น
รายละเอียดเพิ่มเติมอ่านกันตามลิงก์นะครับ คงลงลึกแค่นี้
ซีพียู
ส่วนตัวซีพียูจะนำคอร์ Power A2 จำนวน 18 คอร์มารวมกัน โดยแบ่งงานกันดังนี้
- 16 คอร์สำหรับงานประมวลผลทั่วไป
- 1 คอร์สำหรับรันเซอร์วิสของลินุกซ์โดยเฉพาะ (ใช้ Red Hat Enterprise Linux) เพื่อไม่ให้งานของเซอร์วิสไปกระทบกับภาระงานในการประมวลผลหลัก ถือเป็นการออกแบบพิเศษตามลักษณะการใช้งานของ Blue Gene/Q
- 1 คอร์สุดท้ายมีทิ้งไว้เฉยๆ เพื่อแก้ปัญหาเรื่องอัตราความสำเร็จในการผลิต (yield rate) อธิบายง่ายๆ ว่าผลิตชิป 17 คอร์ให้ใช้ได้ 100% มันยาก ผลิตชิป 18 คอร์ที่เสียตัวนึงแล้วเหลือให้ใช้ 17 คอร์นั้นง่ายกว่ามาก
นอกจากคอร์ทั้ง 18 แล้ว ในซีพียูยังมีส่วนประกอบอื่นๆ เช่น แคช L2, memory controller โดยทุกอย่างเชื่อมกันผ่าน crossbar (xbar switch) ดูรูปประกอบกันได้ตามลิงก์
การประกอบซีพียู
อันนี้เป็นอีกประเด็นที่น่าสนใจ หลังจากได้ซีพียูมา 1 ตัวแล้ว มันจะถูกรวมกับแรม DDR3 16GB เป็น "compute card" หนึ่งแผ่น จากนั้นจะเอา compute card จำนวน 32 ชุดรวมเป็น "node card" หนึ่งอัน (ขนาดเทียบได้กับเซิร์ฟเวอร์ 1U อันนี้ผมกะขนาดด้วยสายตาคร่าวๆ)
หนึ่งตู้แร็คจะใช้ node card รวม 32 ชุด และส่วนของ I/O อีกต่างหาก จากนั้นจึงจะนำแร็คไปรวมกันเป็นซูเปอร์คอมพิวเตอร์ต่อไป (ภาพประกอบตามลิงก์)
ซูเปอร์คอมพิวเตอร์
ตอนนี้มีลูกค้าของ IBM เตรียมจะใช้ Blue Gene/Q สองราย ได้แก่
- ห้องปฏิบัติการวิจัย Lawrence Livermore ระบบชื่อ Sequoia พลังประมวลผล 20 PetaFLOPS กำหนดเสร็จปี 2012
- ห้องปฏิบัติการวิจัย Argonne ระบบชื่อ Mira พลังประมวลผล 10 PetaFLOPS กำหนดเสร็จปี 2012 เช่นกัน
ที่มา - The Register
on
"•1 คอร์สุดท้ายมีทิ้งไว้เฉยๆ
adente Thu, 25/08/2011 - 14:44
"•1 คอร์สุดท้ายมีทิ้งไว้เฉยๆ เพื่อแก้ปัญหาเรื่องอัตราความสำเร็จในการผลิต (yield rate) อธิบายง่ายๆ ว่าผลิตชิป 17 คอร์ให้ใช้ได้ 100% มันยาก ผลิตชิป 18 คอร์ที่เสียตัวนึงแล้วเหลือให้ใช้ 17 คอร์นั้นง่ายกว่ามาก"
ผมอ่านแล้วงงครับ ตรงนี้ = =
ประมาณว่าผลิตของที่สมบูรณ์
varavut Thu, 25/08/2011 - 14:51
In reply to "•1 คอร์สุดท้ายมีทิ้งไว้เฉยๆ by adente
ประมาณว่าผลิตของที่สมบูรณ์ 100 % มันยากครับ เลยผลิตให้เกินไป 1 คอร์ ถึงเสียไป 1 คอร์ก็ไม่เป็นไร
เช่นถ้าเราผลิต 17 คอร์ แล้วต้องการใช้ทั้ง 17 คอร์เนี่ย ของเสียก็มีตั้งแต่ เสีย 1 คอร์จนถึงเสีย 17 คอร์เลย
แต่ถ้าเราผลิตเผื่อไว้ เป็น 18 คอร์ ของเสียคืออันที่เสียตั้งแต่ 2 คอร์ขึ้นไป
อ้อ ขอบคุณครับ เข้าใจแล้ว
adente Thu, 25/08/2011 - 15:00
In reply to ประมาณว่าผลิตของที่สมบูรณ์ by varavut
อ้อ ขอบคุณครับ เข้าใจแล้ว
เออเข้าใจคิด ในเมื่อ 17
LuvStry Thu, 25/08/2011 - 14:45
เออเข้าใจคิด ในเมื่อ 17 คอร์มาไม่เต็ม ก็ทำ 18 มันซะเลย ถึงมาไม่เต็ม แต่ก็ได้ตั้ง 17 คอร์ :P
compute card จำนวน 16
AlninlA Thu, 25/08/2011 - 15:11
น่าจะเป็น 32 compute card = 1 node card รึเปล่าครับ (พิจารณาจากรูป)
แก้แล้วครับ
mk Thu, 25/08/2011 - 19:33
In reply to compute card จำนวน 16 by AlninlA
แก้แล้วครับ
งั้นทำ 20 cores เลย ใช้ทำงาน
kitarotao Thu, 25/08/2011 - 15:16
งั้นทำ 20 cores เลย ใช้ทำงาน 18 cores เหลือไว้ 2 cores
คาดว่าเขาคงมีจุด Optimize
spicydog Thu, 25/08/2011 - 15:33
In reply to งั้นทำ 20 cores เลย ใช้ทำงาน by kitarotao
คาดว่าเขาคงมีจุด Optimize นะครับ
ก็คล้าย ๆ HDD
neon02 Thu, 25/08/2011 - 15:39
ก็คล้าย ๆ HDD ที่ผลิตมาที่ความจุเดียว แต่อันไหน QC ความจุสูงสุดไม่ผ่านก็ไปขายเป็นรุ่นความจุต่ำ แล้ว block พื้นที่เสียไว้
จะรู้ได้ไงว่าคอร์ไหนเสียหว่า
TeamKiller Thu, 25/08/2011 - 16:59
จะรู้ได้ไงว่าคอร์ไหนเสียหว่า ถ้ามันเกิดเสียจริงๆ
ผลิตเสร็จแล้วมีกระบวนการทดสอบ
Go-Kung Thu, 25/08/2011 - 18:43
In reply to จะรู้ได้ไงว่าคอร์ไหนเสียหว่า by TeamKiller
ผลิตเสร็จแล้วมีกระบวนการทดสอบครับ
เหมือน CPU AMD ที่มีบางรุ่นเปิด Core เพิ่มได้ แสดงว่าเป็นผลผลิตจากการผลิตรุ่นที่ Core เยอะกว่า แล้วก็เทสไม่ผ่านเลยปิดบาง Core ลดลงมาขายเป็นรุ่นต่ำ
(เช่น Phenom II x4 955 กับ Phenom II x2 555)
อินเทลกำลังโหมโฆษณา 8 คอร์
เดวิลแมน Thu, 25/08/2011 - 17:20
อินเทลกำลังโหมโฆษณา 8 คอร์ เจอไอบีเอ็มเข้าไปโม้ไม่ออก
คนละตลาดกันกระมังครับ อันนี้
Go-Kung Thu, 25/08/2011 - 18:45
In reply to อินเทลกำลังโหมโฆษณา 8 คอร์ by เดวิลแมน
คนละตลาดกันกระมังครับ
อันนี้ Mainframe, Super Computer ที่ IBM เป็นเต้ยมาแต่ไหนแต่ไรแล้ว
ส่วน 8 Core ที่ Intel, AMD กำลังซัดกันอยู่ที่ตลาด Consumer, Server ทั่วไปนะครับ
ทศกัณฐ์ยังมีแค่ 10 คอ เอง LOL
godhao Thu, 25/08/2011 - 17:43
ทศกัณฐ์ยังมีแค่ 10 คอ เอง LOL
ทศกัณฐ์มี 1 คอ 10 เธรด(หน้า)
viroth Thu, 25/08/2011 - 19:01
In reply to ทศกัณฐ์ยังมีแค่ 10 คอ เอง LOL by godhao
ทศกัณฐ์มี 1 คอ 10 เธรด(หน้า)
จริงๆแล้ว ทศ แปลว่า 10 กัณฑ์
Thaina Fri, 26/08/2011 - 00:07
In reply to ทศกัณฐ์มี 1 คอ 10 เธรด(หน้า) by viroth
จริงๆแล้ว ทศ แปลว่า 10 กัณฑ์ แปลว่า คอ ครับ
ไปดูดีไซจ์ทศกัณฑ์ต้นแบบแล้วจะหลอน
สงสัยจะได้เห็นการเปิดหัวกันอี
nununu Thu, 25/08/2011 - 17:57
สงสัยจะได้เห็นการเปิดหัวกันอีก
จริง ๆ
mr_tawan Thu, 25/08/2011 - 21:04
จริง ๆ วิธีปิดไปคอร์นึงนี้ก็ใช้ใน IBM Cell ด้วยนะ (แต่รายนี้มี 8 คอร์ ปิดไปหนึ่ง)
แนวคิดการผลิตคล้ายๆ AMD
OXYGEN2 Thu, 25/08/2011 - 21:41
แนวคิดการผลิตคล้ายๆ AMD แต่คงจะไม่มีการเปิดหัวได้แบบ AMD
18 คอร์ 18 คอมเม้น
zinazisc Thu, 25/08/2011 - 22:18
18 คอร์ 18 คอมเม้น
เดี๋ยวมีข่าวเปิด core แบบ
eol Fri, 26/08/2011 - 10:21
เดี๋ยวมีข่าวเปิด core แบบ AMD!!!! 555+
/me เพ้อฝัน