สินค้าของอินเทลในตระกูล Xeon Phi ก่อนหน้านี้จะเป็นการ์ดเสริมสำหรับคอมพิวเตอร์สำหรับย้ายงานที่ต้องประมวลผลขนานกันมากๆ ออกไปยังการ์ดภายนอก แต่ Xeon Phi รุ่น Knights Landing (KNL) จะเป็นซีพียูประสิทธิภาพสูงในตัวทำงานแยกเป็นคอมพิวเตอร์โดยไม่ต้องการซีพียูหลักอีกต่อไป หลังจากเปิดตัวมาตั้งแต่ปี 2013 ตอนนี้ KNL ก็วางขายแล้วจากเดิมที่กำหนดวางตลาดไว้ปี 2014-2015
KNL จะมีแรม 16GB ในตัวชิปทุกรุ่น และเพิ่มหน่วยความจำภายนอก DDR4 ได้อีกสูงสุด 384GB ตัวชิปอย่างเดียวมีสเปคปล่อยความร้อนที่ 215-245 วัตต์ ซีพียูเริ่มต้นที่ 64 คอร์ รวม 256 เธรด ไปจนถึง 72 คอร์ 288 เธรด ชิปบางรุ่นในกลุ่ม KNL จะมีรูปร่างประหลาดเพราะมีพอร์ต Omni-Path ยื่นออกมากจากตัวชิป โดยฟีเจอร์นี้จะเริ่มวางตลาดเดือนตุลาคมนี้ และเลขชิปล้อกับรุ่นปกติไป เช่น รุ่นเล็กสุดคือ Xeon Phi 7210 รุ่นมี Omni-Path ก็จะเป็น Xeon Phi 7210F
ราคาเริ่มต้นที่ 2,438 ดอลลาร์ (ประมาณ 85,000 บาท) ไปจนถึง 6,254 ดอลาร์ (ประมาณ 220,000 บาท) ไม่แน่ชัดว่าราคานี้เป็นชิปรุ่นมี Omni-Path ในตัวหรือไม่ เพราะในเว็บรายละเอียดสินค้าระบุว่าชิปรุ่นที่เปิดตัวออกมาตอนนี้ไม่มี Omni-Path แต่ในการนำเสนอระบุว่าทุกรุ่นที่เปิดตัวมี Omni-Path
อินเทลคาดว่าชิปแต่ละตัวจะมีพลังประมวลผลสูงกว่า 3 TFLOPS ที่ double precision ยังแพ้ NVIDIA Tesla P100 ที่ทำได้ 5 TFLOPS แต่ P100 เองก็มีสเปคการปล่อยความร้อนไปถึง 300 วัตต์ และราคาการ์ดในตระกูล Tesla เองก็มักจะแพงกว่า 5,000 ดอลลาร์ อินเทลจึงไม่ได้ชูประเด็นพลังประมวลผลต่อชุดนัก แต่ชูจุดเด่น ประสิทธิภาพการประมวลผลต่อพลังงาน (5 เท่าเทียบกับ Tesla K80) ประสิทธิภาพประมวลผลต่อราคา (9 เท่าเทียบกับ Tesla K80) และความสามารถในการสเกลระบบขนาดใหญ่ว่ามีประสิทธิภาพดีกว่าถึง 32% เมื่อสเกลไปถึง 32 โหนด
อินเทลระบุว่าตอนนี้ส่งมอบชิปไปแล้วหลายหมื่นชุด และคาดว่าภายในสิ้นปีนี้จะขายได้มากกว่าแสนชุด เฉพาะทาง Cray ก็ออกมาระบุว่ากำลังส่งมอบเครื่อง Cori ให้กับ Lawrence Berkeley National Laboratory ในปีหน้าโดยเครื่อง Cori จะติดตั้ง KNL ทั้งหมด 9,300 ตัว
ที่มา - Intel
Comments
ซีพีู => ซีพียู
ซีพียูสำเร็จสูง ?
ผมอ่านตอนแรกเป็นรุ่น King's Landing
สงสัยช่วงนี้อิน Games of Thrones ไปหน่อย = =
หากเอามาดัดแปลงให้ใช้บน PC หรือ Notebook ผ่าน mPCI/Express Card/PCI-E/USB3 และนำ CPU ตระกูล Intel Core/ARM/ตระกูลอื่นๆ มาใช้งานร่วมกันด้วยได้ก็น่าจะดีเหมือนกัน (เหมือน Apple ทำตอนสมัย PowerPC)
ไม่ต้องพึ่ง Emulator หรือ Binary Translation เวลาใช้งานระบบต่าง Architecture ในอนาคต
Get ready to work from now on.
Xeon Phi ตัวอื่นมาเป็นการ์ดPCI-Eเสียบกับ บอร์ดทั่วไปได้อยู่แล้วครับและมันก็เป็น x86 แค่จะทำแบบนั้นเพื่อเอาไปเล่นเกมหรอ?!?
มีไว้ทำ Multi-PC เปิดเครื่องเดียวใช้ได้ 2 คน หรือทำ Virtualization ก็ได้อีก
และถ้ามีชิพ ARM/MIPS หรือตระกูลอื่นๆ มาใส่ด้วย จะช่วยในการเขียนโปรแกรมหรือใช้งานแอพฯ ที่ไม่มีบน x86 ได้ด้วยไงครับ (ประมาณเปิด Android Native บน PC ผ่านการ์ด Processor) ไม่ต้องใช้ CPU ในเครื่องมาทำ Binary Translation ให้เครื่องอืด ต่างคนต่างประมวลผลไป
Get ready to work from now on.
ที่ไม่มีใครทำ multi-architecture เพราะถ้าไม่ใช่งานเฉพาะจริงๆ CPU ที่ต่าง architecture จะกลายเป็นขยะไปครับ
การทำ binary translation ไม่ได้ทำให้เครื่อง(host)อืดครับ สิ่งที่ทำให้อืดคือการใช้ CPU timing เยอะๆจนไม่มีเวลาไปประมวลงานอย่างอื่นมากกว่า ซึ่งตรงจุดนี้ CPU ในยุคปัจจุบันมีจำนวนคอร์จำนวนมาก ทำให้เราสามารถ assign งาน virtualization แต่ละตัวไปให้แต่ละคอร์ได้อยู่แล้ว
ดังนั้นถ้าจะทำ x86_64*4 + ARMv8*4 ก็ทำ x86_64*6 หรือ *8 (ซึ่งมีอยู่แล้วในปัจจุุบัน) ดีกว่าครับ
Russia is just nazi who accuse the others for being nazi.
someone once said : ผมก็ด่าของผมอยู่นะ :)
อืม แต่ก็ยังมีปัญหาตรงที่โปรแกรมต่างสถาปัตยกรรม พอเอามาทำงานบนเครื่องคอมฯ มันจะทำงานได้ช้าเพราะ BT เนี่ยหละครับ ก็เลยคิดว่าถ้าเป็นไปได้ก็เอามารวมกันเลยจะดีกว่า แยกกันทำงานไป ไม่ต้องมาเป็นภาระให้ CPU หลักเพียงอย่างเดียว
แต่ผมคิดว่าแนวคิดผมอาจจะดีกับอุปกรณ์พกพา อย่างมือถือหรือแทปเล็ต ยกตัวอย่างเช่นแอพ UWP ของไมโครซอฟท์ที่แม้จะออกแบบมาให้ใช้ได้กับทุกแพลตฟอร์มก็ยังมีข้อจำกัดอยู่ดี
สมมุติว่าผมมีมือถือและต้องการใช้แอพฯ UWP ที่ทำงานได้เฉพาะบน x86 เท่านั้นอย่าง PC ส่วนมือถือที่ใช้เป็น ARM ก็สามารถใช้งานได้เลยบนมือถือ ไม่ต้องเสียเวลาหาคอมมาใช้งาน หรือกรณี Zenfone ที่มือถือเป็น X86 แต่มีผลให้แอพฯ Android บางตัวทำงานไม่ได้ ส่วนนี้ก็น่าจะเข้ามาช่วยได้ ประมาณนี้ครับ
Get ready to work from now on.
UWP ไม่เกี่ยวกับ architecture ครับ ตัวมันเอง compile ได้ทุก architecture อยู่แล้ว ปัญหาของมันคือ API sets ที่มีไม่เท่ากันในแต่ละอุปกรณ์ต่างหาก
Atom บนมือถือ(ที่ Intel ประกาศว่าไม่ทำแล้ว) แทนที่จะมาทำ Atom+v8 ก็สู้ทำ v8 ไปแบบเดียวเลยง่ายกว่าเยอะครับ
ตัว Android emulators บน PC ในปัจจุบันนั้นเป็น native x86 runtime เกือบหมดแล้วครับ ตัว Android Runtime เองก็รองรับ multi-architecture อยู่แล้ว ส่วนเกมที่มีปัญหาเรื่อง native นั้นก็เป็นปัญหาด้าน after-compiled-run-time(ซึ่ง Atom ก็ออกจากตลาดไปแล้ว) ครับ ไม่ใช่ด้าน developing-time
ที่คุณพูดถึงยุค Apple PowerPC -> x86 ยุคนั้น Apple เองก็ใช้ binary translation นะครับ ไม่ใช่ multi-architecture
เอาจริงๆตลาดการใช้ multi-architecture CPU มัน niche มากๆจนแทนที่จะทำแบบนั้นก็หันมาทำ compiler ที่รองรับหลาย architecture แทนดีกว่าครับ
คำว่าแยกกันทำงาน กับ CPU หลักนี่คาดว่าไม่น่าใช่นะครับ อย่างที่บอกครับปัจจุบัน CPU(หลัก) มีหลาย core แทนที่จะทำ x86(core0-core3) แล้วมี ARM(core4-core7) ไว้ทำ virtualization ก็ทำ x86(core0-core3) + x86(core4-core7) ไว้ทำ virtualization ดีกว่าเยอะครับ เพราะในขณะที่คุณไม่ได้ทำ virtualization ก็ยังสามารถ utilize core0-core7 ได้เต็มที่อยู่ดี
Russia is just nazi who accuse the others for being nazi.
someone once said : ผมก็ด่าของผมอยู่นะ :)
ขอบคุณมากสำหรับความรู้ครับ ได้เห็นเยอะพอสมควรจริงๆ
Get ready to work from now on.
ชื่ออย่างกับ Game of Thrones