Xeon Phi

Xeon Phi
生産時期	2012年11月から
生産者	インテル
プロセスルール	22nm から 14nm
アーキテクチャ	x86
命令セット	Intel 64
コア数	57から72; （スレッド数：228から288）
ソケット	LGA3647
コードネーム	Knights Corner; Knights Landing; Knights Mill
前世代プロセッサ	Larrabee
	テンプレートを表示

Xeon > Xeon Phi

Xeon Phi（ジーオンファイ^[1]）は、インテルが販売しているLarrabee（社内コード）より派生したMICアーキテクチャ (Many Integrated Core)^[2]ベースのHPC向けコプロセッサ（後にプロセッサバージョンも追加）のブランド名である。

概要

Xeon Phiファミリーはx86互換のメニーコア・コプロセッサを搭載した、並列コンピューティング用の演算ボードである。第一製品群のターゲットはHPC分野であるが、将来的には企業のデータセンター、ワークステーションなどにも対応する。Xeon Phiコプロセッサは従来のIA-32/Intel 64アーキテクチャ向けアプリケーションをそのまま使うことができることが最大の売りである。そのほかにもホストOSから独立したLinuxベースのOSを動作させることができる。製品はPCI Expressで接続される^[1]。

世代

第1世代

Knights Corner

第1世代 Xeon Phi。2012年 11月13日発表^[3]。製造プロセスは22nm Tri-Gateトランジスタを採用している（Ivy Bridgeと同一の製造プロセス）。インテルXeonプロセッサーE5ファミリーと組み合わせることで、カードあたり倍精度浮動小数点演算で1TFLOPS以上の理論性能がある。本製品はPCI Express形式の拡張カードで供給され、純粋に演算用であって、ラスタライザやビデオ再生エンジン、ディスプレイ出力は存在しない。

本製品の競合相手はNVIDIAのHPC向けGPUであるNVIDIA Tesla、およびAMDのHPC向けGPUであるAMD FirePro (FirePro Sシリーズ^[4]、旧称AMD FireStream) となる。Xeon Phiの強みはコアがx86であるために、x86 CPU向けに記述されたプログラムをほぼそのまま利用できる点である。またPCI Expressで接続されているが、本製品の内部にはスタンドアロン型のLinuxが常駐しており、SSHを使ってホストからログインすることができる。これは独立したOSを動作させられないGPGPUでは不可能である。勿論GPGPUと同様、オフロード計算をさせる動作も可能である。

SIMD命令は512ビットであり、倍精度浮動小数点数を8つ同時に扱うことができ、また FMA をサポートしているため、16 FLOPS/cycle である^[5]。なお同時期に発売されたHaswellのIntel AVX2は256ビットであり、同時に扱うことができる倍精度浮動小数点数は4つだが、FMAを2つ同時に計算できるため、同じく 16 FLOPS/cycle である^[6]。

PCI Express は Gen2.0 x16（片方向あたり8GB/s）。

2012年6月当時、44社のメーカーがロードマップへの組み込みを表明していた^[1]。

2017年1月にEnd of Lifeとなった。Intel Math Kernel Library のサポートも 2017 Update 4^[7]で終了した。

以下のプロセッサーオプションがある。
- -X: PCI Express接続
- -P: PCI Express接続、ヒートシンク付き
- -A: PCI Express接続、アクティブファン内蔵
- -D: SFF接続

Knights Corner
型番	CPU				TDP (W)	内蔵メモリ
	コア数（スレッド数）	クロック (GHz)		L2キャッシュ (MB)		規格	容量 (GB)
	コア数（スレッド数）	定格	ターボ	L2キャッシュ (MB)		規格	容量 (GB)
7120A	61 (244)	1.24	1.33	30.5	300	GDDR5	16
7120P
7120X
7120D					270
SE10P		1.1	N/A		300		8
SE10X		1.1			300
5120D	60 (240)	1.05		30	245
5110P	60 (240)	1.05		30	225
31S1P	57 (228)	1.1		28.5	270
3120A					300		6
3120P					300		6

Xeon Phi 5110P: 2012年 11月13日発表、2013年 1月28日発売。Tri-Gateトランジスタを採用し22nmで製造された製品である。60コア、動作クロックは1.053GHz。倍精度浮動小数点演算の理論性能値は1.011TFLOPS。搭載されるメモリーはGDDR5の8GBで帯域幅は320GB/sである。TDPは225W。5110Pが導入されるシステムにおいてはラック単位での冷却がなされることが想定されているため、カード本体には冷却用の回転ファン機構は存在していない。ホストバスはPCIe2.0であるが、転送レートが高速化されているのでPCIe3.0による接続と性能にあまり変わりはない。コアあたりのL2キャッシュは512KBで、チップ全体でのL2キャッシュの総量は30MBである。メモリーインターフェイスは32bit幅で動作しており、合計で512bit幅である。補助電源コネクタは8ピン+6ピン構成。
Xeon Phi 5120D, 3120P, 3120A, 7120P, 7120X: 2013年 6月18日発売開始。
Xeon Phi 31S1P: 2013年第2四半期に発売。中国のスーパーコンピュータシステム「天河2」に用いられた。

第2世代

Knights Landing

第2世代 Xeon Phi。2016年 6月20日発表^[8]^[9]^[10]。単精度で 6 TFLOPS 以上、倍精度で 3 TFLOPS 以上になった。プロセスルールは14nm。Atom の Silvermont ベースになった^[11]。

型番の末尾にFがつくものはインターコネクトの Intel Omni-Path Fabric を搭載。

ソケットは LGA3647 だが、通常の Xeon との互換性はなく、Xeon Phi 専用のマザーボードでなければ動作しない（物理的にソケットにはまらない）。

オンチップメモリは L3 キャッシュとしても利用できるし、アドレスを割り振り通常のメモリとしても利用可能。7.2 GT/s のもので実測で 490 GB/s になる^[12]。

1コアあたり、4スレッド実行可能で、2つのベクターALU（512ビット）、2つのスカラーALU、1つのレガシーx87 ALUを搭載している^[9]。よって72コア、1.5 GHzで、単精度は 512 bit / 32 bit * 2 ALU * 2 op * 72 core * 1.5 GHz = 6912 GFLOPS になる。

Knights Landing で採用される512ビット SIMD命令はAVX-512として定義されたものになるが、これはそれまでのKnights Cornerが用いていた「512ビットSIMD演算」とは機械語命令形式が異なり互換では無い^[13]。

PCI Express は Gen3.0 x16 (片方向あたり16GB/s)。

対応ソケット: LGA3647

Knights Landing
型番	CPU				TDP (W)	内蔵メモリ		対応メモリ
	コア数（スレッド数）	クロック (GHz)		L2キャッシュ (MB)		規格	容量 (GB)
	コア数（スレッド数）	定格	ターボ	L2キャッシュ (MB)		規格	容量 (GB)
7290F	72 (288)	1.5	1.7	36	260	MCDRAM	16	DDR4-2400
7290	72 (288)	1.5	1.7	36	245
7250F	68 (272)	1.4	1.6	34	230
7250	68 (272)	1.4	1.6	34	215
7230F	64 (256)	1.3	1.5	32	230
7230					215
7210F					230			DDR4-2133
7210					215			DDR4-2133

Knights Mill

2017年 12月18日^[14]^[15]発表^[16]。Knights Landing をディープラーニング向けに改良。Intel AVX-512のサポートを拡張し、AVX512_4FMAPS、AVX512_4VNNI、AVX512_VPOPCNTDQをサポートした^[16]。FP32やINT16の演算を高速化している^[17]。x200 よりも FP32 の行列積での演算が2倍^[18]高速になった。

なお、Knights Millの後継としてKnights Hillが予定されていた^[11]^[19]^[20]が、キャンセルされた^[21]。

対応ソケット: LGA3647

Knights Mill
型番	CPU				TDP (W)	内蔵メモリ		対応メモリ
	コア数（スレッド数）	クロック (GHz)		L2キャッシュ (MB)		規格	容量 (GB)
	コア数（スレッド数）	定格	ターボ	L2キャッシュ (MB)		規格	容量 (GB)
7295	72 (288)	1.5	1.6	36	320	MCDRAM	16	DDR4-2400
7285	68 (272)	1.3	1.4	34	250
7255	68 (272)	1.1	1.2	34	215
7235	64 (256)	1.3	1.4	32	250			DDR4-2133

脚注

[脚注の使い方]

参考資料

英語

Rezaur Rahman: "Intel Xeon Phi Coprocessor Architecture and Tools", Apress, ISBN 978-1-4302-5926-8 (2013/09/02).
Jim Jefferes, James Reinders: "Intel Xeon Phi Coprocessor High-Performance Programming", Morgan Kaufmann, ISBN 978-0-12-410414-3 (2013/03/01).
Andrey Vladimirov, Vadim Karpusenko: "Parallel Programming and Optimization with Intel Xeon Phi Coprocessors", Colfax International, ISBN 978-0-9885234-1-8 (2013).
Endong Wang, Qing Zhang: "High-Performance Computing on the Intel Xeon Phi:How to Fully Exploit MIC Architectures", Springer, ISBN 978-3319064857 (2014/07/11).
James Reinders, Jim Jeffers: "High Performance Parallelism Pearls: Multicore and Many-core Programming Approaches", Morgan Kaufmann, ISBN 978-0128021187 (2014/11/17).

日本語

ジム・シェファース、ジェームズ・レインダース:「インテルXeon Phi コプロセッサー　ハイパフォーマンス・プログラミング」, カットシステム, ISBN 978-4-87783-332-9 (2014年1月10日).

外部リンク

この項目は、コンピュータに関連した書きかけの項目です。この項目を加筆・訂正などしてくださる協力者を求めています（PJ:コンピュータ/P:コンピュータ）。

[nr20160618-1] “インテルコーポレーション、インテル® MIC アーキテクチャーに基づく新ブランド“インテル® Xeon® Phi™”を発表”. Intel. 2017年1月16日閲覧。

[2] 株式会社HPCソリューションズ　～　技術情報インテル®MICアーキテクチャー対応について intel-MIC Xeon Phi

[3] “インテルが発表したメニーコア時代のコプロセッサ「Xeon Phi」”. 2025年2月1日閲覧。

[4] FirePro Server - 製品情報 - 株式会社エーキューブ

[5] Intel® Xeon Phi™ Coprocessor - the Architecture | Intel® Developer Zone

[6] HPC性能が大幅に強化されたHaswell(前編) -各コアに256bit長のFMAを2個装備 | マイナビニュース

[7] Intel® Math Kernel Library (Intel® MKL) 2018 Release Notes | Intel® Software

[8] Intel、機械学習に特化した72コアのXeon Phiを投入～x86動作のブータブルCPUを初搭載 - PC Watch

[pcwatch1008665-9] 【後藤弘茂のWeekly海外ニュース】ホモジニアスな構成が可能な新生Xeon Phi「Knights Landing」の強味 - PC Watch

[10] Intelがスパコンカンファレンスで「Knights Landing」を正式発表(2016年6月22日)

[mynavi20141117-11] Intel、Knights Landingの詳細とKnights Hillの存在を発表 | マイナビニュース

[12] Intel® Xeon Phi Processor: Your Path to Deeper Insight

[13] What public disclosures has Intel made about Knights Landing?

[14] Knights Mill - Microarchitectures - Intel - WikiChip

[15] Нови процесори Xeon Phi ускоряват дълбокото обучение | TechNews.bg

[impress_1098223-16] Intel、TDP 320Wに達した72コアのx86プロセッサ「Xeon Phi 7295」 - PC Watch

[17] Hot Chips 29 - Intelのマシンラーニング向けプロセサ「Knights Mill」 | マイナビニュース

[18] Intel Lists Knights Mill Xeon Phi on ARK: Up to 72 cores at 320W with QFMA and VNNI

[19] “Intel，第3世代Xeon Phi「Knights Hill」の存在を明らかに”. 2024年12月1日閲覧。

[20] “10nm採用のXeon Phi「Knights Hill」の開発は予定通り - Intel”. 2024年12月1日閲覧。

[21] “コードネーム“Knights Hill”こと第3世代Xeon Phiが開発中止”. 2024年12月1日閲覧。

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]


生産時期	2012年 11月から
生産者	インテル
プロセスルール	22nm から 14nm
アーキテクチャ	x86
命令セット	Intel 64
コア数	57から72 （スレッド数：228から288）
ソケット	LGA3647
コードネーム	Knights Corner Knights Landing Knights Mill
前世代プロセッサ	Larrabee
テンプレートを表示

Xeon Phi

概要

世代

第1世代

第2世代

脚注

参考資料

英語

日本語

関連項目

外部リンク