

■Xeon ワークステーション
ZEUS WS/Xeon E5 dual v3
●スペック:
CPU:Intel(R) Xeon(R) CPU E5-2630 v3 2.40GHz (8C 16T 3.19GHz, 3.2GHz IMC, 8x 256kB L2, 20MB L3) x2
CPUクーラー:APSALUS3 120 x2
MB:ASUS Z10PA-D8
メモリ:Micron 8GB Registered-ECC DIMM DDR4 PC4-17100R x4(32GB)
グラフィックス:Aspeed AST2400 with 32MB VRAM(オンボード)
ストレージデバイス:
Western Digital WDC WD30EFRX-:3TB (C:)
HL-DT-STDVDRAM GH24NSC0(E:)
サウンド:SB-AGY-FX Sound Blaster Audigy Fx PCIEX
電源:850W Silver Stone SST-ST85F-P
ベンチマークの結果はこのスペックで計測したものです。

ここでは、Xeonとその比較としてCore i7のベンチマークを取ってみました。
Core i7のスペックは以下のとおりです。
CPU:Intel(R) Core(TM) i7-4790K CPU @ 4.00GHz
MB:ASUS MAXIMUS VII RANGER
メモリ:G.Skill F3-2133C9-8GXH 8GB DIMM DDR3 PC3-17100U DDR3-2134 x2
NVIDIA GeForce GT 740 (2CU 384SP SM5.0

CG用ワークステーションとしての評価は、定番のCINEBENTIで行いました。
デュアルXeon:2018cb――i7-4790K:779cb
CPU性能比較なので、OpenGLは割愛して、デュアルXeonが約3倍近くのスコアを出しています。
クロックは2.40GHz――4.00GHzとi7-4790Kのほうが速いのですが、やはりコア数の差が如実に出ています。


CPUの性能評価では定番のSiSoftware Sandra Liteでも比較してみました。
もちろん、ほとんどの項目ではデュアルXeonの圧勝ですが、実はスレッドあたりのスコアでは、i7-4790Kの方が勝っています。
これはクロックの差と思われますが、やはり総合性能となると、コア数の多さがものを言うのでしょう。
Sandraは、実に多彩な業務向けのベンチマークを含んでいますが、膨大な量のデータになりますので、今回は当店のお客様――クリエイター、研究者、ネットワーク関係のシステム開発、運用をされている方向けに内容を絞りました。
あと、省電力管理の効率という項目もありましたが、デュアルXeonはいずれも0ということで、この結果がをどう読み取ればいいのかわかりませんが、省電力はあまり期待できないと考えて良さそうです。
すべて0ということで、ベンチマークの結果は割愛させていただきました。
双方の赤いチャートが該当部分。今回メモリは比較対象外。
プロセッサの性能(マルチスレッディング(MT) | |||
デュアルxeon E5-2630 v3 |
Core i7-4790K | 単位 | |
< ベンチマークの結果 > | |||
総合的なネイティブ パフォーマンス | 322.6 | 138.59 | GOPS |
Dhrystone 整数 AVX2: | 451.65 | 193.16 | GIPS |
Whetstone 浮動小数点 AVX: | 277.74 | 119.12 | GFLOPS |
Whetstone 倍精度 FP64 AVX: | 191.17 | 83 | GFLOPS |
< スレッドあたりの性能 > | |||
総合的なネイティブ パフォーマンス: | 10.08 | 17.32 | GOPS |
Dhrystone 整数 AVX2: | 14.11 | 24.15 | GIPS |
Whetstone 浮動小数点 AVX: | 8.68 | 14.89 | GFLOPS |
Whetstone 倍精度 FP64 AVX: | 6 | 10.38 | GFLOPS |
スレッドの数: 32 | 32 | 8 | |
< パフォーマンス対速度 > | |||
総合的なネイティブ パフォーマンス | 101.07 | 31.51 | MOPS/MHz |
Dhrystone 整数 AVX2: | 141.49 | 43.92 | MIPS/MHz |
Whetstone 浮動小数点 AVX: | 87.01 | 27.08 | MFLOPS/MHz |
Whetstone 倍精度 FP64 AVX: | 59.89 | 18.87 | MFLOPS/MHz |
これはCPUの基本性能を測るのが目的で、当然のようにコア数の多い方が勝っています。
スレッドあたりの性能ではi7の勝ちですが、これは単純にクロック数の差といえるでしょう。スレッド数は32vs8になりますが、それだけのスレッドでやっと2倍速がマークできたので、スピード重視の方は、できるだけコア数の多いものを選ばれるといいでしょう。
マルチメディア処理(マルチスレッディング(MT)) | |||
デュアルxeon E5-2630 v3 |
Core i7-4790K | 単位 | |
< ベンチマークの結果 > | |||
総合的な マルチメディア のパフォーマンス | 351.24 | 295.23 | Mピクセル/秒 |
マルチメディア 整数 x32 AVX2: | 372.2 | 339 | Mピクセル/秒 |
集計マルチメディア長期整数 x16 AVX2: | 323.79 | 144.15 | Mピクセル/秒 |
集計マルチメディアクアッド整数 x1 ALU: | 5 | 2.25 | Mピクセル/秒 |
マルチメディア 浮動小数点 x16 FMA: | 387.1 | 318.54 | Mピクセル/秒 |
マルチメディア 倍精度 FP64 x8 FMA: | 300.77 | 238.3 | Mピクセル/秒 |
マルチメディア 浮動小数点/クワッド x2 FMA: | 21.35 | 9 | Mピクセル/秒 |
< 総合的な マルチメディア のパフォーマンス > | |||
集計マルチメディア整数: | 347.15 | 221 | Mピクセル/秒 |
集計マルチメディア浮動小数点: | 341.21 | 275.52 | Mピクセル/秒 |
< スレッドあたりの性能 > | |||
総合的な マルチメディア のパフォーマンス | 11 | 36.9 | Mピクセル/秒 |
マルチメディア 整数 x32 AVX2: | 11.63 | 42.37 | Mピクセル/秒 |
集計マルチメディア長期整数 x16 AVX2: | 10.12 | 18 | Mピクセル/秒 |
集計マルチメディアクアッド整数 x1 ALU: | 157 | 281 | kピクセル/秒 |
マルチメディア 浮動小数点 x16 FMA: | 12.1 | 39.82 | Mピクセル/秒 |
マルチメディア 倍精度 FP64 x8 FMA: | 9.4 | 29.79 | Mピクセル/秒 |
マルチメディア 浮動小数点/クワッド x2 FMA: | 0.667 | 1.13 | Mピクセル/秒 |
< パフォーマンス対速度 > | |||
総合的な マルチメディア のパフォーマンス | 110.04 | 67.13 | kピクセル/秒/MHz |
マルチメディア 整数 x32 AVX2: | 116.6 | 77.08 | kピクセル/秒/MHz |
集計マルチメディア長期整数 x16 AVX2: | 101.44 | 32.78 | kピクセル/秒/MHz |
集計マルチメディアクアッド整数 x1 ALU: | 1.58 | 0.51 | kピクセル/秒/MHz |
マルチメディア 浮動小数点 x16 FMA: | 121.27 | 72.43 | kピクセル/秒/MHz |
マルチメディア 倍精度 FP64 x8 FMA: | 94.23 | 54.19 | kピクセル/秒/MHz |
マルチメディア 浮動小数点/クワッド x2 FMA: | 6.69 | 2.05 | kピクセル/秒/MHz |
単位がピクセル/秒になっているのを見ておわかりのように、画像系処理のテストです。当店で最も需要が多いと思われるクリエイター向けワークステーションをご検討されている方は参考にしてください。
画像系は、単純に2倍速にはなっていないので、なかなか厳しいかもしれません。実はスレッドあたりの性能がi7よりかなり低くなっているのに気付かされます。この辺は、i7-4790Kに実装されている拡張命令セットSSE4.1/4.2の効果かもしれません。XeonのE3シリーズではSSEが実装されているものもありますが、これはシングルCPUなので、コア数の限度があります。結果としてデュアルXeonのほうが優秀ですから、マルチメディアに関してもスレッド単位の性能を上げるより、コア数を増やすほうが得策ということになると思います。
科学的解析(マルチスレッディング(MT)) | |||
デュアルxeon E5-2630 v3 |
Core i7-4790K | 単位 | |
<< 浮動小数点精度 (ハイ - FP64) >> | |||
< ベンチマークの結果 > | |||
集約された科学的なパフォーマンス: | 21 | 16.35 | GFLOPS |
一般的なマトリックス乗算 (GEMM) FMA: | 95.33 | 44.73 | GFLOPS |
高速フーリエ変換 (FFT) FMA: | 4.65 | 6 | GFLOPS |
< スレッドあたりの性能 > | |||
集約された科学的なパフォーマンス: | 657 | 2 | MFLOPS |
一般的なマトリックス乗算 (GEMM): | 3 | 5.59 | GFLOPS |
N体シミュレーション: | 145 | 747 | MFLOPS |
モンテカルロ·オプションプライシング: | 1.36 | 2.31 | GFLOPS |
< パフォーマンス対消費電力 > | |||
プロセッサの消費電力: | 204 | ― | W |
集約された科学的なパフォーマンス: | 103.16 | ― | MFLOPS/W |
< パフォーマンス対速度 > | |||
集約された科学的なパフォーマンス: | 6.59 | 3.72 | MFLOPS/MHz |
< 一般的なマトリックス乗算 (GEMM) > | |||
マトリックス寸法: | 5120x5120 | 3584x3584 | |
< 高速フーリエ変換 (FFT) > | |||
ブロックサイズ: | 4194304 | 2097152 | |
< N体シミュレーション > | |||
ボディのカウント: | 8160 | 5784 | |
<< 浮動小数点精度 (ノーマル - FP32) >> | |||
< ベンチマークの結果 > | |||
集約された科学的なパフォーマンス: | 33.88 | 32.61 | GFLOPS |
一般的なマトリックス乗算 (GEMM) FMA: | 115.08 | 85.92 | GFLOPS |
高速フーリエ変換 (FFT) FMA: | 10 | 12.38 | GFLOPS |
N体シミュレーション FMA: | 32.13 | 13.76 | GFLOPS |
< スレッドあたりの性能 > | |||
集約された科学的なパフォーマンス: | 1 | 4.08 | GFLOPS |
一般的なマトリックス乗算 (GEMM): | 3.6 | 10.74 | GFLOPS |
N体シミュレーション: | 311 | 1.55 | MFLOPS |
モンテカルロ·オプションプライシング: | 1 | 1.72 | GFLOPS |
< パフォーマンス対消費電力 > | |||
プロセッサの消費電力: | 170 | ― | W |
集約された科学的なパフォーマンス: | 199.3 | ― | MFLOPS/W |
< パフォーマンス対速度 > | |||
集約された科学的なパフォーマンス: | 28.3 | 7.41 | MFLOPS/MHz |
< 一般的なマトリックス乗算 (GEMM) > | |||
マトリックス寸法: | 7168x7168 | 4864x4864 | |
< 高速フーリエ変換 (FFT) > | |||
ブロックサイズ: | 8388608 | 4194304 | |
< N体シミュレーション > | |||
ボディのカウント: | 11552 | 8176 |
科学的解析は、研究者の気になるところだと思うので掲載してみました。高速フーリエ変換では、デュアルXeonでも負けていますがマトリクス乗算(要するに行列の積)、N体シミュレーションでは勝っています。N体シミュレーションは、天文学的な掲載を行うのに使用するらしく、その筋の研究者の方は参考にしていただきたいと思います。
.NET 演算(マルチスレッディング(MT)) | |||
< ベンチマークの結果 > | |||
総合的な .NET のパフォーマンス: | 65.7 | 33 | GOPS |
Dhrystone 整数 .NET: | 36.09 | 19.39 | GIPS |
Whetstone 浮動小数点 .NET: | 105.77 | 47.38 | GFLOPS |
Whetstone 倍精度 FP64 .NET: | 135.33 | 66.32 | GFLOPS |
< スレッドあたりの性能 > | |||
総合的な .NET のパフォーマンス: | 2 | 4.12 | GOPS |
Dhrystone 整数 .NET: | 1.13 | 2.42 | GIPS |
Whetstone 浮動小数点 .NET: | 3.3 | 5.92 | GFLOPS |
Whetstone 倍精度 FP64 .NET: | 4.23 | 8.29 | GFLOPS |
< パフォーマンス対速度 > | |||
総合的な .NET のパフォーマンス: | 20.58 | 7.67 | MOPS/MHz |
Dhrystone 整数 .NET: | 11.31 | 4.51 | MIPS/MHz |
Whetstone 浮動小数点 .NET: | 33.14 | 11.02 | MFLOPS/MHz |
Whetstone 倍精度 FP64 .NET: | 42.4 | 15.43 | MFLOPS/MHz |
.NET マルチメディア演算(マルチスレッディング(MT)) | |||
< ベンチマークの結果 > | |||
総合的な マルチメディア .NET パフォーマンス: | 82 | 34.71 | Mピクセル/秒 |
マルチメディア 整数 .NET: | 129.46 | 55 | Mピクセル/秒 |
集計マルチメディア長期整数.NET: | 131 | 62.36 | Mピクセル/秒 |
集計マルチメディアクアッド整数.NET: | 1.09 | 0.449 | Mピクセル/秒 |
マルチメディア 浮動小数点 .NET: | 41.79 | 17.33 | Mピクセル/秒 |
マルチメディア 倍精度 FP64 .NET: | 102 | 43.87 | Mピクセル/秒 |
マルチメディア 浮動小数点/クワッド.NET: | 4 | 1.69 | Mピクセル/秒 |
< 総合的な マルチメディア .NET パフォーマンス > | |||
集計マルチメディア整数.NET: | 130.26 | 58.57 | Mピクセル/秒 |
集計マルチメディア浮動小数点の.NET: | 65.3 | 27.57 | Mピクセル/秒 |
< スレッドあたりの性能 > | |||
総合的な マルチメディア .NET パフォーマンス: | 2.56 | 4.34 | Mピクセル/秒 |
マルチメディア 整数 .NET: | 4 | 6.88 | Mピクセル/秒 |
集計マルチメディア長期整数.NET: | 4.1 | 7.8 | Mピクセル/秒 |
集計マルチメディアクアッド整数.NET: | 0.034 | 0.056 | Mピクセル/秒 |
マルチメディア 浮動小数点 .NET: | 1.3 | 2.17 | Mピクセル/秒 |
マルチメディア 倍精度 FP64 .NET: | 3.19 | 5.48 | Mピクセル/秒 |
マルチメディア 浮動小数点/クワッド.NET: | 0.126 | 0.21 | Mピクセル/秒 |
< パフォーマンス対消費電力 > | |||
プロセッサの消費電力: | 204 | ― | W |
総合的な マルチメディア .NET パフォーマンス: | 402.11 | ― | kピクセル/秒/W |
マルチメディア 整数 .NET: | 634.61 | ― | kピクセル/秒/W |
集計マルチメディア長期整数.NET: | 642.42 | ― | kピクセル/秒/W |
集計マルチメディアクアッド整数.NET: | 5.35 | ― | kピクセル/秒/W |
マルチメディア 浮動小数点 .NET: | 204.85 | ― | kピクセル/秒/W |
マルチメディア 倍精度 FP64 .NET: | 500.13 | ― | kピクセル/秒/W |
マルチメディア 浮動小数点/クワッド.NET: | 19.85 | kピクセル/秒/W | |
< パフォーマンス対速度 > | |||
総合的な マルチメディア .NET パフォーマンス: | 25.7 | 8.09 | kピクセル/秒/MHz |
マルチメディア 整数 .NET: | 40.56 | 12.82 | kピクセル/秒/MHz |
集計マルチメディア長期整数.NET: | 41.06 | 14.51 | kピクセル/秒/MHz |
集計マルチメディアクアッド整数.NET: | 0.34 | 0.1 | kピクセル/秒/MHz |
マルチメディア 浮動小数点 .NET: | 13.09 | 4.05 | kピクセル/秒/MHz |
マルチメディア 倍精度 FP64 .NET: | 31.96 | 10.21 | kピクセル/秒/MHz |
マルチメディア 浮動小数点/クワッド.NET: | 1.27 | 0.39 | kピクセル/秒/MHz |
ということは、WindowsベースのWEBサーバーやネットワーク環境におけるアプリケーション開発、運用をされている方の参考になるかと思います。こちらはさすがにサーバー向けのXeonが圧倒的ですね。