● 2002年秋から2003年春にかけて、Pentium IIIと同じく デユアル・プロセッサ構成
(1枚のマザーボードに2個のcpu搭載)が可能である Xeonプロセッサ(2.4GHz)
x 2cpuのユニットを追加しました。
○ Xeonプロセッサには、メモリー待ちで待機中のプロセッサをタイムシェアリング的
に有効利用する hyperthreadingテクノロジー が組み込まれています。
しかしながら、筆者たちが用いる「等分割タスクを生成 -- MPI通信でタスク間で
データ交換、同時演算」タイプの、同期実行を必要とする並列化プログラムでは、
性能はかえって低下します。これは、等分割された複数(2個)のタスクが物理的に
1個のプロセッサを共有するため、並列化やMPI通信のオーバーヘッドによるロス
のほうが大きいためと思われます。
一方、すべての物理プロセッサを使い切っていない場合でも、複数のタスクが同じ
プロセッサ上にのることがあり、これも同期実行型のジョブで hyperthreading機能が
好ましくない点です (CPU0とCPU2が同一プロセッサ上の論理プロセッサ)。
○ BIOSで hyperthreading機能をオフにしたところ、同期実行型ジョブの実行速度
が向上しました。Pentium III(1GHz) x 2cpuに比べ、Xeon(2.4GHz) x 2cpu では、
最大で 2.2倍の演算性能(Wallclock timeで)が得られました。
ただし、この性能向上はかなりジョブの性格(サイズ)によります。これは、CPUと
メインメモリ間のデータ転送バンド幅が原因と思われます。
参考: Pentium 4の導入と性能 (English))
● PCクラスターの最大の利点は、高い性能と低コストにあります。初期投資額と
メインテナンスの費用は同程度の総合性能をもつRISCマシンと比べても数分の1、
スーパーコンピュータとでは10から100倍の価格差になります。
しかしながら、一部のハードウェア(主としてHDD)の耐久性にやや問題があります。
超長時間のプログラムを実行する時には、バックアップ用のRAIDを採用する、
リスタート用に中間データを随時書き出す、などして積極的にエラーを回避する策
が必要でしょう。
また、排熱用ファンの静音対策が考慮されていないことが多く(特に自作マシン)、
マシンの冷却もある程度必要なことから、居室に設置する場合は注意したほうが
よいでしょう。
● コストフリーのUNIX OSであるLinuxは、その安定性と軽快な動作、機能の豊かさ、
カスタマイズしやすさから、PCクラスター構築を支える大いなる味方です。
しかし、頻繁なバージョンアップを繰り返す製品では、アップにより設定ファイルの
構成が変更されたり、新たなバグの発生、以前のパッチの当て忘れ(?)が見られ
ます。安定版のLinux OSを導入したら、そのOSを、パッチなどを当てつつ大事に
使うことが大切です。
Bug: Scalapack on PGI compilers & Red Hat Linux 7.3
● 今後は、PCプロセッサ演算の32ビットから64ビットへの移行、メインメモリとCPU間
のデータ転送バンド幅の高速化と複線化、それらをフルに活用したFortran/C
などの
アプリケーションの出現が楽しみです。
最近の拡張: Pentium 4 and its performance
分子動力学の手法/PCクラスターへ