Page 1
GPGPU 高速化ソリューションのご案内
① ハードウェアを選ぶ
☞ GPGPUエントリーワークステーション
■EvoHG1 (最小構成/SIPなし)
CPU:Intel Xeon W3520 (2.66GHz)Mem:6GB (2GB ×3)HDD:500GB ×2GPU:NVIDIA GeForce GTX 470OS:Cent0S 5.3 x86_64
単体価格 (税込):¥298,000SIP [CUDA環境構築済] 価格 (税込):¥374,850
② CUDA対応アプリを使う
☞ CUDA対応アプリケーションの計算環境構築をおこないます!
■ご依頼事例
・分子動力学(MD)計算用アプリ・流体計算用アプリ・構造解析用アプリなど
[対応可能要件]OS:Linux (ディストリビューション問わず)開発言語:C/C++、FortranGPGPUコーディング:CUDA
③ CUDAで高速化する
☞ ご自作のアプリケーションをCUDAで高速化します!
■サービス内容
✓性能プロファイリング✓GPGPU化可能性の検討✓評価用プロトタイプの作成✓評価用プロトタイプの性能評価✓評価用プロトタイプの提供※
④ 無料お試しサービスに申し込む
☞ GPUの効果を確認したい方におすすめします!
アカデミック価格 (税込) :¥198,000~※その他アプリケーションの対応状況は、各ソフトウェアベンダーにお問い合わせください。
アカデミック価格 (税込):¥98,000~※コーディング内容によって価格が変わります。詳細は当社スタッフまでお問い合わせください。
¥0※評価期間には制限があります。詳細は当社スタッフまでお問い合わせください。
先着20名
お問合せは03-3599-3652まで
■対応アプリケーション (2010年4月現在)
[分子力学と量子科学]ACE MD (近日提供),AMBER,Big DFT (近日提供),GROMACS,GROMOS (近日提供),HOOMD,LAMMPS,NAMD,TeraChem (QC),VMD
[バイオインフォマティクス]CUDA-BLASTP,CUDA-EC.CUDA-MEME,CUDASW++(Smith-Waterman),GPU-HMMER,MUMmerGPU
《お客様の自作コード》
2010/6/7 更新
HPCシステムズ株式会社 www.hpc.co.jp〒135-8073 東京都江東区青海2-4-32 タイム24ビル 10F北
Page 2
① ハードウェアを選ぶ
EvoHG1(水冷システム/Tesla 搭載可能) EvoHG2(タワー型ワークステーション/Tesla 4基搭載可能)
・GPGPU用エントリーワークステーション
・水冷による静音性確保
・GTX285を標準搭載
・Tesla C2050搭載可能
・GPGPU用アドバンスモデル
・Tesla C1060を最大4基まで搭載可能
・Tesla C2050搭載可能
・1Uラックマウントシステム
・Tesla C1060を最大2基まで搭載可能
・Tesla C2050搭載可能
オプション
・ PGI Accelerator Workstation(ノードロック・シングルユーザ用サポート1年付) …… ¥103.530(教育機関)
¥220,395(一般・官公庁)・ インテル®コンパイラースイート
(Linux版/プロフェッショナルエディション) ……………¥59,900(アカデミック)¥175,300(商用)
・モニタ [ 24型LCDワイドモニタ (E2420HD) ] …………¥38,000・UPS(1500VA)………………………………………………¥158,000
単体価格 (税込):¥298,000 単体価格 (税込):¥1,880,000
単体価格 (税込):¥1,298,000
EvoHG3(1Uラックマウントシステム/Tesla 2基搭載可能)
[構成例]CPU:Intel Xeon W3520 (2.66GHz)Mem:6GB (2GB ×3)HDD:500GB ×2GPU:NVIDIA GeForce GTX 470OS:Cent0S 5.3 x86_64
[構成例]CPU:Intel Xeon X5570 (2.93GHz) ×2Mem:24GB (4GB ×6)HDD:1TB ×2GPU:NVIDIA Tesla C1060 ×4OS:Cent0S 5.3 x86_64
[構成例]CPU:Intel Xeon E5540 (2.53GHz) ×2Mem:12GB (2GB ×6)HDD:1TBGPU:NVIDIA Tesla M1060 ×2OS:Cent0S 5.3 x86_64
《用語解説》
・GPU…3Dグラフィックスの表示に必要な計算処理を行なう半導体チップ。グラフィックカード。
・GPGPU… General Purpose computing on GPUの略。GPUを汎用計算に利用する技術。
・Tesla… GeForceやQuadroをベースに開発されたNVIDIA社のGPGPU専用チップ。
・CUDA…NVIDIA社が提供するGPU向けC言語統合開発環境。コンパイラやライブラリ等から構成されている。
2010/6/7 更新
Page 3
② CUDA対応アプリを使う
☞ CUDA対応アプリケーションの計算環境構築をおこないます!
動作確認、高速化の体感CUDA対応アプリのセットアップOS,コンパイラ,CUDAのセットアップ
STEP 1 STEP 2 STEP 3
STEP 1 OS,コンパイラ,CUDAをセットアップします。
STEP 2 CUDA対応アプリケーションをセットアップします。
STEP 3 アプリケーションの動作確認と高速化を体感していただきます。
備考CUDA対応アプリケーション (2010年4月現在):[分子力学と量子科学]ACE MD (近日提供),AMBER,Big DFT (近日提供),GROMACS,GROMOS (近日提供),HOOMD,LAMMPS,NAMD,TeraChem (QC),VMD[バイオインフォマティクス]CUDA-BLASTP,CUDA-EC.CUDA-MEME,CUDASW++(Smith-Waterman),GPU-HMMER,MUMmerGPU
※その他アプリケーションの対応状況は、各ソフトウェアベンダーにお問い合わせください。
アカデミック価格 (税込) :¥198,000~
■GPGPU対応版NAMDベンチマーク
分子動力学コードNAMDホームページで公開されているコードを評価いたしました。インプット:DNA (92,224atom)
0
50
100
150
200
Xeon®E5520 2.26GHz x1コア
Xeon®E5520 2.26GHzx1コア + Tesla ™C1060
実行時間
[sec
] x6.37高速化
2010/6/7 更新
Page 4
成果物の受け渡し・バイナリコード・ソースコード(要相談)
GPGPUコーディング
③ CUDAで高速化する
OpenMPによる並列化コーディング⇒ GPGPU化可能性の検討
STEP 4
ソースコードのお預かり・自作コード⇒ 性能プロファイリング
STEP 1 STEP 2 STEP 3
☞ ご自作のアプリケーションをCUDAで高速化します!
STEP 1 ソースコード※1をお預かりします。
STEP 2 OpenMPによる並列化コーディングをします。
STEP 3 CUDAによる並列化コーディングをします。
STEP 4 成果物※2をお渡しします。
注意事項
※1 ソースコードをお預かりする前に機密保持契約を締結できます。自作コードに加えて、サンプルインプットファイル(数分~数時間で終了するもの) 、
プログラムの背景や仕様を理解する助けとなる資料、外部ライブラリ(必要時) 等の情報をご提供ください。ご依頼時にメールまたは電話による打ち合わせ
を行います。
※2 成果物はバイナリコードで販売いたします。ソースコードを希望される方はご相談ください。
アカデミック価格 (税込):¥98,000~※コーディング内容によって価格が変わります。詳細は当社スタッフまでお問い合わせください。
[対応可能要件]OS:Linux (ディストリビューション問わず) 開発言語:C/C++、Fortran GPGPUコーディング:CUDA
■ 最新ニュース
「粒子法計算が高速化、1億粒子1万ステップで約10日」 詳細はこちら☞ http://topsecret.hpc.co.jp
■ ご依頼事例
A大学様/MD計算
高速化前:12833 sec.高速化後:(OpenMP)2052 sec. (6.25倍)(Tesla C1060 ×2)
Float 198 sec. (64.65倍)Double 994 sec. (12.92倍)
(Tesla C2050 ×1)Float 未測定Double 3494 sec. (29.10倍)
[ベンチマーク環境]GPU:Tesla C1060 ×2 および Tesla C2050 ×1
B大学様/乱流計算
高速化前:33772 sec.高速化後:(OpenMP)17922 sec. (1.88倍) (Tesla C1060 ×1)
Float 未測定Double 5398 sec. (6.26倍)
(Tesla C2050 ×1)Float 未測定Double 3479 sec. (8.71倍)
[ベンチマーク環境]GPU:Tesla C1060 ×1 および Tesla C2050 ×1
C研究所様/MD計算
高速化前:32878 sec.高速化後:(OpenMP)9875 sec. (3.36倍) (Tesla C1060 ×1)
Float 4496 sec. (7.31倍)Double 10926 sec. (3.01倍)
(Tesla C2050 ×1)Float 2769 sec. (11.87倍)Double 3494 sec. (9.41倍)
[ベンチマーク環境]GPU:Tesla C1060 ×1 および Tesla C2050 ×1
2010/6/7 更新
Page 5
成果物の受け渡し・使用期限付きバイナリコード
(評価用プロトタイプ)
④ 無料お試しサービスに申込む
☞ GPUの効果を無料で確認したい方におすすめします!
GPGPUコーディングOpenMPによる並列化コーディング⇒ GPGPU化可能性の検討
STEP 4
ソースコードのお預かり・自作コード⇒ 性能プロファイリング
STEP 1 STEP 2 STEP 3
STEP 1 ソースコード※1をお預かりします。
STEP 2 OpenMPによる並列化コーディングをします。
STEP 3 CUDAによる並列化コーディングをします。
STEP 4 成果物 (使用期限付きバイナリコード) ※2をお渡しします。
注意事項
※1 ソースコードをお預かりする前に機密保持契約を締結できます。自作コードに加えて、サンプルインプットファイル(数分~数時間で終了するもの) 、
プログラムの背景や仕様を理解する助けとなる資料、外部ライブラリ(必要時) 等の情報をご提供ください。ご依頼時にメールまたは電話による打ち合わせ
を行います。
※2 成果物は使用期限付きバイナリコード(評価用プロトタイプ)でお渡しします。GPUの効果を30日間無償でお試しいただけます。
¥0
[対応可能要件]OS:Linux (ディストリビューション問わず) 開発言語:C/C++、Fortran GPGPUコーディング:CUDA
30da y s
先着20名
2010/6/7 更新
Page 6
HPCシステムズ ハイパフォーマンスコンピューティングソリューション
HPCシステムズ株式会社 www.hpc.co.jp
・本社 営業本部(〒135-8073 東京都江東区青海2-4-32 タイム24ビル10F北)
・神戸ポートアイランド営業所(〒650-0047 兵庫県神戸市中央区港島南町5丁目5番2号 神戸国際ビジネスセンター(KIBC) 6F 652-1)
・京都営業所(〒605-0061 京都市東山区白川筋三条下ル梅宮町485番地5 パークハウス108)
・匝瑳工場(〒289-3181 千葉県匝瑳市野手174-1)
・台湾開発センター(5F, No.1, Alley 6, Lane 235, Boa Chaio Road, Hsin Tien City, Taipei Taiwan, R.O.C. 〈台北縣新店市寶橋路235巷6弄1號5樓〉) 青海本社/タイム24ビル10F北 匝瑳工場/千葉県匝瑳市
量子科学計算 第一原理電子状態計算 分子動力学計算 気象解析 数式・統計処理
Gaussian09
GAMESS
Molpro
Molcas
CRYSTAL
VASP
Wien2k
PHASE
Dirac
OpenMX
Amber
GROMACS
DL_POLY
AutoDock
WRF
MM5
MATLAB
R
構造解析 流体解析 樹脂流動解析 マルチフィジックス 電磁界解析
ANSYS
ABAQUS
Marc
MSC.Nastran
LS-DYNA
RADIOSS
FLUENT
STAR-CD
STAR-CCM+
ANSYS-CFX
Phoenics
Moldex3D COMSOL Multiphysics
Femtet
HFSS
Maxwell 3D
各種アプリケーションが安定して性能を発揮できるように、弊社システムではOS、ディスクI/O、ネットワークなどを最適化しています。また、ISV各社との協力により動作検証を実施しているほかホームページで最新のベンチマークテスト結果を掲載しています。
詳細はこちら☞ http://www.hpc.co.jp/software.html
☞ 取扱アプリケーション一覧
HPCシステムズ株式会社 www.hpc.co.jp〒135-8073 東京都江東区青海2-4-32 タイム24ビル 10F北 お問合せは03-3599-3652まで
2010/6/7 更新