~ Map処理、並列ステンシル計算、集約演算による並列計算の実装ポイント、並列パターンの応用:大規模高速化への活用 ~
・CUDA環境でGPUの特性を活かし、並列計算の効率的な実装法やコツ・注意点を修得する講座!
・Mapパターン、Stencilパターン、Reductionパターンによる実装方法や、大規模高速化への応用を修得し、画像処理・数値解析・AIの高速な並列演算の実装に活かそう!
・WEB会議システムの使い方がご不明の方は弊社でご説明いたしますのでお気軽にご相談ください。
~ Map処理、並列ステンシル計算、集約演算による並列計算の実装ポイント、並列パターンの応用:大規模高速化への活用 ~
・CUDA環境でGPUの特性を活かし、並列計算の効率的な実装法やコツ・注意点を修得する講座!
・Mapパターン、Stencilパターン、Reductionパターンによる実装方法や、大規模高速化への応用を修得し、画像処理・数値解析・AIの高速な並列演算の実装に活かそう!
・WEB会議システムの使い方がご不明の方は弊社でご説明いたしますのでお気軽にご相談ください。
GPUは画像処理・数値解析・深層学習など様々な分野で高速な並列演算装置として活躍しています。その一方でGPUプログラミングにはコツがあり、効果的な実装には高度な専門知識が要求されます。
本セミナーではNVIDIAのCUDA環境でGPUの特性を活かして効率よく並列計算を実装する方法や注意点を初歩から説明します。GPU上での並列計算の考え方から各種ツールの使い方、NVIDIAの提供するオンライン教材の活用法まで実演します。
開催日時 |
|
---|---|
開催場所 | オンラインセミナー |
カテゴリー | オンラインセミナー、ソフト・データ・画像・デザイン |
受講対象者 |
・GPUプログラミングについて基礎から修得したい方 ・画像処理、材料開発、数値シミュレーション、AI開発、他 |
予備知識 | ・C/C++などのプログラミング経験のある方(条件分岐、ループ、配列、ポインタの理解) |
修得知識 |
・並列計算の重要な考え方を学び、GPU上に効率的に実装する方法を修得できる ・CUDAによるGPUプログラミングのコツやツールの使い方を修得できる |
プログラム |
1.並列計算への入門 (1).逐次計算の限界と並列計算 (2).パターンによる構造化された並列計算 (3).CUDA環境入門と高速化の選択肢 a.ライブラリ利用 b.OpenACC c.CUDAプログラミング
2.CUDA入門とMap処理 (1).CPUとGPUの共存する計算環境 (2).GPUハードウェアの基本、計算コア、メモリ (3).CUDAによる最初の並列プログラミング (4).Map処理による完全並列計算 a.Threadによる並列計算 b.Blockによる並列計算 c.BlockとThreadの併用へ
3.並列ステンシル計算による画像処理、数値計 (1).隣接データへの重複アクセスの削減方針 (2).共有メモリの活用、Thread同期 (3).エラー処理
4.最重要:集約演算(総和、最大値/最小値) (1).集約計算はトーナメント方式 (2).エキスパートの高速化技術に学ぶ a.計算時間のボトルネックの特定 b.Compute bound か Memory bound か
5.並列パターンの応用 (1).Scanパターンによるビッグデータの仕分け・分割 a.演算効率、エネルギー効率、計算速度 b.多段階階層化による大規模高速化 (2).Ballotパターンによるカテゴリ別集約(ヒストグラム) a.Atomic演算による排他処理と同期 b.集約計算の階層化による大規模高速化 (3).NVIDIA Deep Learning Instituteの活用法 |
キーワード | Mapパターン Stencilパターン Reductionパターン CUDAプログラミング 計算時間のボトルネック 演算効率 集約計算の階層化 |
タグ | 統計・データ解析、AI・機械学習、GPU |
受講料 |
一般 (1名):49,500円(税込)
同時複数申込の場合(1名):44,000円(税込) |
会場 |
オンラインセミナー本セミナーは、Web会議システムを使用したオンラインセミナーとして開催します。 |
こちらのセミナーは受付を終了しました。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。
営業時間 月~金:9:00~17:00 / 定休日:土日・祝日