目指すところ OpenCLは楽しいのですが、厳しい高速化を狙っていくと難しい側面も出てきます。そこで、C++でOpenCLシリーズ最終回の今回は、高速化のためにやってみたアルゴリズム工夫のうち、効果のあったものを紹介してみたいと思います。 サンプルコードの中ではデバイス、コンテキスト、コマンドキューなどあまり本質的でない要素は宣言が省略されています。その辺が知りたい方はC++でOpenCL(環境構築編)とか、C++でOpenCL(使ってみよう編)を見てください。 高速化のために OpenCLなどの並列コンピューティングを用いて高速化するうえで問題となる箇所がいくつかありますが、主なものとしては ・メモリ転送の問題 ・メモリアクセスの問題 ・カーネル呼び出しの問題 などがあります。これらの問題を解決あるいは改善できる方法について紹介します。 実行時間計測 高速化手法とは違いますが、実行時間を