GPGPU
GPGPU は General-purpose computing on graphics processing units の略で GPU による汎目的計算を意味します。Linux では、現在2つの GPGPU フレームワークが存在します: OpenCL と CUDA。
目次
OpenCL
OpenCL (Open Computing Language) は非営利団体である Khronos グループによって開発されている、オープンでロイヤルティフリーの並列プログラミングフレームワークです。
OpenCL の仕様書には一般環境として必要なプログラミング言語と、プログラマーがこの環境で呼び出せる C API が書かれています。
OpenCL ランタイム
OpenCL を使用するプログラムを実行するには、ハードウェアに対応したランタイムをインストールする必要があります。
AMD/ATI
- opencl-mesa: AMDGPU と Radeon 用のフリーなランタイム。
- opencl-amdAUR: AMDGPU 用のプロプライエタリなスタンドアロンのランタイム。
- amdgpu-pro-openclAUR[リンク切れ: パッケージが存在しません]: AMDGPU PRO 用のプロプライエタリなランタイム。
- opencl-catalystAUR: AMD のプロプライエタリなランタイム。AMDGPU に取って代わられる予定です。
- amdapp-sdkAUR: AMD CPU ランタイム。
NVIDIA
- opencl-nvidia: 公式 NVIDIA ランタイム。
Intel
- compute-runtimeAUR[リンク切れ: パッケージが存在しません] または compute-runtime-binAUR[リンク切れ: パッケージが存在しません] (NEO): Gen8 (Broadwell) 以上で Beignet を置き換えます。
- beignet: Intel IvyBridge 以上の iGPU 用のオープンソース実装 (Intel によって廃止予定)。
- intel-opencl-runtimeAUR: 公式 Intel CPU ランタイム。Intel 以外の CPU もサポートしています。
その他
- poclAUR: LLVM ベースの OpenCL 実装。
OpenCL ICD ローダー (libOpenCL.so)
OpenCL ICD ローダーはプラットフォームに依存しないライブラリで、OpenCL API 経由で特定のデバイスのドライバーをロードするのに使われます。ほとんどの OpenCL ベンダーはそれぞれ独自の OpenCL ICD ローダーを提供しており、他のベンダーの OpenCL 実装でも問題なく動作するはずです。残念ながら、大抵のベンダーは最新の ICD ローダーを提供していません。そのため、Arch Linux ではこのライブラリを別のプロジェクトから用意することで (ocl-icd) 最新の OpenCL API の実装が機能するようにしています。
他の ICD ローダーライブラリは各メーカーの SDK の一部としてインストールされます。確実に ocl-icd パッケージに含まれている ICD ローダーを使用したい場合、/etc/ld.so.conf.d
にファイルを作成して /usr/lib
を動的プログラムローダーの検索ディレクトリに追加します:
/etc/ld.so.conf.d/00-usrlib.conf
/usr/lib
全ての SDK は ld.so.conf.d
ファイルでランタイムのライブラリディレクトリを検索パスに追加するため上記の設定をする必要があります。
様々な OpenCL ICD が含まれているパッケージ:
- ocl-icd: 推奨、基本的に最新です。
- AMD による libopenclAUR: OpenCL のバージョン 2.0 を提供します。目下 AMD によって制限的なライセンスで配布されているため、公式リポジトリに入れることはできません。
- Intel による intel-openclAUR: OpenCL 2.0 を提供します。compute-runtimeAUR[リンク切れ: パッケージが存在しません] によって廃止予定。
OpenCL 開発
OpenCL を使用して開発をしたい場合、最低でも以下のパッケージが必要になります:
- ocl-icd: OpenCL ICD ローダーの実装、最新の OpenCL の仕様に沿っています。
- opencl-headers: OpenCL C/C++ API ヘッダー。
ベンダーの SDK には様々なツールやサポートライブラリが含まれています:
- intel-opencl-sdkAUR: Intel の OpenCL SDK (旧バージョン、最新の OpenCL SDK は INDE や Intel Media Server Studio に含まれています)
- amdapp-sdkAUR: このパッケージでは
/opt/AMDAPP
にファイルがインストールされ、SDK ファイルの他にコードサンプルが大量に同梱されています (/opt/AMDAPP/SDK/samples/
)。システム内の OpenCL プラットフォームやデバイスを確認したり詳細情報を表示できるclinfo
ユーティリティが含まれています。AMD APP SDK には CPU OpenCL ドライバーが含まれているため、CPU デバイスで OpenCL を実行するのに追加のドライバーは必要ありません (AMD 製じゃなくても動作します)。GPU の OpenCL ドライバーは catalystAUR パッケージに入っています。 - cuda: NVidia の GPU SDK、OpenCL 1.1 のサポートを含んでいます。
実装
あなたの環境で有効になっている OpenCL 実装を確認するには、次のコマンドを使います:
$ ls /etc/OpenCL/vendors
OpenCL プラットフォームとデバイスの利用可能な (既知の) プロパティを確認するには clinfo をインストールしてください。
言語バインディング
- C++: Khronos によるバインディングが公式の仕様書 (バージョン 1.2) に存在します。opencl-headers に含まれています。
- C++/Qt: Qt Labs に QtOpenCL という名前の実験的なバインディングがあります - 詳しくは ブログエントリ を参照
- JavaScript/HTML5: WebCL
- Python: PyOpenCL という同じ名前を持った2つのバインディングが存在します。片方は [extra] に入っています: python-pyopencl。もう片方については sourceforge を見て下さい。
- D: cl4d
- Java: JOCL (JogAmp の一部)
- Mono/.NET: Open Toolkit
- Go: OpenCL bindings for Go
- Racket: raco でインストールすることができるネイティブインターフェイスが PLaneT にあります。
- Rust: ocl
- Julia: OpenCL.jl
CUDA
CUDA (Compute Unified Device Architecture) は NVIDIA による、プロプライエタリでクローズドソースの並列計算アーキテクチャ・フレームワークです。NVIDIA の GPU を必要とします。CUDA は複数のコンポーネントから構成されます:
- 必須:
- プロプライエタリの NVIDIA カーネルモジュール
- CUDA "driver" と "runtime" ライブラリ
- 任意:
- 追加ライブラリ: CUBLAS, CUFFT, CUSPARSE など。
- CUDA ツールキット。
nvcc
コンパイラが含まれています。 - CUDA SDK。CUDA と OpenCL のプログラムの多数のサンプルやコードが含まれています。
カーネルモジュールと CUDA の "driver" ライブラリは nvidia と opencl-nvidia に入っています。"runtime" ライブラリと CUDA ツールキットは cuda パッケージでインストール可能です。このライブラリは64ビット版だけが存在します。cuda-gdb
を使うには ncurses5-compat-libsAUR のインストールが必要です。FS#46598 を参照。
開発
cuda パッケージは全てのコンポーネントを /opt/cuda
ディレクトリにインストールします。CUDA のコードをコンパイルするときはコンパイラのインクルードパスに /opt/cuda/include
を追加してください。例えばコンパイラのフラグやオプションに -I/opt/cuda/include
を加えることで追加できます。NVIDIA による gcc
ラッパーである nvcc
を使うには、/opt/cuda/bin
をパスに追加してください。
/opt/cuda/samples
にインストールされたサンプルをコンパイルしてコンパイルされたサンプルを実行することで、インストールが成功したこと、CUDA が動作していることを確認できます (サンプルディレクトリで make
を実行するだけでコンパイルできます、ただし、コンパイルする前に /opt/cuda/samples
ディレクトリをホームディレクトリにコピーしておいた方が良いでしょう)。インストールが問題ないことを確認するときは deviceQuery
と呼ばれるサンプルのどれかを実行するのがふさわしいと思われます。
言語バインディング
- Fortran: PGI CUDA Fortran Compiler
- Haskell: accelerate パッケージ に CUDA バックエンドがあります
- Java: JCuda
- Mathematica: CUDAlink
- Mono/.NET: CUDA.NET, CUDAfy.NET
- Perl: Kappa, CUDA-Minimal
- Python: python-pycuda または Kappa
- Ruby, Lua: Kappa
GPGPU のアクセラレーションがあるソフトウェア
- Bitcoin
- Blender - Nvidia GPU 向けの CUDA のサポートと AMD GPU 向けの OpenCL のサポート。詳細はこちら。
- BOINC
- clinfo – システムの OpenCL プラットフォーム・デバイスのプロパティを確認。
- cuda_memtestAUR - GPU memtest。名前とは裏腹に、CUDA と OpenCL の両方をサポートしています。
- darktable - OpenCL 機能を使うには GPU に最低でも 1GB のメモリが搭載されていて Image support が必要です (clinfo コマンドの出力で確認できます)。
- GIMP (実験段階 - [1] を参照)
- HandBrake
- Hashcat
- imagemagick
- LibreOffice Calc – こちら を参照。
- opencv
- pyrit