「GPGPU」の版間の差分
細 (1版 をインポートしました) |
|||
3行目: | 3行目: | ||
[[en:GPGPU]] |
[[en:GPGPU]] |
||
{{Related articles start}} |
{{Related articles start}} |
||
− | {{ |
+ | {{Related|AMD Catalyst}} |
− | {{ |
+ | {{Related|NVIDIA}} |
{{Related articles end}} |
{{Related articles end}} |
||
GPGPU は [[Wikipedia:ja:GPGPU|General-purpose computing on graphics processing units]] の略で GPU による汎目的計算を意味します。Linux では、現在2つの GPGPU フレームワークが存在します: [[Wikipedia:ja:OpenCL|OpenCL]] と [[Wikipedia:ja:CUDA|CUDA]]。 |
GPGPU は [[Wikipedia:ja:GPGPU|General-purpose computing on graphics processing units]] の略で GPU による汎目的計算を意味します。Linux では、現在2つの GPGPU フレームワークが存在します: [[Wikipedia:ja:OpenCL|OpenCL]] と [[Wikipedia:ja:CUDA|CUDA]]。 |
||
12行目: | 12行目: | ||
OpenCL (Open Computing Language) は非営利団体である Khronos グループによって開発されている、オープンでロイヤルティフリーの並列プログラミングフレームワークです。 |
OpenCL (Open Computing Language) は非営利団体である Khronos グループによって開発されている、オープンでロイヤルティフリーの並列プログラミングフレームワークです。 |
||
+ | OpenCL の仕様書には一般環境として必要なプログラミング言語と、プログラマーがこの環境で呼び出せる C API が書かれています。 |
||
− | 一般的に OpenCL フレームワークは以下から構成されます: |
||
− | * OpenCL API を提供するライブラリ。libCL や libOpenCL とも (Linux においては {{ic|libOpenCL.so}}) |
||
− | * OpenCL の実装、以下を含む: |
||
− | ** デバイスドライバー |
||
− | ** OpenCL/C コードコンパイラ |
||
− | ** SDK * |
||
− | * ヘッダーファイル * |
||
− | ''* が付いているものは開発のために必要'' |
||
+ | Arch Linux では複数のパッケージを用意しています。 |
||
− | ===OpenCL ライブラリ=== |
||
− | libCL には複数の選択肢が存在します。一般的には、[[公式リポジトリ]]から {{Pkg|libcl}} をインストールします。 |
||
+ | OpenCL を使用するプログラムを実行するには、あなたのハードウェアに対応しているランタイムをインストールする必要があります: |
||
− | しかしながら、他の libCL が適切な場合も考えられます。これについては以下のパラグラフで詳しく説明しています。 |
||
+ | * {{Pkg|opencl-nvidia}}: NVidia の GPU で実行 (NVidia の公式ランタイム) |
||
+ | * {{Pkg|opencl-mesa}}: AMD の GPU で mesa ドライバーを使って実行 (開発中、効果のほどは保証できません) |
||
+ | * {{AUR|opencl-catalyst}}: AMD の GPU で実行 (AMD の公式ランタイム) |
||
+ | * {{AUR|intel-opencl-runtime}}: CPU で実行 (Intel の公式ランタイム、ただし Intel の CPU である必要はありません) |
||
+ | * {{AUR|pocl}}{{Broken package link|{{aur-mirror|pocl}}}}: CPU で実行 (LLVM ベースの OpenCL 実装) |
||
+ | OpenCL を使って開発したい場合、他にもパッケージをインストールする必要があります: |
||
− | ===OpenCL の ICD モデル=== |
||
+ | * {{Pkg|ocl-icd}}: OpenCL ICD ローダーの実装、最新の OpenCL の仕様に沿っています。 |
||
− | OpenCL ではベンダー固有の実装を同じマシンに同時に複数インストールすることが可能になっています。実際には、Installable Client Driver (ICD) モデルを使って実装されています。このモデルの中心になっているのは ICD ローダーを実装する libCL ライブラリです。ICD ローダーを通して、OpenCL アプリケーションはシステム上に存在する全てのプラットフォーム・全てのデバイスにアクセスすることができます。 |
||
+ | * {{Pkg|opencl-headers}}: OpenCL C API ヘッダー。 |
||
− | ベンダーに |
+ | ベンダーの SDK には様々なツールやサポートライブラリが含まれています: |
− | * |
+ | * {{AUR|intel-opencl-sdk}}: Intel の OpenCL SDK (旧バージョン、最新の OpenCL SDK は INDE や Intel Media Server Studio に含まれています) |
+ | * {{AUR|amdapp-sdk}}: AMD の OpenCL SDK |
||
− | * AMD の {{AUR|libopencl}}。OpenCL のバージョン 1.1 までを提供します。目下 AMD によって制限的なライセンスで配布されているため、公式リポジトリに入れることはできません。 |
||
+ | * {{Pkg|cuda}}: NVidia の GPU SDK、OpenCL 1.1 のサポートを含んでいます。 |
||
+ | ===OpenCL ICD ローダー (libOpenCL.so)=== |
||
− | (Intel の libCL も存在しますが、これは別の一つのパッケージになっていません。) |
||
+ | OpenCL ICD ローダーはプラットフォームに依存しないライブラリで、OpenCL API によって特定のデバイスのドライバーをロードすることができます。ほとんどの OpenCL ベンダーはそれぞれ独自の OpenCL ICD ローダーを提供しており、他のベンダーの OpenCL 実装でも問題なく動作するはずです。残念ながら、大抵のベンダーは完全に最新の ICD ローダーを提供してくれはいません。そのため、Arch Linux ではこのライブラリを別のプロジェクトから用意することで ({{Pkg|ocl-icd}}) 最新の OpenCL API の実装が機能するようにしています。 |
||
− | {{Note|ICD Loader's vendor is mentioned only to identify each loader, it is otherwise completely irrelevant. ICD Loaders are vendor-agnostic and may be used interchangeably (as long as they are implemented correctly).}} |
||
+ | 他の ICD ローダーライブラリは各メーカーの SDK の一部としてインストールされます。{{Pkg|ocl-icd}} パッケージに含まれている ICD ローダーが使われいることを確認したい場合、{{ic|/etc/ld.so.conf.d}} にファイルを作成して {{ic|/usr/lib}} を動的プログラムローダーの検索ディレクトリに追加します: |
||
− | 基本的な使用においては、インストールとアップデートが簡単なことから ''libcl'' を推奨します。高度な使用をする場合は、''libopencl'' が推奨されます。多少の違いがあっても ''libcl'' と ''libopencl'' はどちらも全ての実装で動作するはずです。 |
||
+ | |||
+ | {{hc|/etc/ld.so.conf.d/00-usrlib.conf|2=<nowiki> |
||
+ | /usr/lib</nowiki>}} |
||
+ | |||
+ | 全ての SDK は {{ic|ld.so.conf.d}} ファイルでランタイムのライブラリディレクトリを検索パスに追加するため上記の設定をする必要があります。 |
||
+ | |||
+ | 様々な OpenCL ICD が含まれているパッケージ: |
||
+ | * {{Pkg|ocl-icd}}: 推奨、基本的に最新です。 |
||
+ | * AMD による {{AUR|libopencl}}: OpenCL のバージョン 2.0 を提供します。目下 AMD によって制限的なライセンスで配布されているため、公式リポジトリに入れることはできません。 |
||
+ | * {{AUR|intel-opencl-runtime}}: Intel の libCL、OpenCL 1.2 を提供します。 |
||
+ | |||
+ | {{Note|ICD ローダーのベンダーの名前が出るのはローダーを識別する必要があるときだけです。他の場合、ベンダーの名前は関係ありません。ICD ローダーはベンダーに依存しないため (正しく実装されてさえいれば) 相互に交換して使うことができます。}} |
||
===実装=== |
===実装=== |
||
48行目: | 59行目: | ||
Arch Linux では、現在 AMD APP SDK は AUR の {{AUR|amdapp-sdk}} としてインストールすることができます。このパッケージは {{ic|/opt/AMDAPP}} にインストールされ、SDK ファイルとは別に、多数のサンプルコードも含まれています ({{ic|/opt/AMDAPP/SDK/samples/}})。システム上の OpenCL プラットフォームやデバイスをリストアップして、それぞれの詳しい情報を表示する {{ic|clinfo}} ユーティリティも入っています。 |
Arch Linux では、現在 AMD APP SDK は AUR の {{AUR|amdapp-sdk}} としてインストールすることができます。このパッケージは {{ic|/opt/AMDAPP}} にインストールされ、SDK ファイルとは別に、多数のサンプルコードも含まれています ({{ic|/opt/AMDAPP/SDK/samples/}})。システム上の OpenCL プラットフォームやデバイスをリストアップして、それぞれの詳しい情報を表示する {{ic|clinfo}} ユーティリティも入っています。 |
||
− | AMD APP SDK 自体にも CPU の OpenCL ドライバーが含まれているため、(ベンダーの如何を問わず) CPU デバイスで OpenCL を実行するのに追加のドライバーは必要ありません。GPU の OpenCL ドライバーは (任意の依存パッケージである) {{AUR|catalyst}} パッケージに入っています |
+ | AMD APP SDK 自体にも CPU の OpenCL ドライバーが含まれているため、(ベンダーの如何を問わず) CPU デバイスで OpenCL を実行するのに追加のドライバーは必要ありません。GPU の OpenCL ドライバーは (任意の依存パッケージである) {{AUR|catalyst}} パッケージに入っています。 |
コードは (依存パッケージになっている) {{Pkg|llvm}} を使ってコンパイルされます。 |
コードは (依存パッケージになっている) {{Pkg|llvm}} を使ってコンパイルされます。 |
||
55行目: | 66行目: | ||
Mesa の OpenCL サポートは開発中です (http://www.x.org/wiki/GalliumStatus/ を参照)。AMD Radeon カードは r600g ドライバーによってサポートされています。 |
Mesa の OpenCL サポートは開発中です (http://www.x.org/wiki/GalliumStatus/ を参照)。AMD Radeon カードは r600g ドライバーによってサポートされています。 |
||
− | Arch Linux は |
+ | Arch Linux では OpenCL のサポートは別のパッケージになっています: {{Pkg|opencl-mesa}}。使い方は http://dri.freedesktop.org/wiki/GalliumCompute/ を見て下さい。 |
[http://pkgbuild.com/~lcarlier/mesa-git/ lordheavy のリポジトリ] を使うこともできます。以下のパッケージをインストールしてください: |
[http://pkgbuild.com/~lcarlier/mesa-git/ lordheavy のリポジトリ] を使うこともできます。以下のパッケージをインストールしてください: |
||
71行目: | 82行目: | ||
====Intel==== |
====Intel==== |
||
− | Intel の実装は、シンプルに [http://software.intel.com/en-us/articles/opencl-sdk/ Intel OpenCL SDK] という名前が付けられており、Intel の CPU (主に Core と Xeon) と GPU だけに最適化された OpenCL パフォーマンスを発揮します。パッケージは [[ |
+ | Intel の実装は、シンプルに [http://software.intel.com/en-us/articles/opencl-sdk/ Intel OpenCL SDK] という名前が付けられており、Intel の CPU (主に Core と Xeon) と GPU だけに最適化された OpenCL パフォーマンスを発揮します。パッケージは [[AUR]] からインストールできます: {{AUR|intel-opencl-sdk}}。ランタイムは別のパッケージとして [[AUR]] にあります: {{AUR|intel-opencl-runtime}}。Ivy Bridge 以降の新しいハードウェアに搭載されている統合グラフィックハードウェアのための OpenCL は AUR の {{AUR|beignet}} から入手できます。 |
+ | |||
+ | ====POCL==== |
||
+ | CPU で動作する LLVM ベースの実装です。{{AUR|pocl}}{{Broken package link|{{aur-mirror|pocl}}}} でインストールできます。 |
||
===開発=== |
===開発=== |
||
− | OpenCL |
+ | OpenCL 開発に必要なパッケージは[[#概要|概要]]セクションに記載しています。完全な SDK のインストールは任意です (ランタイム実装によります、大抵はベンダーの SDK の一部として含まれています)。あなたのアプリケーションを {{ic|libOpenCL.so}} にリンクしてください。 |
====言語バインディング==== |
====言語バインディング==== |
||
− | * C++: Khronos によるバインディングが公式の仕様書に存在します。{{Pkg|opencl-headers}} に含まれています。 |
+ | * C++: Khronos によるバインディングが公式の仕様書 (バージョン 1.2) に存在します。{{Pkg|opencl-headers}} に含まれています。 |
* C++/Qt: Qt Labs に [http://qt.gitorious.org/qt-labs/opencl QtOpenCL] という名前の実験的なバインディングがあります - 詳しくは [http://labs.qt.nokia.com/2010/04/07/using-opencl-with-qt/ ブログエントリ] を参照 |
* C++/Qt: Qt Labs に [http://qt.gitorious.org/qt-labs/opencl QtOpenCL] という名前の実験的なバインディングがあります - 詳しくは [http://labs.qt.nokia.com/2010/04/07/using-opencl-with-qt/ ブログエントリ] を参照 |
||
* JavaScript/HTML5: [http://www.khronos.org/webcl/ WebCL] |
* JavaScript/HTML5: [http://www.khronos.org/webcl/ WebCL] |
||
− | * [[ |
+ | * [[Python]]: PyOpenCL という同じ名前を持った2つのバインディングが存在します。片方は [extra] に入っています: {{Pkg|python2-pyopencl}}。もう片方については [http://sourceforge.net/projects/pyopencl/ sourceforge] を見て下さい。 |
* [[D]]: [https://bitbucket.org/trass3r/cl4d/wiki/Home cl4d] |
* [[D]]: [https://bitbucket.org/trass3r/cl4d/wiki/Home cl4d] |
||
− | * [[ |
+ | * [[Haskell]]: OpenCLRaw パッケージを AUR からインストールできます: {{AUR|haskell-openclraw-git}} |
− | * [[ |
+ | * [[Java]]: [http://jogamp.org/jocl/www/ JOCL] ([http://jogamp.org/ JogAmp] の一部) |
* [[Mono|Mono/.NET]]: [http://sourceforge.net/projects/opentk/ Open Toolkit] |
* [[Mono|Mono/.NET]]: [http://sourceforge.net/projects/opentk/ Open Toolkit] |
||
− | * [[ |
+ | * [[Go]]: [https://github.com/samuel/go-opencl OpenCL bindings for Go] |
+ | * Racket: raco でインストールすることができるネイティブインターフェイスが [http://planet.racket-lang.org/display.ss?owner=jaymccarthy&package=opencl.plt PLaneT] にあります。 |
||
==CUDA== |
==CUDA== |
||
− | CUDA (Compute Unified Device Architecture) は [[ |
+ | CUDA (Compute Unified Device Architecture) は [[NVIDIA]] による、プロプライエタリでクローズドソースの並列計算アーキテクチャ・フレームワークです。NVIDIA の GPU を必要とします。CUDA は複数のコンポーネントから構成されます: |
* 必須: |
* 必須: |
||
** プロプライエタリの NVIDIA カーネルモジュール |
** プロプライエタリの NVIDIA カーネルモジュール |
||
102行目: | 117行目: | ||
===開発=== |
===開発=== |
||
− | {{Pkg|cuda}} パッケージは全てのコンポーネントを {{ic|/opt/cuda}} ディレクトリにインストールします。CUDA のコードをコンパイルするときはコンパイラのインクルードパスに {{ic|/opt/cuda/include}} を追加してください。例えばコンパイラのフラグやオプションに {{ic|-I/opt/cuda/include}} を加えることで追加できます。 |
+ | {{Pkg|cuda}} パッケージは全てのコンポーネントを {{ic|/opt/cuda}} ディレクトリにインストールします。CUDA のコードをコンパイルするときはコンパイラのインクルードパスに {{ic|/opt/cuda/include}} を追加してください。例えばコンパイラのフラグやオプションに {{ic|-I/opt/cuda/include}} を加えることで追加できます。NVIDIA による {{ic|gcc}} ラッパーである {{ic|nvcc}} を使うには、{{ic|/opt/cuda/bin}} をパスに追加してください。 |
+ | |||
+ | {{ic|/opt/cuda/sample}} にインストールされたサンプルをコンパイルしてコンパイルされたサンプルを実行することで、インストールが成功したこと、CUDA が動作していることを確認できます (サンプルディレクトリで {{ic|make}} を実行するだけでコンパイルできます、ただし、コンパイルする前に {{ic|/opt/cuda/samples}} ディレクトリをホームディレクトリにコピーしておいた方が良いでしょう)。インストールが問題ないことを確認するときは {{ic|deviceQuery}} と呼ばれるサンプルのどれかを実行するのがふさわしいと思われます。 |
||
===言語バインディング=== |
===言語バインディング=== |
||
* Fortran: [http://www.hoopoe-cloud.com/Solutions/Fortran/Default.aspx FORTRAN CUDA], [http://www.pgroup.com/resources/cudafortran.htm PGI CUDA Fortran Compiler] |
* Fortran: [http://www.hoopoe-cloud.com/Solutions/Fortran/Default.aspx FORTRAN CUDA], [http://www.pgroup.com/resources/cudafortran.htm PGI CUDA Fortran Compiler] |
||
− | * [[ |
+ | * [[Haskell]]: [http://hackage.haskell.org/package/accelerate accelerate パッケージ] に CUDA バックエンドがあります |
− | * [[ |
+ | * [[Java]]: [http://www.hoopoe-cloud.com/Solutions/jCUDA/Default.aspx jCUDA], [http://www.jcuda.org/jcuda/JCuda.html JCuda] |
* [[Mathematica]]: [http://reference.wolfram.com/mathematica/CUDALink/tutorial/Overview.html CUDAlink] |
* [[Mathematica]]: [http://reference.wolfram.com/mathematica/CUDALink/tutorial/Overview.html CUDAlink] |
||
* [[Mono|Mono/.NET]]: [http://www.hoopoe-cloud.com/Solutions/CUDA.NET/Default.aspx CUDA.NET], [http://www.hybriddsp.com/ CUDAfy.NET] |
* [[Mono|Mono/.NET]]: [http://www.hoopoe-cloud.com/Solutions/CUDA.NET/Default.aspx CUDA.NET], [http://www.hybriddsp.com/ CUDAfy.NET] |
||
* Perl: [http://psilambda.com/download/kappa-for-perl Kappa], [https://github.com/run4flat/perl-CUDA-Minimal CUDA-Minimal] |
* Perl: [http://psilambda.com/download/kappa-for-perl Kappa], [https://github.com/run4flat/perl-CUDA-Minimal CUDA-Minimal] |
||
− | * [[ |
+ | * [[Python]]: AUR の: {{AUR|pycuda-git}}, また [http://psilambda.com/download/kappa-for-python Kappa] |
− | * [[ |
+ | * [[Ruby]], Lua: [http://psilambda.com/products/kappa/ Kappa] |
===ドライバーの問題=== |
===ドライバーの問題=== |
||
120行目: | 137行目: | ||
==OpenCL と CUDA のアクセラレーションがあるソフトウェア== |
==OpenCL と CUDA のアクセラレーションがあるソフトウェア== |
||
* [[Bitcoin]] |
* [[Bitcoin]] |
||
− | * [[ |
+ | * [[GIMP]] (実験段階 - [http://www.h-online.com/open/news/item/GIMP-2-8-RC-1-arrives-with-GPU-acceleration-1518417.html] を参照) |
* {{AUR|pyrit}} |
* {{AUR|pyrit}} |
||
* {{Pkg|aircrack-ng}} |
* {{Pkg|aircrack-ng}} |
2015年10月11日 (日) 19:36時点における版
関連記事
GPGPU は General-purpose computing on graphics processing units の略で GPU による汎目的計算を意味します。Linux では、現在2つの GPGPU フレームワークが存在します: OpenCL と CUDA。
目次
OpenCL
概要
OpenCL (Open Computing Language) は非営利団体である Khronos グループによって開発されている、オープンでロイヤルティフリーの並列プログラミングフレームワークです。
OpenCL の仕様書には一般環境として必要なプログラミング言語と、プログラマーがこの環境で呼び出せる C API が書かれています。
Arch Linux では複数のパッケージを用意しています。
OpenCL を使用するプログラムを実行するには、あなたのハードウェアに対応しているランタイムをインストールする必要があります:
- opencl-nvidia: NVidia の GPU で実行 (NVidia の公式ランタイム)
- opencl-mesa: AMD の GPU で mesa ドライバーを使って実行 (開発中、効果のほどは保証できません)
- opencl-catalystAUR: AMD の GPU で実行 (AMD の公式ランタイム)
- intel-opencl-runtimeAUR: CPU で実行 (Intel の公式ランタイム、ただし Intel の CPU である必要はありません)
- poclAUR[リンク切れ: アーカイブ: aur-mirror]: CPU で実行 (LLVM ベースの OpenCL 実装)
OpenCL を使って開発したい場合、他にもパッケージをインストールする必要があります:
- ocl-icd: OpenCL ICD ローダーの実装、最新の OpenCL の仕様に沿っています。
- opencl-headers: OpenCL C API ヘッダー。
ベンダーの SDK には様々なツールやサポートライブラリが含まれています:
- intel-opencl-sdkAUR: Intel の OpenCL SDK (旧バージョン、最新の OpenCL SDK は INDE や Intel Media Server Studio に含まれています)
- amdapp-sdkAUR: AMD の OpenCL SDK
- cuda: NVidia の GPU SDK、OpenCL 1.1 のサポートを含んでいます。
OpenCL ICD ローダー (libOpenCL.so)
OpenCL ICD ローダーはプラットフォームに依存しないライブラリで、OpenCL API によって特定のデバイスのドライバーをロードすることができます。ほとんどの OpenCL ベンダーはそれぞれ独自の OpenCL ICD ローダーを提供しており、他のベンダーの OpenCL 実装でも問題なく動作するはずです。残念ながら、大抵のベンダーは完全に最新の ICD ローダーを提供してくれはいません。そのため、Arch Linux ではこのライブラリを別のプロジェクトから用意することで (ocl-icd) 最新の OpenCL API の実装が機能するようにしています。
他の ICD ローダーライブラリは各メーカーの SDK の一部としてインストールされます。ocl-icd パッケージに含まれている ICD ローダーが使われいることを確認したい場合、/etc/ld.so.conf.d
にファイルを作成して /usr/lib
を動的プログラムローダーの検索ディレクトリに追加します:
/etc/ld.so.conf.d/00-usrlib.conf
/usr/lib
全ての SDK は ld.so.conf.d
ファイルでランタイムのライブラリディレクトリを検索パスに追加するため上記の設定をする必要があります。
様々な OpenCL ICD が含まれているパッケージ:
- ocl-icd: 推奨、基本的に最新です。
- AMD による libopenclAUR: OpenCL のバージョン 2.0 を提供します。目下 AMD によって制限的なライセンスで配布されているため、公式リポジトリに入れることはできません。
- intel-opencl-runtimeAUR: Intel の libCL、OpenCL 1.2 を提供します。
実装
あなたの環境で有効になっている OpenCL 実装を確認するには、次のコマンドを使います:
$ ls /etc/OpenCL/vendors
AMD
AMD の OpenCL 実装は AMD APP SDK として知られています。以前は AMD Stream SDK または ATi Stream とも呼ばれていました。
Arch Linux では、現在 AMD APP SDK は AUR の amdapp-sdkAUR としてインストールすることができます。このパッケージは /opt/AMDAPP
にインストールされ、SDK ファイルとは別に、多数のサンプルコードも含まれています (/opt/AMDAPP/SDK/samples/
)。システム上の OpenCL プラットフォームやデバイスをリストアップして、それぞれの詳しい情報を表示する clinfo
ユーティリティも入っています。
AMD APP SDK 自体にも CPU の OpenCL ドライバーが含まれているため、(ベンダーの如何を問わず) CPU デバイスで OpenCL を実行するのに追加のドライバーは必要ありません。GPU の OpenCL ドライバーは (任意の依存パッケージである) catalystAUR パッケージに入っています。
コードは (依存パッケージになっている) llvm を使ってコンパイルされます。
Mesa (Gallium)
Mesa の OpenCL サポートは開発中です (http://www.x.org/wiki/GalliumStatus/ を参照)。AMD Radeon カードは r600g ドライバーによってサポートされています。
Arch Linux では OpenCL のサポートは別のパッケージになっています: opencl-mesa。使い方は http://dri.freedesktop.org/wiki/GalliumCompute/ を見て下さい。
lordheavy のリポジトリ を使うこともできます。以下のパッケージをインストールしてください:
- mesa-dri-gitAUR
- opencl-mesa-gitAUR
- libclc-gitAUR
驚くべきことに、radeon+r600g を使った場合 Catalyst 13.11 Beta1 と比べて 20% 高速に pyrit が動作します (他の7つの CPU コアでもテスト):
catalyst #1: 'OpenCL-Device 'Barts'': 21840.7 PMKs/s (RTT 2.8) radeon+r600g #1: 'OpenCL-Device 'AMD BARTS'': 26608.1 PMKs/s (RTT 3.0)
執筆時点では (2013年10月30日)、このパフォーマンスを得るためには [1] と [2] のパッチを Mesa のコミット ac81b6f2be8779022e8641984b09118b57263128 上にあてる必要があります。パッチがあたってない最新の LLVM トランクを使用しました (SVN rev 193660)。
NVIDIA
NVIDIA の実装は公式リポジトリの opencl-nvidia からインストールできます。nvidia カーネルモジュールが動作する NVIDIA GPU のみをサポートしています (nouveau はまだ OpenCL をサポートしていません)。
Intel
Intel の実装は、シンプルに Intel OpenCL SDK という名前が付けられており、Intel の CPU (主に Core と Xeon) と GPU だけに最適化された OpenCL パフォーマンスを発揮します。パッケージは AUR からインストールできます: intel-opencl-sdkAUR。ランタイムは別のパッケージとして AUR にあります: intel-opencl-runtimeAUR。Ivy Bridge 以降の新しいハードウェアに搭載されている統合グラフィックハードウェアのための OpenCL は AUR の beignetAUR から入手できます。
POCL
CPU で動作する LLVM ベースの実装です。poclAUR[リンク切れ: アーカイブ: aur-mirror] でインストールできます。
開発
OpenCL 開発に必要なパッケージは概要セクションに記載しています。完全な SDK のインストールは任意です (ランタイム実装によります、大抵はベンダーの SDK の一部として含まれています)。あなたのアプリケーションを libOpenCL.so
にリンクしてください。
言語バインディング
- C++: Khronos によるバインディングが公式の仕様書 (バージョン 1.2) に存在します。opencl-headers に含まれています。
- C++/Qt: Qt Labs に QtOpenCL という名前の実験的なバインディングがあります - 詳しくは ブログエントリ を参照
- JavaScript/HTML5: WebCL
- Python: PyOpenCL という同じ名前を持った2つのバインディングが存在します。片方は [extra] に入っています: python2-pyopencl。もう片方については sourceforge を見て下さい。
- D: cl4d
- Haskell: OpenCLRaw パッケージを AUR からインストールできます: haskell-openclraw-gitAUR
- Java: JOCL (JogAmp の一部)
- Mono/.NET: Open Toolkit
- Go: OpenCL bindings for Go
- Racket: raco でインストールすることができるネイティブインターフェイスが PLaneT にあります。
CUDA
CUDA (Compute Unified Device Architecture) は NVIDIA による、プロプライエタリでクローズドソースの並列計算アーキテクチャ・フレームワークです。NVIDIA の GPU を必要とします。CUDA は複数のコンポーネントから構成されます:
- 必須:
- プロプライエタリの NVIDIA カーネルモジュール
- CUDA "driver" と "runtime" ライブラリ
- 任意:
- 追加ライブラリ: CUBLAS, CUFFT, CUSPARSE など。
- CUDA ツールキット。
nvcc
コンパイラが含まれています。 - CUDA SDK。CUDA と OpenCL のプログラムの多数のサンプルやコードが含まれています。
カーネルモジュールと CUDA の "driver" ライブラリは nvidia と opencl-nvidia に入っています。"runtime" ライブラリと CUDA ツールキットは cuda パッケージでインストール可能です。このライブラリは64ビット版だけが存在します。
開発
cuda パッケージは全てのコンポーネントを /opt/cuda
ディレクトリにインストールします。CUDA のコードをコンパイルするときはコンパイラのインクルードパスに /opt/cuda/include
を追加してください。例えばコンパイラのフラグやオプションに -I/opt/cuda/include
を加えることで追加できます。NVIDIA による gcc
ラッパーである nvcc
を使うには、/opt/cuda/bin
をパスに追加してください。
/opt/cuda/sample
にインストールされたサンプルをコンパイルしてコンパイルされたサンプルを実行することで、インストールが成功したこと、CUDA が動作していることを確認できます (サンプルディレクトリで make
を実行するだけでコンパイルできます、ただし、コンパイルする前に /opt/cuda/samples
ディレクトリをホームディレクトリにコピーしておいた方が良いでしょう)。インストールが問題ないことを確認するときは deviceQuery
と呼ばれるサンプルのどれかを実行するのがふさわしいと思われます。
言語バインディング
- Fortran: FORTRAN CUDA, PGI CUDA Fortran Compiler
- Haskell: accelerate パッケージ に CUDA バックエンドがあります
- Java: jCUDA, JCuda
- Mathematica: CUDAlink
- Mono/.NET: CUDA.NET, CUDAfy.NET
- Perl: Kappa, CUDA-Minimal
- Python: AUR の: pycuda-gitAUR, また Kappa
- Ruby, Lua: Kappa
ドライバーの問題
複数の GPU が載っている環境で CUDA プログラムを実行する場合、パーミッション問題を解決するためにレガシーなドライバー nvidia-304xx または nvidia-304xx-lts を使う必要があるかもしれません。
OpenCL と CUDA のアクセラレーションがあるソフトウェア
- Bitcoin
- GIMP (実験段階 - [3] を参照)
- pyritAUR
- aircrack-ng
- john-openclAUR
- cuda_memtestAUR - GPU memtest。名前とは裏腹に、CUDA と OpenCL の両方をサポートしています。