GPGPU

提供: ArchWiki
2018年6月17日 (日) 22:39時点におけるKusakata (トーク | 投稿記録)による版 (同期)
ナビゲーションに移動 検索に移動

関連記事

GPGPU は General-purpose computing on graphics processing units の略で GPU による汎目的計算を意味します。Linux では、現在2つの GPGPU フレームワークが存在します: OpenCLCUDA

OpenCL

OpenCL (Open Computing Language) は非営利団体である Khronos グループによって開発されている、オープンでロイヤルティフリーの並列プログラミングフレームワークです。

OpenCL の仕様書には一般環境として必要なプログラミング言語と、プログラマーがこの環境で呼び出せる C API が書かれています。

OpenCL ランタイム

OpenCL を使用するプログラムを実行するには、ハードウェアに対応したランタイムをインストールする必要があります。

AMD/ATI

NVIDIA

Intel

  • compute-runtimeAUR または compute-runtime-binAUR (NEO): Gen8 (Broadwell) 以上で Beignet を置き換えます。
  • beignet: Intel IvyBridge 以上の iGPU 用のオープンソース実装 (Intel によって廃止予定)。
  • intel-opencl-runtimeAUR: 公式 Intel CPU ランタイム。Intel 以外の CPU もサポートしています。

その他

  • poclAUR: LLVM ベースの OpenCL 実装。

OpenCL ICD ローダー (libOpenCL.so)

OpenCL ICD ローダーはプラットフォームに依存しないライブラリで、OpenCL API 経由で特定のデバイスのドライバーをロードするのに使われます。ほとんどの OpenCL ベンダーはそれぞれ独自の OpenCL ICD ローダーを提供しており、他のベンダーの OpenCL 実装でも問題なく動作するはずです。残念ながら、大抵のベンダーは最新の ICD ローダーを提供していません。そのため、Arch Linux ではこのライブラリを別のプロジェクトから用意することで (ocl-icd) 最新の OpenCL API の実装が機能するようにしています。

他の ICD ローダーライブラリは各メーカーの SDK の一部としてインストールされます。確実に ocl-icd パッケージに含まれている ICD ローダーを使用したい場合、/etc/ld.so.conf.d にファイルを作成して /usr/lib を動的プログラムローダーの検索ディレクトリに追加します:

/etc/ld.so.conf.d/00-usrlib.conf
/usr/lib

全ての SDK は ld.so.conf.d ファイルでランタイムのライブラリディレクトリを検索パスに追加するため上記の設定をする必要があります。

様々な OpenCL ICD が含まれているパッケージ:

  • ocl-icd: 推奨、基本的に最新です。
  • AMD による libopenclAUR: OpenCL のバージョン 2.0 を提供します。目下 AMD によって制限的なライセンスで配布されているため、公式リポジトリに入れることはできません。
  • Intel による intel-openclAUR: OpenCL 2.0 を提供します。compute-runtimeAUR によって廃止予定。
ノート: ICD ローダーのベンダーの名前が出るのはローダーを識別する必要があるときだけです。他の場合、ベンダーの名前は関係ありません。ICD ローダーはベンダーに依存しないため (正しく実装されてさえいれば) 相互に交換して使うことができます。

OpenCL 開発

OpenCL を使用して開発をしたい場合、最低でも以下のパッケージが必要になります:

  • ocl-icd: OpenCL ICD ローダーの実装、最新の OpenCL の仕様に沿っています。
  • opencl-headers: OpenCL C/C++ API ヘッダー。

ベンダーの SDK には様々なツールやサポートライブラリが含まれています:

  • intel-opencl-sdkAUR: Intel の OpenCL SDK (旧バージョン、最新の OpenCL SDK は INDE や Intel Media Server Studio に含まれています)
  • amdapp-sdkAUR: このパッケージでは /opt/AMDAPP にファイルがインストールされ、SDK ファイルの他にコードサンプルが大量に同梱されています (/opt/AMDAPP/SDK/samples/)。システム内の OpenCL プラットフォームやデバイスを確認したり詳細情報を表示できる clinfo ユーティリティが含まれています。AMD APP SDK には CPU OpenCL ドライバーが含まれているため、CPU デバイスで OpenCL を実行するのに追加のドライバーは必要ありません (AMD 製じゃなくても動作します)。GPU の OpenCL ドライバーは catalystAUR パッケージに入っています。
  • cuda: NVidia の GPU SDK、OpenCL 1.1 のサポートを含んでいます。

実装

あなたの環境で有効になっている OpenCL 実装を確認するには、次のコマンドを使います:

$ ls /etc/OpenCL/vendors

OpenCL プラットフォームとデバイスの利用可能な (既知の) プロパティを確認するには clinfoインストールしてください。

言語バインディング

CUDA

CUDA (Compute Unified Device Architecture) は NVIDIA による、プロプライエタリでクローズドソースの並列計算アーキテクチャ・フレームワークです。NVIDIA の GPU を必要とします。CUDA は複数のコンポーネントから構成されます:

  • 必須:
    • プロプライエタリの NVIDIA カーネルモジュール
    • CUDA "driver" と "runtime" ライブラリ
  • 任意:
    • 追加ライブラリ: CUBLAS, CUFFT, CUSPARSE など。
    • CUDA ツールキット。nvcc コンパイラが含まれています。
    • CUDA SDK。CUDA と OpenCL のプログラムの多数のサンプルやコードが含まれています。

カーネルモジュールと CUDA の "driver" ライブラリは nvidiaopencl-nvidia に入っています。"runtime" ライブラリと CUDA ツールキットは cuda パッケージでインストール可能です。このライブラリは64ビット版だけが存在します。cuda-gdb を使うには ncurses5-compat-libsAUR のインストールが必要です。FS#46598 を参照。

開発

cuda パッケージは全てのコンポーネントを /opt/cuda ディレクトリにインストールします。CUDA のコードをコンパイルするときはコンパイラのインクルードパスに /opt/cuda/include を追加してください。例えばコンパイラのフラグやオプションに -I/opt/cuda/include を加えることで追加できます。NVIDIA による gcc ラッパーである nvcc を使うには、/opt/cuda/bin をパスに追加してください。

/opt/cuda/samples にインストールされたサンプルをコンパイルしてコンパイルされたサンプルを実行することで、インストールが成功したこと、CUDA が動作していることを確認できます (サンプルディレクトリで make を実行するだけでコンパイルできます、ただし、コンパイルする前に /opt/cuda/samples ディレクトリをホームディレクトリにコピーしておいた方が良いでしょう)。インストールが問題ないことを確認するときは deviceQuery と呼ばれるサンプルのどれかを実行するのがふさわしいと思われます。

ノート: CUDA 9.2 は GCC 8 と互換性がありません (FS#49272 を参照)。したがって cuda パッケージは gcc7AUR に依存しており、nvcc から古いバージョンが使われるように /opt/cuda/bin/ にシンボリックリンクが作成されます。ホストコードをコンパイルする際は同じバージョンの GCC が使われるようにビルドシステムを設定する必要があります。ホストコンパイラとしてサポートされているコンパイラは リリースノート を参照。

言語バインディング

GPGPU のアクセラレーションがあるソフトウェア

  • Bitcoin
  • Blender - Nvidia GPU 向けの CUDA のサポートと AMD GPU 向けの OpenCL のサポート。詳細はこちら
  • BOINC
  • clinfo – システムの OpenCL プラットフォーム・デバイスのプロパティを確認。
  • cuda_memtestAUR - GPU memtest。名前とは裏腹に、CUDA と OpenCL の両方をサポートしています。
  • darktable - OpenCL 機能を使うには GPU に最低でも 1GB のメモリが搭載されていて Image support が必要です (clinfo コマンドの出力で確認できます)。
  • GIMP (実験段階 - [1] を参照)
  • HandBrake
  • Hashcat
  • imagemagick
  • LibreOffice Calc – こちら を参照。
  • opencv
  • pyrit

参照