「OVMF による PCI パススルー」の版間の差分

提供: ArchWiki
ナビゲーションに移動 検索に移動
(→‎pci-stub: 同期)
(リンクを修正)
 
(10人の利用者による、間の37版が非表示)
1行目: 1行目:
  +
{{Translateme|記事が古くなっているとの指摘がありました}}
 
[[Category:仮想化]]
 
[[Category:仮想化]]
 
[[en:PCI passthrough via OVMF]]
 
[[en:PCI passthrough via OVMF]]
  +
[[zh-hans:PCI passthrough via OVMF]]
こちらは QEMU で PCI VGA パススルーを行う方法のガイドです。カーネル 3.9 から QEMU に変更があり、グラフィックカードをパススルーすることが可能になりました。ゲームなどのグラフィック負担が重い処理を実行するときに、VM からネイティブのグラフィック性能を発揮できます。グラフィックカードをパススルーするには、2つのグラフィックカードが必要になります。片方はホストに、もう片方は VM に割り当てられます。グラフィックカードといっても、ホスト側では内蔵のグラフィックを使うことができます。また、プロセッサとマザーボードが AMD-VI/VT-D に対応していなければなりません。
 
  +
{{Related articles start}}
  +
{{Related|Intel GVT-g}}
  +
{{Related|:en:PCI passthrough via OVMF/Examples}}
  +
{{Related|:en:QEMU/Guest graphics acceleration}}
  +
{{Related articles end}}
  +
Open Virtual Machine Firmware ([https://github.com/tianocore/tianocore.github.io/wiki/OVMF OVMF]) は仮想マシンで UEFI を使えるようにするプロジェクトです。Linux 3.9 以上と最近のバージョンの [[QEMU]] では、グラフィックカードをパススルーすることが可能で、仮想マシンでネイティブと同じグラフィック性能を発揮することができ、グラフィック性能が要求されるタスクにおいて便利です。
   
  +
デスクトップコンピュータに使用していない GPU が接続されている場合 (内蔵 GPU や古い OEM カードでもかまいません、ブランドが一致している必要はありません)、ハードウェアがサポートしていれば ([[#要件]]を参照)、あらゆる OS の仮想マシンで専用 GPU として(ほぼ)最大限の性能を活用できます。技術的な詳細は [https://www.linux-kvm.org/images/b/b3/01x09b-VFIOandYou-small.pdf こちらのプレゼンテーション (pdf)] を見てください。
==インストール==
 
   
  +
== 要件 ==
{{Pkg|qemu}} と {{Pkg|rpmextract}} を[[インストール]]してください。カーネルにパッチを適用する必要がある場合は {{AUR|linux-vfio}} もインストールします。
 
  +
VGA パススルーでは最先端の技術を使っているため、あなたのハードウェアでは使用できない可能性があります。パススルーを行うには以下の要件が満たされていなければなりません:
   
  +
* CPU がハードウェア仮想化 (KVM) と IOMMU (パススルー) をサポートしていること。
[https://www.kraxel.org/repos/jenkins/edk2/ Gerd Hoffman のリポジトリ] から edk2.git-ovmf-x64 をダウンロードしてください。
 
  +
** [https://ark.intel.com/ja/Search/FeatureFilter?productType=processors&VTD=true Intel の対応 CPU リスト (Intel VT-x と Intel VT-d)]
  +
** Bulldozer 世代以降 (Zen も含む) の AMD 製 CPU は全て対応しています。
  +
*** K10 世代 (2007年) の CPU は IOMMU を搭載していないため、[https://support.amd.com/TechDocs/43403.pdf#page=18 890FX] や [https://support.amd.com/TechDocs/48691.pdf#page=21 990FX] チップセットが搭載されたマザーボードが必要です。
  +
* マザーボードが IOMMU をサポートしていること。
  +
** チップセットと BIOS の両方が対応している必要があります。対応しているかどうかすぐに判断することはできませんが、[https://wiki.xen.org/wiki/VTd_HowTo Xen wiki の対応ハードウェアリスト] や [[wikipedia:List_of_IOMMU-supporting_hardware|Wikipedia の対応リスト]]が存在します。
  +
* ゲスト GPU ROM が UEFI をサポートしていること。
  +
** [https://www.techpowerup.com/vgabios/ このリストに載っている ROM] に使用している GPU が存在し UEFI をサポートしていると書かれていれば、問題ありません。2012年以降の GPU はサポートされているはずです。Windows 8 との互換性があると売り出すには UEFI のサポートが要件だと Microsoft が決めたためです。
   
  +
使用していないモニターやマウス、キーボードがあれば、それも仮想マシンに割り当てることができます (GPU はディスプレイが接続されていないと何も出力することができず Spice 接続では性能が上がりません)。何か問題が発生した場合でも、スペアの機材があればホストマシンは制御できます。
ダウンロードした圧縮ファイルを {{ic|/usr}} に展開:
 
   
  +
==IOMMU のセットアップ==
{{bc|# rpmextract.sh edk2.git-ovmf-x64-0-20150223.b877.ga8577b3.noarch.rpm
 
  +
{{Note|
# cp -R ./usr/share/* /usr/share}}
 
  +
* IOMMU は Intel VT-d と AMD-Vi の総称です。
  +
* VT-d は ''ダイレクト I/O 向けインテル VT'' (''Intel Virtualization Technology for Directed I/O'') の略語です。''インテル バーチャライゼーション・テクノロジー'' (''Intel Virtualization Technology'') の VT-x と混同しないようにしてください。 VT-x は単独のハードウェアプラットフォームを複数の「仮想」プラットフォームとして機能することを可能にする機能で、対して VT-d はシステムのセキュリティと信頼性を向上させると共に仮想化環境での I/O デバイスのパフォーマンスを向上させる機能です。
  +
}}
   
  +
IOMMU によって PCI パススルーや障害または悪意あるデバイスからのメモリ保護機能を使うことができます。[[Wikipedia:Input-output memory management unit#Advantages]] や [https://www.quora.com/Memory-Management-computer-programming/Could-you-explain-IOMMU-in-plain-English Memory Management (computer programming): Could you explain IOMMU in plain English?] を参照してください。
{{ic|/usr/share/edk2.git/ovmf-x64}} に以下のファイルがあることを確認してください:
 
{{hc|$ ls /usr/share/edk2.git/ovmf-x64/*pure*.fd|
 
/usr/share/edk2.git/ovmf-x64/OVMF-pure-efi.fd
 
/usr/share/edk2.git/ovmf-x64/OVMF_VARS-pure-efi.fd
 
/usr/share/edk2.git/ovmf-x64/OVMF_CODE-pure-efi.fd}}
 
   
  +
===IOMMU の有効化===
上記は VM が使用する BIOS になります。UEFI を使っていない場合は i440fx を使う必要があったり、Intel の GPU をホストで使うときは i915 vga arbiter パッチが必要になったりします。詳しくは [https://bbs.archlinux.org/viewtopic.php?id=162768 フォーラムスレッド] を参照してください。また、マザーボードは UEFI に対応していてもグラフィックカードが UEFI に対応していない場合、[http://vfio.blogspot.jp/ こちら] を見てください。
 
  +
AMD-Vi/Intel VT-d が CPU によってサポートされていること、BIOS の設定で AMD-VI/VT-d が有効化されていることを確認してください。通常は他の CPU 機能と一緒に設定が並んでいるはずです (オーバークロック関連のメニューに存在することもあります)。設定における名前は機能名 ("Vt-d" あるいは "AMD-Vi") だったり、あるいは "Virtualization technology" などの曖昧な単語だったりします。マニュアルに載っていない場合もあります。
   
  +
使用している CPU に応じて適切な[[カーネルパラメータ]]を設定し、 IOMMU を有効にしてください:
==libvirt の設定==
 
   
  +
* Intel 製の CPU (VT-d) であれば {{ic|1=intel_iommu=on}} を設定
[[Polkit#パスワードプロンプトの迂回]]を参照してパスワードプロンプトを迂回するようにして、{{pkg|libvirt}} をインストールしてから {{ic|libvirtd.service}} を[[起動]]・[[有効化]]してください。
 
  +
* AMD 製の CPU (AMD-Vi) ではカーネルが BIOS から IOMMU のサポートを検出し、自動で有効化されます
  +
{{ic|1=iommu=pt}} パラメータも追加してください。このパラメータによって Linux がパススルーしないデバイスに触らないようにすることができます。
   
  +
再起動して、dmesg で IOMMU が有効になっていることを確認してください:
''virt-manager'' を起動してハイパーバイザーを設定してください。Virtmanager で qemu のセッションに接続します。
 
 
==IOMMU の有効化==
 
 
BIOS の設定で AMD-VI/VT-D が有効になっていることを確認してください。
 
 
使用しているプロセッサが Intel 製の場合、[[カーネルパラメータ|ブートローダーのカーネルオプション]]に {{ic|intel_iommu<nowiki>=</nowiki>on}} を追加してください。同様に、AMD 製の場合、{{ic|amd_iommu<nowiki>=</nowiki>on}} を追加してください。
 
 
再起動後、IOMMU が有効になっていることを dmesg で確認します:
 
 
{{hc|dmesg<nowiki>|</nowiki>grep -e DMAR -e IOMMU|
 
{{hc|dmesg<nowiki>|</nowiki>grep -e DMAR -e IOMMU|
 
[ 0.000000] ACPI: DMAR 0x00000000BDCB1CB0 0000B8 (v01 INTEL BDW 00000001 INTL 00000001)
 
[ 0.000000] ACPI: DMAR 0x00000000BDCB1CB0 0000B8 (v01 INTEL BDW 00000001 INTL 00000001)
53行目: 62行目:
 
[ 2.182790] [drm] DMAR active, disabling use of stolen memory}}
 
[ 2.182790] [drm] DMAR active, disabling use of stolen memory}}
   
  +
===グループが正しいことを確認===
==デバイスへのアクセス権限をユーザーに付与==
 
  +
udev ルールを作成してデバイス (hdd や gpu) にアクセスする権限をユーザーに与えてください:
 
  +
以下のスクリプトを使うことで PCI デバイスが IOMMU グループにどのようにマッピングされたか確認できます。何も出力が返ってこない場合、IOMMU のサポートが有効になっていないかハードウェアが IOMMU をサポートしていないかのどちらかです。
{{hc|/etc/udev/rules.d/10-qemu-hw-users.rules|KERNEL<nowiki>==</nowiki>"sda[3-6]", OWNER<nowiki>=</nowiki>"YOUR_USER", GROUP<nowiki>=</nowiki>"YOUR_GROUP"
 
  +
KERNEL<nowiki>==</nowiki>"YOUR_VFIO_GROUPS", SUBSYSTEM<nowiki>==</nowiki>"vfio", OWNER<nowiki>=</nowiki>"YOUR_USER", GROUP<nowiki>=</nowiki>"YOUR_USER"}}
 
  +
#!/bin/bash
このようにすることで {{ic|/etc/libvirtd/qemu.conf}} で qemu のユーザーやグループを root:root よりも安全に設定できます。
 
  +
shopt -s nullglob
  +
for d in /sys/kernel/iommu_groups/*/devices/*; do
  +
n=${d#*/iommu_groups/*}; n=${n%%/*}
  +
printf 'IOMMU Group %s ' "$n"
  +
lspci -nns "${d##*/}"
  +
done;
  +
  +
出力の例:
  +
  +
IOMMU Group 0 00:00.0 Host bridge [0600]: Intel Corporation 2nd Generation Core Processor Family DRAM Controller [8086:0104] (rev 09)
  +
IOMMU Group 1 00:16.0 Communication controller [0780]: Intel Corporation 6 Series/C200 Series Chipset Family MEI Controller #1 [8086:1c3a] (rev 04)
  +
IOMMU Group 2 00:19.0 Ethernet controller [0200]: Intel Corporation 82579LM Gigabit Network Connection [8086:1502] (rev 04)
  +
IOMMU Group 3 00:1a.0 USB controller [0c03]: Intel Corporation 6 Series/C200 Series Chipset Family USB Enhanced Host Controller #2 [8086:1c2d] (rev
  +
...
  +
IOMMU グループは仮想マシンにパススルーすることができる一番小さい単位の物理デバイスのセットです。例えば、上記の例の場合、06:00.0 の GPU と 6:00.1 のオーディオコントローラは IOMMU グループ13に属しており、両方一緒にしかパススルーすることができません。フロントの USB コントローラは USB 拡張コントローラ (グループ10) やリアの USB コントローラ (グループ4) と分かれているグループ (グループ2) なので、[[#USB コントローラ|他のデバイスに影響を与えないで仮想マシンにパススルーすることができます]]。
  +
  +
===注意事項===
  +
====独立していない CPU ベースの PCIe スロットにゲスト GPU を接続した場合====
  +
全ての PCI-E スロットは同じではありません。ほとんどのマザーボードでは PCIe スロットには CPU 由来のものと PCH 由来のものがあります。CPU によっては、プロセッサ由来の PCIe スロットは隔離することができず、その場合 PCI スロットは接続されているデバイスと一緒にグループ化されてしまいます。
  +
  +
IOMMU Group 1 00:01.0 PCI bridge: Intel Corporation Xeon E3-1200 v2/3rd Gen Core processor PCI Express Root Port (rev 09)
  +
IOMMU Group 1 01:00.0 VGA compatible controller: NVIDIA Corporation GM107 [GeForce GTX 750] (rev a2)
  +
IOMMU Group 1 01:00.1 Audio device: NVIDIA Corporation Device 0fbc (rev a1)
  +
  +
上記のようにゲスト GPU しか含まれていない場合は問題ありません。他の PCIe スロットに接続した場合や CPU や PCH の配置によって、同じグループに他のデバイスが含まれる場合、そのデバイスも一緒にパススルーすることになります。仮想マシンにデバイスをパススルーしても問題ない場合は次に進んでください。そうでない場合、他の PCIe スロットに GPU を接続してみて他のデバイスと分離できないか試してみてください。もしくは ACS 上書きパッチをインストールする方法もありますが、こちらは欠点があります。詳しくは [[#IOMMU グループのバイパス (ACS 上書きパッチ)]] を参照してください。
  +
  +
{{note|他のデバイスと一緒にグループ化した場合、起動時に pci のルートポートとブリッジを vfio に紐付けたり VM に追加してはいけません。}}
   
 
==GPU の分離==
 
==GPU の分離==
  +
デバイスを仮想マシンに割り当てるには、ホストマシンとの干渉を避けるためにこのデバイスと同じ IOMMU グループを共有する全てのデバイスがスタブドライバまたは VFIO ドライバに置き換えられている必要があります。この処理はほとんどのデバイスでは VM が起動する直前に行われます。
   
  +
しかし、GPU ドライバーは巨大で複雑なため、動的な再バインドはあまりサポートされておらず、ホストの GPU を仮想マシンにお互いのドライバーが衝突すること無く透過的にパススルーすることは通常できません。 VM が起動する前に代わりのドライバーに GPU を手動でバインドし、他のドライバーが GPU を使用できないようにすることを推奨します。
パススルーするカードの PCI アドレスとデバイス ID を確認してください:
 
{{hc|lspci -nn<nowiki>|</nowiki>grep -iP "NVIDIA<nowiki>|</nowiki>Radeon"|
 
01:00.0 VGA compatible controller [0300]: Advanced Micro Devices, Inc. [AMD/ATI] Cayman PRO [Radeon HD 6950] [1002:6719]
 
01:00.1 Audio device [0403]: Advanced Micro Devices, Inc. [AMD/ATI] Cayman/Antilles HDMI Audio [Radeon HD 6900 Series] [1002:aa80]
 
04:00.0 VGA compatible controller [0300]: NVIDIA Corporation G73 [GeForce 7600 GS] [10de:0392] (rev a1)}}
 
   
  +
続くセクションでは、代わりのドライバーがブートプロセスの早期にバインドされるように GPU を構成する詳細な方法を記載します。これにより VM が要求するかドライバーがスイッチバックされるまでデバイスは活動を停止します。これは一旦システムが完全にオンラインになってからドライバを切り替えるよりも問題が少なく、好ましい方法と言えます。2つの方法が存在しますが、使用しているカーネルがサポートしている場合は vfio-pci を使用することが推奨されます。
上記の場合、3つの PCI デバイス ID はそれぞれ {{ic|1002:6719 1002:aa80 10de:0392}} となり、アドレスは {{ic|01:00.0 01:00.1 04:00.0}} です。VM から直接扱わせたいデバイスの ID とアドレスをメモしてください。
 
   
  +
{{warning|設定後にマシンを再起動すると、設定を解除しないかぎりホストから GPU は使えなくなります。再起動する前にホストで使用する GPU が正しく (マザーボードがホスト GPU を使って表示するように) 設定されているか確認してください。}}
VM からパススルーしたデバイスにアクセスできるようにするには、ホストのドライバーよりも前にデバイスを使えるようにしておく必要があります。{{ic|vfio-pci}} あるいは {{ic|pci-stub}} のどちらか片方のカーネルモジュールを使ってください。
 
   
vfio-pci はカーネルのバージョン 4.1 以上で利用可能で、カーネル vfio-pci に対応しいるのであればvfio-pci を使用することを推奨しま。モジュールが利用できうかは次コマンドで確認できます:
+
Linux 4.1 から、カーネルには vfio-pci が含まれおりpci-stub と同じような機能持ちながら、使用していないきはデバイス D3 状態にするどの機能が追加されています
   
  +
vfio-pci は基本的に PCI デバイスを ID で指定するため、パススルーしたいデバイスの ID を指定する必要があります。以下の IOMMU グループの場合、vfio-pci を {{ic|10de:13c2}} と {{ic|10de:0fbb}} にバインドします。
$ modprobe vfio-pci
 
   
  +
IOMMU Group 13 06:00.0 VGA compatible controller: NVIDIA Corporation GM204 [GeForce GTX 970] [10de:13c2] (rev a1)
何も出力がされなければ、問題ありません。{{ic|modprobe: FATAL: Module vfio-pci not found}} というメッセージが表示される場合、下にある {{ic|pci-stub}} を使う方法を見てください。
 
  +
IOMMU Group 13 06:00.1 Audio device: NVIDIA Corporation GM204 High Definition Audio Controller [10de:0fbb] (rev a1)}}
   
  +
{{note|
=== vfio-pci ===
 
  +
* ホスト GPU とゲスト GPU のベンダーとデバイス ID が同じ場合 (同じ型番の GPU を使っている場合)、ベンダーとデバイス ID を使ってデバイスを分離させることはできません。そのような場合は[[#ゲストとホストで同じ GPU を使う|ゲストとホストで同じ GPU を使う]]のセクションを読んでください。
  +
* [[#独立していない CPU ベースの PCIe スロットにゲスト GPU を接続した場合]]にあるように、PCI のルートポートが IOMMU グループに属している場合、ID を {{ic|vfio-pci}} に指定してはいけません。ルートポートを機能させるにはホスト側に割り当てたままにする必要があります。グループ内の他のデバイスも {{ic|vfio-pci}} にバインドされてしまいます。}}
   
  +
=== モジュールとして vfio-pci をロード ===
{{ic|modprobe.d}} から起動時に vfio-pci ドライバーがロードされるようにします。vfio-pci ドライバーには接続する PCI デバイスを指定する必要があります。上記の例にある3つの PCI デバイス全てを追加する場合、{{ic|modprobe.d}} には以下のように設定ファイルを作成します:
 
   
  +
{{Pkg|linux}} カーネルには組み込みモジュールとして vfio-pci が含まれていないため、設定でロードさせる必要があります。
{{hc|<nowiki>/etc/modprobe.d/vfio.conf</nowiki>|<nowiki>
 
  +
options vfio-pci ids=1002:6719,1002:aa80,10de:0392
 
  +
ベンダーとデバイス ID を vfio-pci に渡されるデフォルトパラメータに追加します:
  +
{{hc|1=/etc/modprobe.d/vfio.conf|2=options vfio-pci ids=10de:13c2,10de:0fbb}}
  +
  +
上記の設定だけでは vfio-pci が他のグラフィックドライバーよりも前にロードされるとは限りません。必ずロードされるようにするには、カーネルイメージの中で静的にバインドされるようにする必要があります。{{ic|vfio_pci}}, {{ic|vfio}}, {{ic|vfio_iommu_type1}}, {{ic|vfio_virqfd}} を [[mkinitcpio]] にこの順番で追加してください:
  +
  +
{{hc|/etc/mkinitcpio.conf|2=
  +
MODULES=(... vfio_pci vfio vfio_iommu_type1 vfio_virqfd ...)
  +
}}
  +
  +
{{Note|[[カーネルモード設定#KMS の早期開始|初期モードセッティング]]のために他のドライバー ({{ic|nouveau}}, {{ic|radeon}}, {{ic|amdgpu}}, {{ic|i915}} など) をロードしている場合、上記の VFIO モジュールが先にロードされるようにしてください。}}
  +
  +
さらに、{{ic|mkinitcpio.conf}} の HOOKS リストに modconf フックを追加してください:
  +
  +
{{hc|/etc/mkinitcpio.conf|2=
  +
HOOKS=(... modconf ...)
  +
}}
  +
  +
新しいモジュールを initramfs に追加したら、[[initramfs を再生成する]]必要があります。{{ic|/etc/modprobe.d/vfio.conf}} でデバイスの ID を変更した場合も、initramfs を再生成してください。パラメータは起動の初期段階で initramfs で指定される必要があります。
  +
  +
=== カーネルに vfio-pci が組み込まれている場合 ===
  +
  +
vfio-pci モジュールを組み込んだカーネルを使っている場合、以下のように[[カーネルパラメータ]]でデバイス ID を指定することで GPU を分離できます:
  +
  +
vfio-pci.ids=10de:13c2,10de:0fbb
  +
  +
=== 設定を確認 ===
  +
  +
再起動して vfio-pci が正しくロードされ適切なデバイスがバインドされていることを確認:
  +
  +
{{hc|$ dmesg {{!}} grep -i vfio|
  +
[ 0.329224] VFIO - User Level meta-driver version: 0.3
  +
[ 0.341372] vfio_pci: add [10de:13c2[ffff:ffff]] class 0x000000/00000000
  +
[ 0.354704] vfio_pci: add [10de:0fbb[ffff:ffff]] class 0x000000/00000000
  +
[ 2.061326] vfio-pci 0000:06:00.0: enabling device (0100 -> 0103)
  +
}}
  +
  +
{{ic|vfio.conf}} の全てのデバイス (期待するデバイスであっても) が dmesg に出力される必要はありません。起動時にデバイスが出力に現れなくてもゲスト VM から問題なく使うことができます。
  +
  +
{{hc|$ lspci -nnk -d 10de:13c2|
  +
06:00.0 VGA compatible controller: NVIDIA Corporation GM204 [GeForce GTX 970] [10de:13c2] (rev a1)
  +
Kernel driver in use: vfio-pci
  +
Kernel modules: nouveau nvidia}}
  +
  +
{{hc|$ lspci -nnk -d 10de:0fbb|
  +
06:00.1 Audio device: NVIDIA Corporation GM204 High Definition Audio Controller [10de:0fbb] (rev a1)
  +
Kernel driver in use: vfio-pci
  +
Kernel modules: snd_hda_intel}}
  +
  +
==OVMF によるゲスト VM のセットアップ==
  +
OVMF は QEMU 仮想マシン用のオープンソース UEFI ファームウェアです。SeaBIOS を使うことでも PCI パススルーと同じような結果を得ることはできますが、セットアップ手順が異なります。一般的にはハードウェアがサポートしているのであれば EFI を使用する方法を推奨します。
  +
  +
===libvirt の設定===
  +
[[libvirt]] は様々な仮想化ユーティリティのラッパーであり、仮想マシンの設定とデプロイを簡単にします。KVM と QEMU の場合、フロントエンドを使用することで QEMU 用にパーミッションを設定する必要がなくなり簡単に様々なデバイスを仮想マシンに追加・削除できます。ラッパーと名乗ってはいますが、QEMU の最新機能全てをサポートしているわけではありません。QEMU の引数を追加するためにラッパースクリプトを使用する必要がある場合もあります。
  +
  +
{{Pkg|qemu}}, {{Pkg|libvirt}}, {{Pkg|ovmf}}{{Broken package link|置換パッケージ: {{Pkg|edk2-ovmf}}}}, {{Pkg|virt-manager}} をインストールしてから、OVMF ファームウェアイメージとランタイム変数テンプレートのパスを libvirt の設定に追加して、{{ic|virt-install}} や {{ic|virt-manager}} が認識できるようにしてください:
  +
  +
{{hc|/etc/libvirt/qemu.conf|2=
  +
nvram = [
  +
"/usr/share/ovmf/x64/OVMF_CODE.fd:/usr/share/ovmf/x64/OVMF_VARS.fd"
  +
]
  +
}}
  +
  +
設定後、{{ic|libvirtd.service}} とログ出力コンポーネント {{ic|virtlogd.socket}} を[[起動]]・[[有効化]]します。
  +
  +
===ゲスト OS のセットアップ===
  +
{{ic|virt-manager}} による仮想マシンの設定は画面上の指示に従うだけで完了します。ただし、以下のステップでは特別な注意を払う必要があります:
  +
* 仮想マシンの作成ウィザードで VM の名前を付けるとき、"Customize before install" チェックボックスにチェックを入れてください。
  +
* "Overview" セクションで、ファームウェアを "UEFI" に設定してください [https://i.imgur.com/73r2ctM.png]。オプションがグレーになっている場合、{{ic|/etc/libvirt/qemu.conf}} でファームウェアの場所が正しく指定されているか確認してください。修正した後 {{ic|libvirtd.service}} を再起動してください。
  +
* "CPUs" セクションで、CPU モデルを "host-passthrough" に変更してください。リストに存在しない場合、手動で入力してください。これで libvirt が CPU の機能を実際の CPU と同じように反映するようになって CPU が正しく認識されるようになります。変更しないと、一部のアプリケーションで CPU のモデルが不明だとエラーが発生します。
  +
* IO のオーバーヘッドを抑えたい場合、"Add Hardware" から "VirtIO SCSI" モデルの SCSI ドライブのコントローラを追加してください。それからデフォルトの IDE ディスクを SCSI ディスクに変更して作成したコントローラーにバインドしてください。
  +
** Windows の仮想マシンはデフォルトでは SCSI ドライブを認識しないため、[https://fedorapeople.org/groups/virt/virtio-win/direct-downloads/latest-virtio/ こちら] からドライバーが含まれている ISO をダウンロードして IDE (あるいは Windows 7 以上の場合は SATA) の CD-ROM ストレージデバイスを作成してダウンロードした ISO にリンクしてください。この設定を行わないとインストール時に Windows がディスクを認識できません。Windows をインストールするディスクを選択するときは、''vioscsi'' 下の CD-ROM に含まれているドライバーをロードしてください。
  +
  +
他のインストールは通常と同じです。標準の QXL ビデオアダプタをウィンドウで実行します。現時点では、仮想デバイスのためのドライバーをインストールする必要はありません。ほとんどが後で削除されるためです。ゲスト OS のインストールが完了したら、仮想マシンをオフにしてください。最初の VM 起動時にインストールが始まらず UEFI メニューに戻ってしまう場合があります。場合によっては正しい ISO ファイルが自動的に認識されないために、起動ドライブを手動で指定する必要があります。 exit とタイプして "boot manager" に移動するとデバイス選択メニューに入ることができます。
  +
  +
===PCI デバイスの接続===
  +
インストールが完了したら、libvirt でハードウェアの詳細情報を編集して spice チャンネルや仮想ディスプレイ、QXL ビデオアダプタ、マウスやキーボード、USB タブレットデバイスのエミュレートなどの仮想デバイスを削除できます。入力デバイスがなくなるので、仮想マシンに USB ホストデバイスをバインドする場合、ゲストに何かあったときは最低でもひとつのマウスやキーボードをホストに割り当ててください。ここで、先に分離しておいた PCI デバイスを接続することができます。"Add Hardware" をクリックしてパススルーしたい PCI Host Device を選択してください。問題がなければ、GPU に接続されたディスプレイが OVMF のスプラッシュ画面を表示して通常通りに VM が起動します。そこから VM のドライバーの設定をおこなってください。
  +
  +
=== Evdev でキーボード・マウスを接続 ===
  +
  +
ゲスト用のスペアのマウスやキーボードを持っておらず、Spice のオーバーヘッドを避けたい場合、evdev を設定することでマウスとキーボードのコントロールをホストとゲストで切り替えることができます。まず、{{ic|/dev/input/by-id/}} からキーボードとマウスのデバイスを探してください。マウスやキーボードに複数のデバイスが関連付けられている場合、{{ic|cat /dev/input/by-id/''device_id''}} を試してみてキーを打ったりマウスを動かして入力が通ったかどうか確認してください。それからデバイスを設定に追加:
  +
  +
{{hc|$ virsh edit [vmname]|<nowiki>
  +
...
  +
<qemu:commandline>
  +
<qemu:arg value='-object'/>
  +
<qemu:arg value='input-linux,id=mouse1,evdev=/dev/input/by-id/MOUSE_NAME'/>
  +
<qemu:arg value='-object'/>
  +
<qemu:arg value='input-linux,id=kbd1,evdev=/dev/input/by-id/KEYBOARD_NAME,grab_all=on,repeat=on'/>
  +
</qemu:commandline>
  +
...
 
</nowiki>}}
 
</nowiki>}}
   
  +
{{ic|MOUSE_NAME}} と {{ic|KEYBOARD_NAME}} は適切なデバイス id に置き換えてください。それから qemu の設定にデバイスを記述して、ユーザーとグループが入力デバイスにアクセスできるように設定:
次に、起動時に vfio-pci を使うのに必要なモジュールをカーネルからロードするようにしてください:
 
   
{{hc|<nowiki>/etc/mkinitcpio.conf</nowiki>|<nowiki>...
+
{{hc|/etc/libvirt/qemu.conf|<nowiki>
  +
...
MODULES="vfio vfio_iommu_type1 vfio_pci vfio_virqfd"
 
  +
user = "<your_user>"
  +
group = "kvm"
  +
...
  +
cgroup_device_acl = [
  +
"/dev/kvm",
  +
"/dev/input/by-id/KEYBOARD_NAME",
  +
"/dev/input/by-id/MOUSE_NAME",
  +
"/dev/null", "/dev/full", "/dev/zero",
  +
"/dev/random", "/dev/urandom",
  +
"/dev/ptmx", "/dev/kvm", "/dev/kqemu",
  +
"/dev/rtc","/dev/hpet", "/dev/sev"
  +
]
  +
...
  +
</nowiki>}}
  +
  +
それから使用するユーザーが {{ic|kvm}} と {{ic|input}} [[ユーザーとグループ|グループ]]にアクセスできるようにしてください。{{ic|libvirtd.service}} を再起動してください。これでゲスト OS を起動したら左と右の Control キーを両方同時に押すことでマウスとキーボードを切り替えることができます。
  +
  +
設定で PS/2 から Virtio の入力に切り替えることもできます:
  +
  +
{{hc|$ virsh edit [vmname]|<nowiki>
  +
...
  +
<input type='mouse' bus='virtio'>
  +
<address type='pci' domain='0x0000' bus='0x00' slot='0x0e' function='0x0'/>
  +
</input>
  +
<input type='keyboard' bus='virtio'>
  +
<address type='pci' domain='0x0000' bus='0x00' slot='0x0f' function='0x0'/>
  +
</input>
  +
<input type='mouse' bus='ps2'/>
  +
<input type='keyboard' bus='ps2'/>
  +
...
  +
</nowiki>}}
  +
  +
ゲスト OS を起動してデバイスオン virtIO ドライバーをインストールしてください。
  +
  +
===注意事項===
  +
====OVMF ベースの VM で非 EFI イメージを使う====
  +
OVMF ファームウェアは EFI 以外のメディアの起動をサポートしていません。起動後に UEFI シェルが開かれてしまう場合、EFI ブートメディアに問題がある可能性があります。他の linux/windows イメージを使ってみてイメージに問題がないか確認してください。
  +
  +
==パフォーマンスチューニング==
  +
PCI パススルーを使うのはビデオゲームや GPU を使用する作業など大抵パフォーマンスが重要な場合です。PCI パススルーによってネイティブの性能に近づきますが、仮想マシンを最大限活用するにはホストとゲスト両方で設定が必要です。
  +
  +
===CPU ピニング===
  +
KVM ゲストではデフォルトでゲストから要求された操作を仮想プロセッサを表すスレッドとして実行します。スレッドは Linux のスケジューラによって他のスレッドと同じように管理され、nice 値や優先度にあわせて手隙の CPU コアに割り当てられます。スレッド切り替えにはオーバーヘッドが存在するため (コンテキストスイッチによってコアのキャッシュが強制的に変更されるため)、ゲストのパフォーマンスに悪い影響を与えます。CPU ピニングはこの問題を解決してプロセスのスケジューリングを上書きして VM のスレッドは特定のコアでのみ動作するようになります。例えば、ゲストのコア 0, 1, 2, 3 をホストの 4, 5, 6, 7 番目のコアに割り当てるには:
  +
  +
{{hc|$ virsh edit [vmname]|<nowiki>...
  +
<vcpu placement='static'>4</vcpu>
  +
<cputune>
  +
<vcpupin vcpu='0' cpuset='4'/>
  +
<vcpupin vcpu='1' cpuset='5'/>
  +
<vcpupin vcpu='2' cpuset='6'/>
  +
<vcpupin vcpu='3' cpuset='7'/>
  +
</cputune>
 
...</nowiki>}}
 
...</nowiki>}}
   
  +
====ハイパースレッディングの場合====
初期 RAM ディスク環境に変更を保存:
 
  +
CPU がハードウェアによるマルチタスクをサポートしている場合 (Intel のチップではハイパースレッディングと呼ばれます)、CPU ピニングをする方法は2つ存在します。ハイパースレッディングは1つの CPU で2つのスレッドを効率的に動作させる手法であるため、クアッドコア CPU ならば8つの論理コアが使えます。物理コアの負担率が高い場合、論理コアは使われません。VM のスレッドを2つの物理コアに割り当てても、2つのコアが対応できる負担を超える作業では2つの論理コアの補助を得ることができません。4つのコアのうち2つのコアをパススルーしただけだからです。
   
  +
以下はクアッドコアのマシンでハイパースレッディングが有効になっている場合の {{ic|/proc/cpuinfo}} の要約です:
# mkinitcpio -p linux
 
  +
{{hc|$ grep -e "processor" -e "core id" -e "^$" /proc/cpuinfo|
{{Note|標準のカーネルを使っていない場合、上記コマンドの "linux" は使用するカーネルに置き換えてください。}}
 
  +
processor : 0
  +
core id : 0
   
  +
processor : 1
initramfs の 'base' フックを使用しているとき、MODULES 配列に指定されたモジュールはブートプロセスの初期段階でロードされます。同じことは 'systemd' フックでも 'rd.modules-load' カーネルパラメータを使ってロードするモジュールを指定することで可能です。
 
  +
core id : 1
   
  +
processor : 2
rd.modules-load=vfio-pci,...
 
  +
core id : 2
   
  +
processor : 3
設定したら再起動して、デバイスが vfio-pci に割り当てられていることを dmesg の出力で確認してください:
 
  +
core id : 3
   
  +
processor : 4
{{hc|dmesg <nowiki>|</nowiki> grep -i vfio|...
 
  +
core id : 0
[ 0.456472] VFIO - User Level meta-driver version: 0.3
 
[ 0.470269] vfio_pci: add [10de:13c2[ffff:ffff]] class 0x000000/00000000
 
[ 0.483631] vfio_pci: add [10de:0fbb[ffff:ffff]] class 0x000000/00000000
 
[ 0.496998] vfio_pci: add [8086:8ca0[ffff:ffff]] class 0x000000/00000000
 
[ 2.420184] vfio-pci 0000:0a:00.0: enabling device (0000 -> 0003)
 
[ 38.590395] vfio_ecap_init: 0000:0a:00.0 hiding ecap 0x1e@0x258
 
[ 38.590413] vfio_ecap_init: 0000:0a:00.0 hiding ecap 0x19@0x900
 
[ 38.606881] vfio-pci 0000:0a:00.1: enabling device (0000 -> 0002)
 
[ 38.620241] vfio-pci 0000:00:1b.0: enabling device (0000 -> 0002)
 
...}}
 
   
  +
processor : 5
デバイス id と {{ic|lspci -nn}} の出力を相互に見比べてください。
 
  +
core id : 1
   
  +
processor : 6
=== pci-stub ===
 
  +
core id : 2
   
  +
processor : 7
カーネルが vfio-pci をサポートしていなくても、代わりに pci-stub モジュールが使えます。
 
  +
core id : 3}}
   
  +
仮想マシンを使っているときにホスト側で負担が重い計算をしない場合 (あるいはホストを全く使わない場合)、仮想マシンのスレッドを全ての論理コアに固定化して、仮想マシンがコアを活用できるようにすると良いでしょう。
{{ic|pci-stub}} を {{ic|/etc/mkinitcpio.conf}} に追加:
 
{{hc|<nowiki>/etc/mkinitcpio.conf</nowiki>|<nowiki>MODULES="... pci-stub ..."</nowiki>}}
 
上記で上手くいかない場合、{{ic|/etc/modules-load.d/}} にも追加してみてください:
 
# echo pci-stub > /etc/modules-load.d/vfio.conf
 
   
  +
クアッドコアのマシンの場合、以下のようになります:
PCI デバイス ID をカーネルコマンドラインに追加:
 
{{hc|<nowiki>/etc/mkinitcpio.conf</nowiki>|<nowiki>...
+
{{hc|$ virsh edit [vmname]|<nowiki>...
  +
<vcpu placement='static'>4</vcpu>
GRUB_CMDLINE_LINUX_DEFAULT="... pci-stub.ids=1002:6719,1002:aa80,10de:0392 ..."
 
  +
<cputune>
  +
<vcpupin vcpu='0' cpuset='4'/>
  +
<vcpupin vcpu='1' cpuset='5'/>
  +
<vcpupin vcpu='2' cpuset='6'/>
  +
<vcpupin vcpu='3' cpuset='7'/>
  +
</cputune>
  +
...
  +
<cpu mode='custom' match='exact'>
  +
...
  +
<topology sockets='1' cores='4' threads='1'/>
  +
...
  +
</cpu>
 
...</nowiki>}}
 
...</nowiki>}}
   
  +
ホストとゲストで同時に何か処理を行う場合、一部の物理コアとゲストのスレッドを固定して、後はホストでも使えるようにすると良いでしょう。
グラフィックカードの音声が別の PCI デバイスになっている場合、それも追加してください:
 
pci-stub.ids=1002:6719,1002:aa80
 
   
  +
クアッドコアのマシンの場合、以下のようになります:
grub の設定をリロード:
 
  +
{{hc|$ virsh edit [vmname]|<nowiki>...
  +
<vcpu placement='static'>4</vcpu>
  +
<cputune>
  +
<vcpupin vcpu='0' cpuset='2'/>
  +
<vcpupin vcpu='1' cpuset='6'/>
  +
<vcpupin vcpu='2' cpuset='3'/>
  +
<vcpupin vcpu='3' cpuset='7'/>
  +
</cputune>
  +
...
  +
<cpu mode='custom' match='exact'>
  +
...
  +
<topology sockets='1' cores='2' threads='2'/>
  +
...
  +
</cpu>
  +
...</nowiki>}}
   
  +
===静的ヒュージページ===
# grub-mkconfig -o /boot/grub/grub.cfg
 
  +
大量のメモリを必要するアプリケーションでは、メモリの遅延が問題になることがあります。使用するメモリページ (メモリ割り当ての基本単位) が増えれば増えるほど、複数のメモリページにまたがる情報にアプリケーションがアクセスするようになる確立が高まります。メモリページの実際のアドレスを解決するには複数のステップを踏まないとならないため、大抵の場合 CPU は最近使用されたメモリページの情報をキャッシュすることで同一ページの使用を高速化します。しかしながらアプリケーションが大量のメモリを使うとすると問題です。例えば仮想マシンが使用する 4GB のメモリが (メモリページのデフォルトサイズである) 4kB に分割されるような場合、頻繁にキャッシュミスが発生することになりメモリの遅延を増大させてしまいます。このような問題を緩和するためにヒュージページが存在します。大きなサイズのページをアプリケーションに割り当てることで、同一ページが使用される可能性を高めます。通常は必要に応じてヒュージページを動的に管理する、透過的ヒュージページが使用されます。
   
  +
しかしながら仮想マシンで PCI パススルーを使う場合は透過ヒュージページは意味がありません。IOMMU がゲストのメモリ割り当てを必要とし仮想マシンが起動するとすぐに固定化されるためです。したがってヒュージページの効果を得るには静的に割り当てる必要があります。
デバイスが pci-stub に割り当てられていることを dmesg の出力で確認:
 
{{hc|dmesg <nowiki>|</nowiki> grep pci-stub|
 
...
 
[ 2.390128] pci-stub: add 1002:6719 sub<nowiki>=</nowiki>FFFFFFFF:FFFFFFFF cls<nowiki>=</nowiki>00000000/00000000
 
[ 2.390143] pci-stub 0000:01:00.0: claimed by stub
 
[ 2.390150] pci-stub: add 1002:AA80 sub<nowiki>=</nowiki>FFFFFFFF:FFFFFFFF cls<nowiki>=</nowiki>00000000/00000000
 
[ 2.390159] pci-stub 0000:01:00.1: claimed by stub
 
[ 2.390150] pci-stub: add 1002:0392 sub<nowiki>=</nowiki>FFFFFFFF:FFFFFFFF cls<nowiki>=</nowiki>00000000/00000000
 
[ 2.390159] pci-stub 0000:04:00.0: claimed by stub
 
...}}
 
   
  +
{{warning|静的ヒュージページは割り当てられたメモリをロックダウンするため、普通のアプリケーションはそれらのメモリを使用できなくなります。8GB のメモリが搭載されたマシンでヒュージページに 4GB を割り当てると、ホストで使用できるメモリは 4GB だけになります。たとえ VM が実行中でなくてもそれは変わりません。}}
=== モジュールのブラックリスト ===
 
   
  +
起動時にヒュージページを割り当てるには、カーネルコマンドラインで {{ic|<nowiki>hugepages=x</nowiki>}} を使って適切な量を指定します。例えば {{ic|<nowiki>hugepages=1024</nowiki>}} として1024ページを予約すると、ヒュージページあたりデフォルトで 2048kB のサイズが割り当てられるため、仮想マシンが使用するための 2GB 分のメモリが作成されます。
あるいは、ホスト側ではパススルーする PCI デバイスのドライバーが必要ない場合 (ホストと VM で使用する GPU のメーカーが異なる場合など)、AMD の GPU なら {{ic|radeon}} や {{ic|fglrx}} を、NVIDIA の GPU では {{ic|nouveau}} や {{ic|nvidia}} を {{ic|/etc/modprobe.d/blacklist.conf}} からブラックリストに指定できます。
 
   
  +
CPU がサポートしていれば手動でページサイズを設定できます。{{ic|<nowiki>grep pdpe1gb /proc/cpuinfo</nowiki>}} を実行することで 1 GB のヒュージページがサポートされているか確認できます。カーネルパラメータで 1 GB のヒュージページサイズを設定するには: {{ic|<nowiki>default_hugepagesz=1G hugepagesz=1G hugepages=X transparent_hugepage=never</nowiki>}}。
例えば、オープンソースの radeon モジュールをブラックリストに入れるには:
 
{{hc|/etc/modprobe.d/modprobe.conf|blacklist radeon}}
 
   
  +
また、静的ヒュージページは要求を行ったアプリケーションだけが使用できるため、libvirt のドメイン設定に kvm が割り当てたヒュージページを活用するように設定を追加する必要があります:
=== VFIO に接続 ===
 
  +
{{hc|$ virsh edit [vmname]|<nowiki>...
  +
<memoryBacking>
  +
<hugepages/>
  +
</memoryBacking>
  +
...</nowiki>}}
   
  +
=== CPU 周波数ガバナー ===
カードを vfio に接続する方法はたくさんあります:
 
*[http://www.firewing1.com/howtos/fedora-20/create-gaming-virtual-machine-using-vfio-pci-passthrough-kvm firewing1 ウェブページ]。grub2-mkconfig の後の部分を見てください。
 
   
  +
[[CPU 周波数スケーリング|CPU ガバナー]]の設定によっては、仮想マシンのスレッドによって周波数が引き上がる閾値まで CPU の負担が達しないことがあります。KVM が自力で CPU の周波数を変更することはできないため、CPU の使用率が思うように上がらないとパフォーマンスが出ないという問題になる可能性があります。ゲスト側で CPU 負担が重い作業を実行している間に {{ic|watch lscpu}} によって報告される周波数に変化があるかどうか確認してみてください。周波数が最大値まで上がらない場合、[https://lime-technology.com/forum/index.php?topic=46664.msg447678#msg447678 CPU スケーリングがホスト OS によって制御されている] ことが原因かもしれません。その場合、全てのコアを最大周波数に設定してみてパフォーマンスが改善しないか確認してください。最新の Intel 製チップをデフォルトの P-State ドライバーで使用している場合、cpupower コマンドは[[CPU 周波数スケーリング#CPU 周波数ドライバー|効果がない]]ため、{{ic|/proc/cpuinfo}} を監視して CPU が最大周波数になっていることを確認してください。
== IOMMU グループ ==
 
   
  +
=== AMD CPU でパフォーマンスを改善する ===
完全な IOMMU グループだけがゲスト VM に付加されます。PCI デバイスが割り当てられているグループを確認するには:
 
   
  +
以前は AMD 環境では Nested Page Tables (NPT) を無効化することで KVM の GPU 性能を引き上げることができました。これは [https://sourceforge.net/p/kvm/bugs/230/ 非常に古いバグ] が原因で、トレードオフとして CPU の性能が落ちて、がたつきが発生することがありました。
{{hc|# find /sys/kernel/iommu_groups/ -type l|
 
  +
/sys/kernel/iommu_groups/0/devices/0000:00:00.0
 
  +
カーネル 4.14 と 4.9 から問題を解決する [https://patchwork.kernel.org/patch/10027525/ カーネルパッチ] がマージされています。公式の {{Pkg|linux}} または {{Pkg|linux-lts}} カーネルを使用している場合、パッチは既に適用されています (最新版のカーネルを使っていることを確認してください)。他のカーネルを使っている場合は手動でパッチを適用する必要があります。
/sys/kernel/iommu_groups/1/devices/0000:00:01.0
 
  +
/sys/kernel/iommu_groups/1/devices/0000:01:00.0
 
  +
{{Note|一部の Ryzen ユーザーによって上記パッチがテストされており、問題なく動作し GPU パススルーの性能がほとんどネイティブのレベルまで向上することが確認されています ([https://www.reddit.com/r/VFIO/comments/78i3jx/possible_fix_for_the_npt_issue_discussed_on_iommu/ こちらの Reddit スレッド] を参照)。}}
/sys/kernel/iommu_groups/1/devices/0000:01:00.1
 
  +
/sys/kernel/iommu_groups/2/devices/0000:00:02.0
 
  +
QEMU 3.1 から TOPOEXT cpuid フラグはデフォルトで無効になっています。AMD の CPU でハイパースレッディングを使うには手動で有効にする必要があります:
/sys/kernel/iommu_groups/3/devices/0000:00:16.0
 
  +
/sys/kernel/iommu_groups/4/devices/0000:00:1a.0
 
  +
<cpu mode='host-passthrough' check='none'>
/sys/kernel/iommu_groups/5/devices/0000:00:1b.0
 
  +
<topology sockets='1' cores='4' threads='2'/>
/sys/kernel/iommu_groups/6/devices/0000:00:1c.0
 
  +
<feature policy='require' name='topoext'/>
/sys/kernel/iommu_groups/7/devices/0000:00:1c.5
 
  +
</cpu>
/sys/kernel/iommu_groups/8/devices/0000:00:1c.6
 
  +
/sys/kernel/iommu_groups/9/devices/0000:00:1c.7
 
  +
コミット: https://git.qemu.org/?p=qemu.git;a=commit;h=7210a02c58572b2686a3a8d610c6628f87864aed
/sys/kernel/iommu_groups/9/devices/0000:05:00.0
 
  +
/sys/kernel/iommu_groups/10/devices/0000:00:1d.0
 
  +
== 特殊な構成 ==
/sys/kernel/iommu_groups/11/devices/0000:00:1f.0
 
  +
/sys/kernel/iommu_groups/11/devices/0000:00:1f.2
 
  +
特定の構成では特別な設定が必要になります。ホストあるいは VM が正しく動作しない場合、あなたのシステムが以下のどれかにあてはまっていないか確認してください。
/sys/kernel/iommu_groups/11/devices/0000:00:1f.3
 
  +
/sys/kernel/iommu_groups/12/devices/0000:02:00.0
 
  +
=== ゲストとホストで同じ GPU を使う ===
/sys/kernel/iommu_groups/12/devices/0000:02:00.1
 
  +
pci-stub と vfio-pci はどちらもベンダー・デバイス id の組み合わせを使って起動時にバインドするデバイスを認識するため、同じ ID の GPU が2つある場合、パススルードライバーをどちらか片方にバインドできません。スクリプトを使って {{ic|driver_override}} の pci バスアドレスによって割り当てる必要があります。
/sys/kernel/iommu_groups/13/devices/0000:03:00.0
 
  +
/sys/kernel/iommu_groups/14/devices/0000:04:00.0}}
 
  +
スクリプトを作成して vfio-pci をブート GPU 以外の全ての GPU にバインドすることができます。{{ic|/usr/bin/vfio-pci-override.sh}} スクリプトを作成:
  +
  +
{{bc|<nowiki>
  +
#!/bin/sh
  +
  +
for i in /sys/bus/pci/devices/*/boot_vga; do
  +
if [ $(cat "$i") -eq 0 ]; then
  +
GPU="${i%/boot_vga}"
  +
AUDIO="$(echo "$GPU" | sed -e "s/0$/1/")"
  +
echo "vfio-pci" > "$GPU/driver_override"
  +
if [ -d "$AUDIO" ]; then
  +
echo "vfio-pci" > "$AUDIO/driver_override"
  +
fi
  +
fi
  +
done
  +
  +
modprobe -i vfio-pci
  +
</nowiki>}}
  +
  +
{{ic|/etc/modprobe.d/vfio.conf}} を以下の内容で作成:
  +
install vfio-pci /usr/bin/vfio-pci-override.sh
  +
  +
{{ic|/etc/mkinitcpio.conf}} を編集:
  +
  +
MODULES からビデオドライバーを全て削除して {{ic|vfio-pci}} と {{ic|vfio_iommu_type1}} を追加してください:
  +
MODULES=(ext4 vfat vfio-pci vfio_iommu_type1)
  +
  +
{{ic|/etc/modprobe.d/vfio.conf}} と {{ic|/usr/bin/vfio-pci-override.sh}} を FILES に追加してください:
  +
FILES=(/etc/modprobe.d/vfio.conf /usr/bin/vfio-pci-override.sh)
  +
  +
initramfs を再生成して再起動してください:
  +
# mkinitcpio -p linux
  +
  +
=== ブート GPU をゲストにパススルー ===
  +
PCI パススルーをするときに {{ic|boot_vga}} とマークされた GPU は特殊なケースになります。ブートメッセージや BIOS の設定メニューなどを表示するのに BIOS がその GPU を必要とするためです。ブート GPU はパススルー時に [https://www.redhat.com/archives/vfio-users/2016-May/msg00224.html 自由に改造できる VGA ブート ROM のコピー] を作成します。システムから認識されるのは改造されたコピーになり、パススルードライバーによって不正な GPU として拒否される可能性があります。一般的には BIOS の設定でブート GPU を変更して代わりにホスト GPU を使用するか、あるいはそれが不可能な場合、マシンのホストとゲストのカードを交換することが推奨されます。
  +
  +
=== IOMMU グループのバイパス (ACS 上書きパッチ) ===
   
=== ACS Override パッチ ===
 
 
パススルーしたくない PCI デバイスもグループに入ってしまっている場合、Alex Williamson の ACS override パッチを使うことでデバイスを分離できます。その場合は [http://vfio.blogspot.com/2014/08/iommu-groups-inside-and-out.html 危険性] を承知してください。
 
パススルーしたくない PCI デバイスもグループに入ってしまっている場合、Alex Williamson の ACS override パッチを使うことでデバイスを分離できます。その場合は [http://vfio.blogspot.com/2014/08/iommu-groups-inside-and-out.html 危険性] を承知してください。
   
194行目: 426行目:
 
さらに、ACS override パッチはカーネルのコマンドラインオプションで有効にしなければなりません。パッチファイルは以下のドキュメントを追加します:
 
さらに、ACS override パッチはカーネルのコマンドラインオプションで有効にしなければなりません。パッチファイルは以下のドキュメントを追加します:
   
pcie_acs_override =
+
pcie_acs_override =
[PCIE] Override missing PCIe ACS support for:
+
[PCIE] Override missing PCIe ACS support for:
downstream
+
downstream
All downstream ports - full ACS capabilties
+
All downstream ports - full ACS capabilties
multifunction
+
multifunction
All multifunction devices - multifunction ACS subset
+
All multifunction devices - multifunction ACS subset
id:nnnn:nnnn
+
id:nnnn:nnnn
Specfic device - full ACS capabilities
+
Specfic device - full ACS capabilities
Specified as vid:did (vendor/device ID) in hex
+
Specified as vid:did (vendor/device ID) in hex
   
 
通常は {{ic|pcie_acs_override<nowiki>=</nowiki>downstream}} オプションで上手くいきます。
 
通常は {{ic|pcie_acs_override<nowiki>=</nowiki>downstream}} オプションで上手くいきます。
208行目: 440行目:
 
インストールと設定が終わったら、[[カーネルパラメータ|ブートローダーのカーネルパラメータ]]を再設定して {{ic|pcie_acs_override<nowiki>=</nowiki>}} オプションが有効になった状態で新しいカーネルをロードするようにしてください。
 
インストールと設定が終わったら、[[カーネルパラメータ|ブートローダーのカーネルパラメータ]]を再設定して {{ic|pcie_acs_override<nowiki>=</nowiki>}} オプションが有効になった状態で新しいカーネルをロードするようにしてください。
   
== QEMU のパーミッション ==
+
== QEMU で libvirt を使わない ==
   
  +
libvirt を使って仮想マシンをセットアップするかわりに、QEMU コマンドにカスタムパラメータを付けるだけで PCI パススルーを使用するように VM を起動できます。スクリプトによる設定などで有用です。
QEMU にハードウェアにアクセスする権限を与えてください (より安全な方法もあるかもしれません):
 
{{hc|<nowiki>/etc/libvirt/qemu.conf</nowiki>|<nowiki>...
 
user = "root"
 
group = "root"
 
clear_emulator_capabilities = 0</nowiki>}}
 
   
  +
[[#IOMMU のセットアップ]]と[[#GPU の分離]]を行ってから、[[QEMU]] の記事に従って仮想環境をセットアップして、[[QEMU#KVM を有効にする|KVM を有効]]にして {{ic|1=-device vfio-pci,host=07:00.0}} フラグを使ってください。識別子の (07:00.0) は GPU を分離するときに使用した実際のデバイスの ID に置き換えてください。
QEMU は VFIO ファイルの権限も必要とします。{{ic|/dev/vfio}} 内の番号付きファイルを全て記述してください:
 
   
  +
OVMF ファームウェアを利用するために、{{Pkg|ovmf}}{{Broken package link|置換パッケージ: {{Pkg|edk2-ovmf}}}} パッケージをインストールして、{{ic|/usr/share/ovmf/x64/OVMF_VARS.fd}} から {{ic|/tmp/MY_VARS.fd}} など一時的なディレクトリに UEFI 変数をコピーして QEMU コマンドに以下のパラメータを追加して OVMF のパスを指定します (パラメータの順序は重要です):
# ls -1 /dev/vfio
 
   
  +
* {{ic|1=-drive if=pflash,format=raw,readonly,file=/usr/share/ovmf/x64/OVMF_CODE.fd}} - OVMF ファームウェアバイナリを指定、readonly オプションに注意してください。
{{hc|<nowiki>/etc/libvirt/qemu.conf</nowiki>|<nowiki>...
 
  +
* {{ic|1=-drive if=pflash,format=raw,file=/tmp/MY_VARS.fd}} - 変数のパスを指定。
cgroup_device_acl = [
 
"/dev/null", "/dev/full", "/dev/zero",
 
"/dev/random", "/dev/urandom",
 
"/dev/ptmx", "/dev/kvm", "/dev/kqemu",
 
"/dev/rtc","/dev/hpet", "/dev/vfio/vfio",
 
"/dev/vfio/1"
 
]
 
...</nowiki>}}
 
   
  +
{{Note|OVMF の代わりに QEMU のデフォルトである SeaBIOS を使うこともできますが、パススルーの設定で問題が発生することがあるため推奨されません。}}
参照: [http://www.firewing1.com/howtos/fedora-20/create-gaming-virtual-machine-using-vfio-pci-passthrough-kvm firewing1 のウェブページ]。
 
   
  +
QEMU の記事を読んで [[QEMU#virtio ドライバーのインストール|virtio ドライバー]]の使用などパフォーマンスを向上させることができる設定を調べることを推奨します。
== QEMU のコマンド ==
 
   
  +
また、{{ic|1=-cpu host,kvm=off}} パラメータを使ってホストの CPU モデル情報を VM に渡して Nvidia などメーカーのデバイスドライバーから仮想環境でないと認識させる必要があるかもしれません。
VGA パススルーを使用して QEMU を実行するコマンドの例:
 
cp /usr/share/edk2.git/ovmf-x64/OVMF_VARS-pure-efi.fd /tmp/my_vars.fd
 
qemu-system-x86_64 \
 
-enable-kvm \
 
-m 2048 \
 
-cpu host,kvm=off \
 
-vga none \
 
-device vfio-pci,host=01:00.0 \
 
-drive if=pflash,format=raw,readonly,file=/usr/share/edk2.git/ovmf-x64/OVMF_CODE-pure-efi.fd \
 
-drive if=pflash,format=raw,file=/tmp/my_vars.fd
 
   
  +
==他のデバイスのパススルー==
{{ic|1=-enable KVM}} - システムの KVM を有効にして、AMD-VI/VT-D を使ってハードウェアの仮想化を行う。
 
  +
===USB コントローラ===
  +
マザーボードに接続された複数の USB コントローラが複数のグループにマッピングされている場合、USB デバイスの代わりに USB コントローラをパススルーすることができます。個別の USB デバイスではなくコントローラをパススルーすることには以下の利点があります:
   
  +
* 特定の操作 (スマートフォンのアップデートなど) でデバイスが切断されたり ID が変わったりしても、仮想マシンから突然認識されなくなることはありません。
{{ic|1=-m [number]}} - VM が使用するメモリの量を設定。
 
  +
* コントローラによって管理されている USB 端子を VM が直接扱うため、デバイスを接続・切断してもハイパーバイザに通知する必要がありません。
  +
* VM を起動したときにゲストにパススルーする USB デバイスがなくなってしまっていても Libvirt はエラーを出力しません。
   
  +
GPU と違って、大抵の USB コントローラのドライバーでは VM で使用するのに特殊な設定を必要としません。副作用を起こさずにホストとゲストの間で制御を受け渡すことができます。
{{ic|1=-cpu host, kvm=off}} - ホストの CPU をエミュレートする。{{ic|1=kvm=off}} を使用すると NVIDIA のカードがハイパーバイザーを検知できなくなってエラーを吐いて終了します。
 
   
  +
{{Warning|USB コントローラがリセットに対応していることを確認してください。[[#リセットに対応していないデバイスのパススルー]]を参照。}}
{{ic|1=-vga none}} - QEMU に組み込まれているグラフィックカードのエミュレーションを無効化。
 
   
  +
以下のコマンドを使うことでコントローラや端子とデバイスがどのように PCI デバイスと割り当てられているか確認することができます:
{{ic|1=-device vfio-pci,host=01:00.0 \}} - VGA パススルーするグラフィックカードの PCI アドレス。
 
   
  +
{{hc|$ <nowiki>for usb_ctrl in $(find /sys/bus/usb/devices/usb* -maxdepth 0 -type l); do pci_path="$(dirname "$(realpath "${usb_ctrl}")")"; echo "Bus $(cat "${usb_ctrl}/busnum") --> $(basename $pci_path) (IOMMU group $(basename $(realpath $pci_path/iommu_group)))"; lsusb -s "$(cat "${usb_ctrl}/busnum"):"; echo; done</nowiki>|
{{ic|1=-drive if=flash,format=raw,readonly,file=/usr/share/edk2.git/ovmf-x64/OVMF_CODE-pure-efi.fd}} - BIOS のアドレス。
 
  +
Bus 1 --> 0000:00:1a.0 (IOMMU group 4)
  +
Bus 001 Device 004: ID 04f2:b217 Chicony Electronics Co., Ltd Lenovo Integrated Camera (0.3MP)
  +
Bus 001 Device 007: ID 0a5c:21e6 Broadcom Corp. BCM20702 Bluetooth 4.0 [ThinkPad]
  +
Bus 001 Device 008: ID 0781:5530 SanDisk Corp. Cruzer
  +
Bus 001 Device 002: ID 8087:0024 Intel Corp. Integrated Rate Matching Hub
  +
Bus 001 Device 001: ID 1d6b:0002 Linux Foundation 2.0 root hub
   
  +
Bus 2 --> 0000:00:1d.0 (IOMMU group 9)
他のコマンドについては [[QEMU]] を見てください。
 
  +
Bus 002 Device 006: ID 0451:e012 Texas Instruments, Inc. TI-Nspire Calculator
  +
Bus 002 Device 002: ID 8087:0024 Intel Corp. Integrated Rate Matching Hub
  +
Bus 002 Device 001: ID 1d6b:0002 Linux Foundation 2.0 root hub}}
   
  +
上記のノートパソコンには2つの USB コントローラによる3つの USB ポートがあり、それぞれに IOMMU グループが存在します。例として Bus 001 はひとつの USB ポートを管理していますが (SanDisk の USB ペンドライブが接続されています)、内蔵ウェブカメラや bluetooth カードなど内部デバイスも管理されています。一方 Bus 002 は接続されている電卓以外は何も管理していません。3つ目のポートは空で、リスト上には表示されていませんが、実際は Bus 002 によって管理されています。
==OVMF を使用する VM を作成・設定==
 
   
  +
様々なデバイスを接続してみてどのコントローラがどのポートを管理しているか判断して、どのコントローラをパススルーするか決めたら、ゲスト設定の VM によって制御する PCI ホストデバイスのリストにコントローラを追加してください。他の設定は不要です。
virsh を使って VM を以下のように編集:
 
   
  +
{{Note|USB コントローラがリセットをサポートしていないか、独立したグループにないか、もしくはパススルーできない場合でも、[[udev]] ルールを通じて同様の結果を達成することが可能です。特定の USB ポートに接続された任意のデバイスを仮想マシンに自動的に接続できるようにする [https://github.com/olavmrk/usb-libvirt-hotplug] を参照して下さい。}}
{{bc|<nowiki><domain type='kvm'></nowiki>}}
 
   
  +
===PulseAudio で仮想マシンの音声出力をホストにパススルー===
{{bc|<nowiki><os>
 
  +
libvirt を使うことで仮想マシンの音声出力をアプリケーションとしてホストに転送することが可能です。複数の音声ストリームをホストの出力に転送でき、パススルーをサポートしていない音声出力デバイスで使うことができます。転送するには [[PulseAudio]] が必要です。
<loader readonly='yes' type='pflash'>/usr/share/edk2.git/ovmf-x64/OVMF_CODE-pure-efi.fd</loader>
 
<nvram template='/usr/share/edk2.git/ovmf-x64/OVMF_VARS-pure-efi.fd'/>
 
</os></nowiki>}}
 
{{bc|<nowiki><hyperv>
 
<relaxed state='off'/>
 
<vapic state='off'/>
 
<spinlocks state='off'/>
 
</hyperv></nowiki>}}
 
{{bc|<nowiki><features>
 
<kvm>
 
<hidden state='on'/>
 
</kvm>
 
</features></nowiki>}}
 
{{bc|<nowiki><clock>
 
<timer name='hypervclock' present='no'/>
 
</clock></nowiki>}}
 
   
  +
まず、{{ic|<nowiki>#user = ""</nowiki>}} 行のコメントを削除してください。それからクォートの中にユーザー名を入力してください。これで QEMU はユーザーの PulseAudio ストリームを転送するようになります。
[http://vfio.blogspot.com/2014/08/primary-graphics-assignment-without-vga.html Alex Williamson's blog - using virt-manager] のガイドでもいいですが、virt-manager から UEFI が認識されるようにするため、QEMU に ovmf のアドレスを指定する必要があります。{{ic|1=/etc/libvirt/qemu.conf}} を編集して末尾に以下を追加:
 
  +
{{hc|/etc/libvirt/qemu.conf|
nvram = [
 
  +
user <nowiki>=</nowiki> "example"}}
"/usr/share/edk2.git/ovmf-x64/OVMF_CODE-pure-efi.fd:/usr/share/edk2.git/ovmf-x64/OVMF_VARS-pure-efi.fd",
 
]
 
それから libvirtd を再起動:
 
# systemctl restart libvirtd.service
 
これで OK です。
 
   
  +
次に、libvirt の設定を変更してください。
== libvirtd を使用しない QEMU (CLI ベース) の完全な例 ==
 
   
  +
以下の行を:
以下のスクリプトは Samba と Synergy を起動して、仮想マシンを実行し、仮想マシンがシャットダウンした後に全てを終了します。この方法では libvirtd を実行・設定する必要がありませんが、確認は取れていません。
 
   
  +
{{hc|virsh edit [vmname]|
#!/bin/bash
 
  +
<domain type<nowiki>=</nowiki>'kvm'>
 
  +
}}
echo "Starting Samba"
 
sudo systemctl start smbd.service
 
sudo systemctl start nmbd.service
 
 
echo "Starting Synergy"
 
/usr/bin/synergys --daemon --config /etc/synergy.conf
 
 
# This is probably not neccesary, except when updating the OVMF bios
 
# echo "Removing old OVMF variables"
 
# rm -v ./Windows_ovmf_vars_x64.bin
 
# echo "Copying new OVMF variables"
 
# cp -v /usr/share/ovmf/x64/ovmf_vars_x64.bin ./Windows_ovmf_vars_x64.bin
 
 
echo "Exporting PulseAudio driver"
 
export QEMU_AUDIO_DRV="pa"
 
 
echo "Starting VM"
 
sudo \
 
qemu-system-x86_64 \
 
-serial none \
 
-parallel none \
 
-nodefaults \
 
-nodefconfig \
 
-enable-kvm \
 
-name Windows \
 
-cpu host,kvm=off,check \
 
-smp sockets=1,cores=4,threads=2 \
 
-m 12288 \
 
-soundhw hda \
 
-device ich9-usb-uhci3,id=uhci \
 
-device usb-ehci,id=ehci \
 
-device nec-usb-xhci,id=xhci \
 
-drive if=pflash,format=raw,readonly,file=/usr/share/ovmf/x64/ovmf_code_x64.bin \
 
-drive if=pflash,format=raw,file=./Windows_ovmf_vars_x64.bin \
 
-rtc base=localtime \
 
-boot order=c \
 
-net nic,vlan=0,macaddr=52:54:00:00:00:01,model=virtio,name=net0 \
 
-net bridge,vlan=0,name=bridge0,br=br0 \
 
-drive if=virtio,id=drive0,file=./Windows.img,format=raw,cache=none,aio=native \
 
-nographic \
 
-device vfio-pci,host=04:00.0,addr=09.0,multifunction=on \
 
-device vfio-pci,host=04:00.1,addr=09.1
 
 
# For GPU sound
 
# add ",multifunction=on" to GPU
 
# -device vfio-pci,host=04:00.1,addr=09.1
 
 
# Standard VGA
 
# Remove "-nographic \" and "-device vfio-pci" lines
 
# -vga std
 
 
# Install
 
# In addination to the steps "Standard VGA", add or change these options
 
# -boot order=d \
 
# -device ide-cd,drive=drive-cd-disk1,id=cd-disk1,unit=0,bus=ide.0 \
 
# -drive file=/run/media/melvin/primarydata/Data/OS/Windows_10.img,if=none,id=drive-cd-disk1,media=cdrom \
 
# -device ide-cd,drive=drive-cd-disk2,id=cd-disk2,unit=0,bus=ide.1 \
 
# -drive file=/run/media/melvin/primarydata/Data/OS/virtio-win-0.1.109.iso,if=none,id=drive-cd-disk2,media=cdrom \
 
 
echo "VM closed"
 
 
echo "Stopping Synergy"
 
pkill synergys
 
 
echo "Stopping Samba"
 
sudo systemctl stop smbd.service
 
sudo systemctl stop nmbd.service
 
   
  +
以下のように変更してください:
上記のサンプルに関する詳細は [https://www.redhat.com/archives/vfio-users/2015-August/msg00020.html Red Hat の vfio-users に投稿されたメール] を参照。
 
   
  +
{{hc|virsh edit [vmname]|
== Synergy で仮想マシンを制御 ==
 
  +
<domain type<nowiki>=</nowiki>'kvm' xmlns:qemu<nowiki>='http://libvirt.org/schemas/domain/qemu/1.0'</nowiki>>
[http://synergy-project.org/ Synergy] を使うことで複数のコンピュータ間で (たとえオペレーションシステムが異なっていても) 簡単にマウスやキーボードを共有することができます。ユースケースとしてはそれぞれ個別のモニターが接続されているコンピュータが机の上に複数ある状況が想定されています。詳しくは [[Synergy]] のページを見てください。
 
  +
}}
   
  +
そして libvirt の xml ファイルの末尾に QEMU PulseAudio 環境変数を設定してください。
Synergy を使って VM を制御したい場合、まず {{pkg|synergy}} パッケージを[[インストール]]してください。
 
   
  +
以下の行を:
また、Synergy サーバーはホストで動作させ、サーバーからデバイスにアクセスできるようにする必要があるため、キーボードやマウスは仮想マシンにパススルーしません。
 
   
  +
{{hc|virsh edit [vmname]|
synergy のサーバー設定を作成:
 
  +
</devices>
  +
</domain>
  +
}}
   
  +
以下のように変更してください:
{{hc|<nowiki>/etc/synergy.conf</nowiki>|<nowiki># Example config
 
section: screens
 
vm:
 
halfDuplexCapsLock = false
 
halfDuplexNumLock = false
 
halfDuplexScrollLock = false
 
xtestIsXineramaUnaware = false
 
switchCorners = none
 
switchCornerSize = 0
 
host:
 
halfDuplexCapsLock = false
 
halfDuplexNumLock = false
 
halfDuplexScrollLock = false
 
xtestIsXineramaUnaware = false
 
switchCorners = none
 
switchCornerSize = 0
 
end
 
   
  +
{{hc|virsh edit [vmname]|
section: aliases
 
  +
</devices>
vm:
 
  +
<qemu:commandline>
10.0.2.15 # default for vm
 
  +
<qemu:env name<nowiki>=</nowiki>'QEMU_AUDIO_DRV' value<nowiki>=</nowiki>'pa'/>
host:
 
  +
<qemu:env name<nowiki>=</nowiki>'QEMU_PA_SERVER' value<nowiki>=</nowiki>'/run/user/1000/pulse/native'/>
10.0.2.2 # default for host
 
  +
</qemu:commandline>
end
 
  +
</domain>
  +
}}
   
  +
user ディレクトリの 1000 はあなたが使用しているユーザーの uid に置き換えてください ({{ic|id}} コマンドを実行することで確認できます)。先に進む前にファイルを保存して終了しないと変更が登録されません。終了後に {{ic|<nowiki>Domain [vmname] XML configuration edited.</nowiki>}} というメッセージが表示されれば、変更が適用されたということです。
section: links
 
vm:
 
right = host
 
host:
 
left = vm
 
end
 
   
  +
設定したら {{ic|libvirtd}} サービスと {{ic|pulseaudio.service}} の[[Systemd/ユーザー|ユーザーサービス]]を再起動してください。
section: options
 
relativeMouseMoves = false
 
screenSaverSync = true
 
win32KeepForeground = false
 
switchCorners = none
 
switchCornerSize = 0
 
end</nowiki>}}
 
   
  +
これで仮想マシンの音声出力はアプリケーションとしてホストに転送されるようになります。{{Pkg|pavucontrol}} アプリケーションを使うことで出力デバイスを制御できます。Windows ゲストの場合、[[#ビデオカードの HDMI 出力からの音声がおかしい|メッセージシグナル割り込み]]を使用しないとノイズが発生するので注意してください。
{{ic|1=vm}} と {{ic|1=host}} は仮想マシンとホスト OS のホストネームに置き換えてください。
 
   
  +
==== QEMU 3.0 オーディオの変更 ====
Alt Gr キーが上手く動作しない場合は screens/vm セクションに {{ic|1=altgr = alt}} を追加してください。
 
   
  +
QEMU 3.0 以降では、オーディオパッチの一部がマージされました ([https://www.reddit.com/r/VFIO/comments/97iuov/qemu_30_released/e49wmyd/ reddit リンク])。パッチのいくつかはまだ正式に上流にマージされていないため、 {{AUR|qemu-patched}}{{Broken package link|パッケージが存在しません}} パッケージにはオーディオパッチが複数含まれています。
qemu を起動する前、あるいはスタートアップスクリプトで次を実行:
 
   
  +
新しいコードパスを使用するにはあなたの VM のセットアップに応じてチップセットを、例えば {{ic|pc-q35-3.0}} または {{ic|pc-i440fx-3.0}} (qemu 3.0 インストール後) に変更する必要があります:
$ /usr/bin/synergys --daemon --config /etc/synergy.conf
 
   
  +
{{hc|$ virsh edit [vmname]|
それから仮想マシンに synergy をクライアントとしてダウンロード・設定してください。設定は仮想 OS によります。ただし、User Networking Mode (デフォルト) で QEMU を実行する場合、ホストのデフォルト IP は {{ic|1=10.0.2.2}} になります。
 
  +
<domain type<nowiki>=</nowiki>'kvm'>
  +
...
  +
<os>
  +
<type arch<nowiki>=</nowiki>'x86_64' machine<nowiki>=</nowiki>'pc-q35-3.0'>hvm</type>
  +
...
  +
</os>
  +
}}
   
  +
{{hc|$ virsh edit [vmname]|
ゲームを遊んでいてマウスの動きがおかしかったり敏感すぎると感じた場合、{{ic|options}} セクションの {{ic|1=relativeMouseMoves = false}} という行を {{ic|1=relativeMouseMoves = true}} に変更して、ゲームをプレイ中は、{{ic|Scroll Lock}} キーを押してマウスを VM にロックしてください。
 
  +
<domain type<nowiki>=</nowiki>'kvm'>
  +
...
  +
<os>
  +
<type arch<nowiki>=</nowiki>'x86_64' machine<nowiki>=</nowiki>'pc-i440fx-3.0'>hvm</type>
  +
...
  +
</os>
  +
}}
   
  +
{{Note|
== オペレーティングシステム ==
 
  +
* {{AUR|qemu-patched}}{{Broken package link|パッケージが存在しません}} のコンパイル時間を早めるには {{ic|1=--target-list=x86_64-softmmu}} を使って qemu の x86_64 ゲストサポートのみコンパイルします。
  +
* Qemu 3.0 以降で PulseAudio をユーザーとして実行している場合に {{ic|1=/etc/libvirt/qemu.conf}} で {{ic|1= nographics_allow_host_audio = 1}} を有効にしたときは、上記の XML 引数 {{ic|qemu:env}} は必要''ありません''。QEMU/Libvirt で別のユーザーを使用する場合は、{{ic|QEMU_PA_SERVER}} 変数を維持する必要があります。そうしないとアクセス許可エラーが発生します。
  +
}}
   
  +
===注意事項===
オペレーティングシステムによっては、ある時点で起動しなくなってしまうことがあります。この問題を回避するには、{{ic|-vga none}} を {{ic|-vga qxl}} に置き換えて、オペレーティングシステムをインストールしてから、デバイスマネージャを開いてグラフィックカードの PCI デバイス ID が実際の GPU と同じであることを確認し、グラフィックカードのドライバーをインストールしてから、{{ic|-vga none}} に戻してください。
 
  +
====リセットに対応していないデバイスのパススルー====
  +
仮想マシンのシャットダウン時、ゲストが使用していたデバイスは全てシャットダウンの準備時に OS によって deinitialize されます。この状態ではデバイスは機能しなくなり、通常通りに機能させるには電源を入れ直さなくてはなりません。Linux は独自にパワーサイクルを処理しますが、デバイスのリセット方法がわからない場合、無効状態のままになりデバイスが利用不可能になります。Libvirt と Qemu はどちらも仮想マシンを完全に停止する前に全てのホスト PCI デバイスが再接続できる状態になっていることを求めるため、デバイスがリセットできない状態になると、"Shutting down" 状態でフリーズしてホストマシンを再起動するまで仮想マシンを再起動できなくなってしまいます。そのため、カーネルによってリセットが可能な PCI デバイスのみパススルーすることを推奨します。PCI デバイスの sysfs ノードに {{ic|reset}} ファイルが存在するかどうかでリセット可能かどうか確認できます (例: {{ic|/sys/bus/pci/devices/0000:00:1a.0/reset}})。
   
  +
以下の bash コマンドを実行するとどのデバイスがリセットできてどのデバイスがリセットできないか表示されます:
== Nvidia の GeForce Experience を機能させる ==
 
   
  +
{{hc|<nowiki>for iommu_group in $(find /sys/kernel/iommu_groups/ -maxdepth 1 -mindepth 1 -type d);do echo "IOMMU group $(basename "$iommu_group")"; for device in $(\ls -1 "$iommu_group"/devices/); do if [[ -e "$iommu_group"/devices/"$device"/reset ]]; then echo -n "[RESET]"; fi; echo -n $'\t';lspci -nns "$device"; done; done</nowiki>|
GeForce Experience からサポートされていない CPU が存在するとエラーが吐かれて、ゲームの最適化などの機能が機能しない場合、KVM モジュールに {{ic|1=ignore_msrs=1}} オプションを指定して実装されていない MSR へのアクセスを無視することで問題は解決します:
 
  +
IOMMU group 0
  +
00:00.0 Host bridge [0600]: Intel Corporation Xeon E3-1200 v2/Ivy Bridge DRAM Controller [8086:0158] (rev 09)
  +
IOMMU group 1
  +
00:01.0 PCI bridge [0604]: Intel Corporation Xeon E3-1200 v2/3rd Gen Core processor PCI Express Root Port [8086:0151] (rev 09)
  +
01:00.0 VGA compatible controller [0300]: NVIDIA Corporation GK208 [GeForce GT 720] [10de:1288] (rev a1)
  +
01:00.1 Audio device [0403]: NVIDIA Corporation GK208 HDMI/DP Audio Controller [10de:0e0f] (rev a1)
  +
IOMMU group 2
  +
00:14.0 USB controller [0c03]: Intel Corporation 7 Series/C210 Series Chipset Family USB xHCI Host Controller [8086:1e31] (rev 04)
  +
IOMMU group 4
  +
[RESET] 00:1a.0 USB controller [0c03]: Intel Corporation 7 Series/C210 Series Chipset Family USB Enhanced Host Controller #2 [8086:1e2d] (rev 04)
  +
IOMMU group 5
  +
[RESET] 00:1b.0 Audio device [0403]: Intel Corporation 7 Series/C210 Series Chipset Family High Definition Audio Controller [8086:1e20] (rev 04)
  +
IOMMU group 10
  +
[RESET] 00:1d.0 USB controller [0c03]: Intel Corporation 7 Series/C210 Series Chipset Family USB Enhanced Host Controller #1 [8086:1e26] (rev 04)
  +
IOMMU group 13
  +
06:00.0 VGA compatible controller [0300]: NVIDIA Corporation GM204 [GeForce GTX 970] [10de:13c2] (rev a1)
  +
06:00.1 Audio device [0403]: NVIDIA Corporation GM204 High Definition Audio Controller [10de:0fbb] (rev a1)
  +
}}
   
  +
上記の場合 00:14.0 の xHCI USB コントローラはリセットができないため、仮想マシンが正しくシャットダウンできなくなります。00:1b.0 の内蔵サウンドカードと 00:1a.0 および 00:1d.0 のコントローラはリセット可能であるため問題が起こりません。
{{hc|<nowiki>/etc/modprobe.d/kvm.conf</nowiki>|<nowiki>...
 
  +
options kvm ignore_msrs=1
 
  +
==トラブルシューティング==
  +
以下で問題が見つけられない場合、[[QEMU#トラブルシューティング]]も見てください。
  +
  +
===Windows の仮想マシンに NVIDIA の GPU をパススルーした場合に "Error 43 : Driver failed to load"===
  +
{{Note|以下の設定により Nvidia ドライバーによって起動時に SYSTEM_THREAD_EXCEPTION_NOT_HANDLED でクラッシュする問題も解決します。}}
  +
  +
バージョン 337.88 から、Windows の Nvidia ドライバーはハイパーバイザが動作しているかどうかを確認して、動作していることを認識すると Windows のデバイスマネージャに Error 43 を吐くようになりました。QEMU 2.5.0 と libvirt 1.3.3 以上では、ハイパーバイザの vendor_id を偽装することができ、Nvidia ドライバーを騙してロードさせることができます。QEMU コマンドの cpu パラメータに {{ic|<nowiki>hv_vendor_id=whatever</nowiki>}} を追加するか、libvirt のドメイン設定に以下の行を追加するだけです。ID は12文字ちょうどの英数字 (例: '1234567890ab') に設定してください。
  +
  +
{{hc|$ virsh edit [vmname]|<nowiki>...
  +
<features>
  +
<hyperv>
  +
...
  +
<vendor_id state='on' value='whatever'/>
  +
...
  +
</hyperv>
  +
...
  +
<kvm>
  +
<hidden state='on'/>
  +
</kvm>
  +
</features>
 
...</nowiki>}}
 
...</nowiki>}}
   
  +
古いバージョンの QEMU や libvirt を使用している場合は、ハイパーバイザの拡張を無効化する必要があり、かなり性能が落ちてしまいます。libvirt のドメイン設定ファイルに以下を記述してください:
{{Warning|未知の MSR のアクセスを無視すると、VM 内の他のソフトウェアや他の VM が動作しなくなる可能性があります。}}
 
  +
{{hc|$ virsh edit [vmname]|<nowiki>...
  +
<features>
  +
<hyperv>
  +
<relaxed state='on'/>
  +
<vapic state='on'/>
  +
<spinlocks state='on' retries='8191'/>
  +
</hyperv>
  +
...
  +
</features>
  +
...
  +
<clock offset='localtime'>
  +
<timer name='hypervclock' present='yes'/>
  +
</clock>
  +
...</nowiki>}}
  +
{{bc|<nowiki>...
  +
  +
<clock offset='localtime'>
  +
<timer name='hypervclock' present='no'/>
  +
</clock>
  +
...
  +
<features>
  +
<kvm>
  +
<hidden state='on'/>
  +
</kvm>
  +
...
  +
<hyperv>
  +
<relaxed state='off'/>
  +
<vapic state='off'/>
  +
<spinlocks state='off'/>
  +
</hyperv>
  +
...
  +
</features>
  +
...</nowiki>}}
  +
  +
====VM を起動した後に dmesg に "BAR 3: can't reserve [mem]" エラーが表示される====
  +
  +
上記の方法を試してもコード 43 が発生する場合、dmesg にメモリ予約エラーが記録されていないか確認してください:
  +
  +
vfio-pci 0000:09:00.0: BAR 3: can't reserve [mem 0xf0000000-0xf1ffffff 64bit pref]
  +
  +
上記のようなメッセージが出力される場合、グラフィックカードを接続している PCI ブリッジを確認してください。以下のコマンドでデバイスツリーを確認できます:
  +
  +
$ lspci -t
  +
  +
VM を起動する前に以下のコマンドを実行してください (ID は上記のコマンドで確認できた実際の ID に置き換えてください):
  +
  +
# echo 1 > /sys/bus/pci/devices/0000\:00\:03.1/remove
  +
# echo 1 > /sys/bus/pci/rescan
  +
  +
詳しくは [https://www.linuxquestions.org/questions/linux-kernel-70/kernel-fails-to-assign-memory-to-pcie-device-4175487043/ こちらの記事] を参照。
  +
  +
{{Note|おそらく {{ic|video<nowiki>=</nowiki>efifb:off}} [[カーネルパラメータ]]の設定も必要です [https://pve.proxmox.com/wiki/Pci_passthrough#BAR_3:_can.27t_reserve_.5Bmem.5D_error]。}}
  +
  +
===CPU 例外によってクラッシュが発生する===
  +
[[QEMU#特定の Windows のゲームやアプリケーションでクラッシュやブルスクリーンが発生する]]を参照。
  +
  +
===Windows の仮想マシンを起動したときに "System Thread Exception Not Handled"===
  +
[[QEMU#Windows の仮想マシンを起動したときに "System Thread Exception Not Handled"]] を参照。
  +
  +
===ビデオカードの HDMI 出力からの音声がおかしい===
  +
ビデオカードの HDMI 端子を使用したときに、ユーザーによっては仮想マシンの音声出力が遅れたり音が割れたりすることがあります。大抵の場合、グラフィックも遅れるようになります。解決方法としてはデフォルトの割り込み方法 (Line-Based Interrupts) の代わりに MSI (Message Signaled-Based Interrupts) を有効にする方法があります。
  +
  +
MSI がサポートされているか・有効になっているか確認するには、以下のコマンドを root で実行してください:
  +
# lspci -vs $device | grep 'MSI:'
  +
`$device` はカードのアドレスに置き換えてください (例: `01:00.0`)。
  +
  +
出力は以下のようになります:
  +
Capabilities: [60] MSI: Enable'''-''' Count=1/1 Maskable- 64bit+
  +
  +
{{ic|Enable}} の後ろの {{ic|-}} は MSI がサポートされおり VM によって使われていないことを意味します。{{ic|+}} であれば VM によって使われています。
  +
  +
有効にする手順は非常に複雑です。[https://forums.guru3d.com/showthread.php?t=378044 こちら] に設定の手順と概要が載っています。
  +
  +
他にも [http://lime-technology.com/wiki/index.php/UnRAID_6/VM_Guest_Support#Enable_MSI_for_Interrupts_to_Fix_HDMI_Audio_Support lime-technology の wiki] や [http://vfio.blogspot.it/2014/09/vfio-interrupts-and-how-to-coax-windows.html VFIO tips and tricks] の記事にヒントが載っています。
  +
  +
[https://github.com/CHEF-KOCH/MSI-utility MSI Utility (FOSS Version 2)] という UI ツールが64ビットの Windows 10 で動作しこの手順を簡素化します。
  +
  +
nVidia カードの 0 function の MSI を有効にするだけでは問題が解決しない場合 ({{ic|01:00.0 VGA compatible controller: NVIDIA Corporation GM206 [GeForce GTX 960] (rev a1) (prog-if 00 [VGA controller])}})、他の function の MSI も有効にする必要があります ({{ic|01:00.1 Audio device: NVIDIA Corporation Device 0fba (rev a1)}})。
  +
  +
=== intel_iommu を有効にしたときにホスト側で HDMI から音声が出力されない ===
  +
  +
{{ic|intel_iommu}} を有効にしたときにホストの Intel GPU の HDMI 出力デバイスが使えなくなった場合、{{ic|igfx_off}} (i.e. {{ic|intel_iommu<nowiki>=</nowiki>on,igfx_off}}) オプションを設定することで音声が出力できるようになることがあります。{{ic|igfx_off}} の設定について詳しくは [https://www.kernel.org/doc/Documentation/Intel-IOMMU.txt Intel-IOMMU.txt] の {{ic|Graphics Problems?}} を読んでください。
  +
  +
=== vfio_pci を有効化したあとに X が起動しない ===
  +
  +
ホスト GPU がセカンダリ GPU として認識されている場合、ゲスト GPU のドライバーをロードしようとしたときに X がエラーを起こします。Xorg の設定でホスト GPU の BusID を指定することで解決します。BusID は lspci や Xorg のログで確認できます。
  +
  +
{{hc|/etc/X11/xorg.conf.d/10-intel.conf|<nowiki>
  +
Section "Device"
  +
Identifier "Intel GPU"
  +
Driver "modesetting"
  +
BusID "PCI:0:2:0"
  +
EndSection
  +
</nowiki>}}
  +
  +
詳しくは [https://www.redhat.com/archives/vfio-users/2016-August/msg00025.html] を参照してください。
  +
  +
=== Chromium が内蔵グラフィックをアクセラレーションに使わない ===
  +
  +
Chromium はシステム内の GPU をできるかぎり多く検出してから使用する GPU を選択します (大抵はディスクリートの NVIDIA/AMD グラフィック)。使用する GPU は PCI デバイスによって選択されます。OpenGL レンダラが利用できるかどうかは考慮されません。結果として Chromium は内蔵 GPU を無視して、ゲスト VM が動作していてホスト環境から GPU が使えなくなっているかどうかに関係なく、{{ic|vfio-pci}} ドライバーに紐付けられた専用 GPU を使用しようとすることがあります。その場合 GPU が使えないためにソフトウェアレンダリングが使われることになります (CPU の負担が高まり、動画の再生が途切れがちになったりスクロールがスムーズに機能しなくなったりします)。
  +
  +
解決方法は [[Chromium 設定#特定の GPU の使用を強制する]]を見てください。
  +
  +
=== VM がひとつしかコアを使わない ===
  +
  +
IOMMU を有効にしてコアのカウントを 1 よりも大きくしても、VM が使用する CPU コアとスレッドがひとつしか現れないことがあります。解決するには {{ic|virt-manager}} で "Manually set CPU topology" を有効にして使用したい CPU ソケット・コア・スレッド数を設定してください。"Threads" は合計スレッド数ではなく各 CPU ごとのスレッド数なので注意してください。
  +
  +
=== パススルーは機能しているのに出力が表示されない ===
  +
  +
virt-manager を使用している場合、仮想マシンで UEFI ファームウェアが選択されていることを確認してください。また、仮想マシンに適切なデバイスが渡されていることも確認してください。
  +
  +
=== virt-manager のパーミッション問題 ===
  +
  +
virt-manager でパーミッションエラーが発生する場合、以下を {{ic|/etc/libvirt/qemu.conf}} に追加してください:
  +
  +
group="kvm"
  +
user="''user''"
  +
  +
上記で解決しない場合は使用しているユーザーアカウントを {{ic|kvm}} と {{ic|libvirt}} [[グループ]]に追加してください。
  +
  +
=== VM シャットダウン後にホストがロックアップする ===
  +
  +
Windows10 ゲストを実行している場合に、VM を長時間実行した後、ホストの複数の CPU コアがロックアップするという問題が発生することがあります ([https://bbs.archlinux.org/viewtopic.php?id=206050&p=2]を参照)。この問題を解決するには、ゲストにパススルーした GPU でメッセージシグナル割り込みを有効にしてみてください。有効化する方法のガイドは [https://forums.guru3d.com/threads/windows-line-based-vs-message-signaled-based-interrupts.378044/] にあります。
  +
  +
=== スリープ時にゲストが実行されているとホストがロックアップする ===
  +
  +
VFIO を有効にした仮想マシンを起動したまま、スリープ/復帰を行おうとすると不安定になることがあり、ホストマシンをシャットダウンしようとするとロックアップする既知の問題があります。以下の libvirt フックスクリプトと systemd ユニットを使用して、ゲストを実行している間にホストがスリープ状態になるのを防止することで問題を避けることができます。フックファイルの動作には実行権限が必要です。
  +
  +
{{hc|/etc/libvirt/hooks/qemu|<nowiki>
  +
#!/bin/bash
  +
  +
OBJECT="$1"
  +
OPERATION="$2"
  +
SUBOPERATION="$3"
  +
EXTRA_ARG="$4"
  +
  +
case "$OPERATION" in
  +
"prepare")
  +
systemctl start libvirt-nosleep@"$OBJECT"
  +
;;
  +
"release")
  +
systemctl stop libvirt-nosleep@"$OBJECT"
  +
;;
  +
esac
  +
</nowiki>}}
  +
  +
{{hc|/etc/systemd/system/libvirt-nosleep@.service|<nowiki>
  +
[Unit]
  +
Description=Preventing sleep while libvirt domain "%i" is running
  +
  +
[Service]
  +
Type=simple
  +
ExecStart=/usr/bin/systemd-inhibit --what=sleep --why="Libvirt domain \"%i\" is running" --who=%U --mode=block sleep infinity
  +
</nowiki>}}
  +
  +
=== ovmf のアップグレード後にブートできない ===
  +
ovmf-1:r23112.018432f0ce-1 からアップグレードしたときに起動できなくなった場合、 {{ic|/var/lib/libvirt/qemu/nvram}} にある古い *VARS.fd ファイルを削除する必要があります:
  +
  +
# mv /var/lib/libvirt/qemu/nvram/vmname_VARS.fd /var/lib/libvirt/qemu/nvram/vmname_VARS.fd.old
  +
  +
詳しくは {{Bug|57825}} を参照。
   
 
== 参照 ==
 
== 参照 ==
* [https://bbs.archlinux.org/viewtopic.php?id=162768 Discussion on Arch Linux forums] | [https://archive.is/kZYMt Archived link]
+
* [https://bbs.archlinux.org/viewtopic.php?id=162768 Arch Linux フォーラムの議論] | [https://archive.is/kZYMt アーカイブリンク]
* [https://docs.google.com/spreadsheet/ccc?key=0Aryg5nO-kBebdFozaW9tUWdVd2VHM0lvck95TUlpMlE User contributed hardware compatibility list]
+
* [https://docs.google.com/spreadsheet/ccc?key=0Aryg5nO-kBebdFozaW9tUWdVd2VHM0lvck95TUlpMlE ユーザーによるハードウェア互換リスト]
* [http://pastebin.com/rcnUZCv7 Example script from https://www.youtube.com/watch?v=37D2bRsthfI]
+
* [https://pastebin.com/rcnUZCv7 https://www.youtube.com/watch?v=37D2bRsthfI のサンプルスクリプト]
* [http://vfio.blogspot.com/ Complete tutorial for PCI passthrough]
+
* [https://vfio.blogspot.com/ PCI パススルーの完全なチュートリアル]
  +
* [https://www.redhat.com/archives/vfio-users/ VFIO users メーリングリスト]
  +
* [ircs://chat.freenode.net/vfio-users #vfio-users on freenode]
  +
* [https://www.youtube.com/watch?v=aLeWg11ZBn0 YouTube: Level1Linux - Ryzen による GPU パススルー]
  +
* [https://www.reddit.com/r/VFIO /r/VFIO: VFIOについての subreddit]

2023年9月2日 (土) 22:11時点における最新版

この記事あるいはセクションは翻訳の途中です。
ノート: 記事が古くなっているとの指摘がありました (議論: トーク:OVMF による PCI パススルー#)

関連記事

Open Virtual Machine Firmware (OVMF) は仮想マシンで UEFI を使えるようにするプロジェクトです。Linux 3.9 以上と最近のバージョンの QEMU では、グラフィックカードをパススルーすることが可能で、仮想マシンでネイティブと同じグラフィック性能を発揮することができ、グラフィック性能が要求されるタスクにおいて便利です。

デスクトップコンピュータに使用していない GPU が接続されている場合 (内蔵 GPU や古い OEM カードでもかまいません、ブランドが一致している必要はありません)、ハードウェアがサポートしていれば (#要件を参照)、あらゆる OS の仮想マシンで専用 GPU として(ほぼ)最大限の性能を活用できます。技術的な詳細は こちらのプレゼンテーション (pdf) を見てください。

目次

要件

VGA パススルーでは最先端の技術を使っているため、あなたのハードウェアでは使用できない可能性があります。パススルーを行うには以下の要件が満たされていなければなりません:

  • CPU がハードウェア仮想化 (KVM) と IOMMU (パススルー) をサポートしていること。
  • マザーボードが IOMMU をサポートしていること。
  • ゲスト GPU ROM が UEFI をサポートしていること。
    • このリストに載っている ROM に使用している GPU が存在し UEFI をサポートしていると書かれていれば、問題ありません。2012年以降の GPU はサポートされているはずです。Windows 8 との互換性があると売り出すには UEFI のサポートが要件だと Microsoft が決めたためです。

使用していないモニターやマウス、キーボードがあれば、それも仮想マシンに割り当てることができます (GPU はディスプレイが接続されていないと何も出力することができず Spice 接続では性能が上がりません)。何か問題が発生した場合でも、スペアの機材があればホストマシンは制御できます。

IOMMU のセットアップ

ノート:
  • IOMMU は Intel VT-d と AMD-Vi の総称です。
  • VT-d は ダイレクト I/O 向けインテル VT (Intel Virtualization Technology for Directed I/O) の略語です。インテル バーチャライゼーション・テクノロジー (Intel Virtualization Technology) の VT-x と混同しないようにしてください。 VT-x は単独のハードウェアプラットフォームを複数の「仮想」プラットフォームとして機能することを可能にする機能で、対して VT-d はシステムのセキュリティと信頼性を向上させると共に仮想化環境での I/O デバイスのパフォーマンスを向上させる機能です。

IOMMU によって PCI パススルーや障害または悪意あるデバイスからのメモリ保護機能を使うことができます。Wikipedia:Input-output memory management unit#AdvantagesMemory Management (computer programming): Could you explain IOMMU in plain English? を参照してください。

IOMMU の有効化

AMD-Vi/Intel VT-d が CPU によってサポートされていること、BIOS の設定で AMD-VI/VT-d が有効化されていることを確認してください。通常は他の CPU 機能と一緒に設定が並んでいるはずです (オーバークロック関連のメニューに存在することもあります)。設定における名前は機能名 ("Vt-d" あるいは "AMD-Vi") だったり、あるいは "Virtualization technology" などの曖昧な単語だったりします。マニュアルに載っていない場合もあります。

使用している CPU に応じて適切なカーネルパラメータを設定し、 IOMMU を有効にしてください:

  • Intel 製の CPU (VT-d) であれば intel_iommu=on を設定
  • AMD 製の CPU (AMD-Vi) ではカーネルが BIOS から IOMMU のサポートを検出し、自動で有効化されます

iommu=pt パラメータも追加してください。このパラメータによって Linux がパススルーしないデバイスに触らないようにすることができます。

再起動して、dmesg で IOMMU が有効になっていることを確認してください:

dmesg|grep -e DMAR -e IOMMU
[    0.000000] ACPI: DMAR 0x00000000BDCB1CB0 0000B8 (v01 INTEL  BDW      00000001 INTL 00000001)
[    0.000000] Intel-IOMMU: enabled
[    0.028879] dmar: IOMMU 0: reg_base_addr fed90000 ver 1:0 cap c0000020660462 ecap f0101a
[    0.028883] dmar: IOMMU 1: reg_base_addr fed91000 ver 1:0 cap d2008c20660462 ecap f010da
[    0.028950] IOAPIC id 8 under DRHD base  0xfed91000 IOMMU 1
[    0.536212] DMAR: No ATSR found
[    0.536229] IOMMU 0 0xfed90000: using Queued invalidation
[    0.536230] IOMMU 1 0xfed91000: using Queued invalidation
[    0.536231] IOMMU: Setting RMRR:
[    0.536241] IOMMU: Setting identity map for device 0000:00:02.0 [0xbf000000 - 0xcf1fffff]
[    0.537490] IOMMU: Setting identity map for device 0000:00:14.0 [0xbdea8000 - 0xbdeb6fff]
[    0.537512] IOMMU: Setting identity map for device 0000:00:1a.0 [0xbdea8000 - 0xbdeb6fff]
[    0.537530] IOMMU: Setting identity map for device 0000:00:1d.0 [0xbdea8000 - 0xbdeb6fff]
[    0.537543] IOMMU: Prepare 0-16MiB unity mapping for LPC
[    0.537549] IOMMU: Setting identity map for device 0000:00:1f.0 [0x0 - 0xffffff]
[    2.182790] [drm] DMAR active, disabling use of stolen memory

グループが正しいことを確認

以下のスクリプトを使うことで PCI デバイスが IOMMU グループにどのようにマッピングされたか確認できます。何も出力が返ってこない場合、IOMMU のサポートが有効になっていないかハードウェアが IOMMU をサポートしていないかのどちらかです。

#!/bin/bash
shopt -s nullglob
for d in /sys/kernel/iommu_groups/*/devices/*; do 
    n=${d#*/iommu_groups/*}; n=${n%%/*}
    printf 'IOMMU Group %s ' "$n"
    lspci -nns "${d##*/}"
done;

出力の例:

IOMMU Group 0 00:00.0 Host bridge [0600]: Intel Corporation 2nd Generation Core Processor Family DRAM Controller [8086:0104] (rev 09)
IOMMU Group 1 00:16.0 Communication controller [0780]: Intel Corporation 6 Series/C200 Series Chipset Family MEI Controller #1 [8086:1c3a] (rev 04)
IOMMU Group 2 00:19.0 Ethernet controller [0200]: Intel Corporation 82579LM Gigabit Network Connection [8086:1502] (rev 04)
IOMMU Group 3 00:1a.0 USB controller [0c03]: Intel Corporation 6 Series/C200 Series Chipset Family USB Enhanced Host Controller #2 [8086:1c2d] (rev  
...

IOMMU グループは仮想マシンにパススルーすることができる一番小さい単位の物理デバイスのセットです。例えば、上記の例の場合、06:00.0 の GPU と 6:00.1 のオーディオコントローラは IOMMU グループ13に属しており、両方一緒にしかパススルーすることができません。フロントの USB コントローラは USB 拡張コントローラ (グループ10) やリアの USB コントローラ (グループ4) と分かれているグループ (グループ2) なので、他のデバイスに影響を与えないで仮想マシンにパススルーすることができます

注意事項

独立していない CPU ベースの PCIe スロットにゲスト GPU を接続した場合

全ての PCI-E スロットは同じではありません。ほとんどのマザーボードでは PCIe スロットには CPU 由来のものと PCH 由来のものがあります。CPU によっては、プロセッサ由来の PCIe スロットは隔離することができず、その場合 PCI スロットは接続されているデバイスと一緒にグループ化されてしまいます。

IOMMU Group 1 00:01.0 PCI bridge: Intel Corporation Xeon E3-1200 v2/3rd Gen Core processor PCI Express Root Port (rev 09)
IOMMU Group 1 01:00.0 VGA compatible controller: NVIDIA Corporation GM107 [GeForce GTX 750] (rev a2)
IOMMU Group 1 01:00.1 Audio device: NVIDIA Corporation Device 0fbc (rev a1)

上記のようにゲスト GPU しか含まれていない場合は問題ありません。他の PCIe スロットに接続した場合や CPU や PCH の配置によって、同じグループに他のデバイスが含まれる場合、そのデバイスも一緒にパススルーすることになります。仮想マシンにデバイスをパススルーしても問題ない場合は次に進んでください。そうでない場合、他の PCIe スロットに GPU を接続してみて他のデバイスと分離できないか試してみてください。もしくは ACS 上書きパッチをインストールする方法もありますが、こちらは欠点があります。詳しくは #IOMMU グループのバイパス (ACS 上書きパッチ) を参照してください。

ノート: 他のデバイスと一緒にグループ化した場合、起動時に pci のルートポートとブリッジを vfio に紐付けたり VM に追加してはいけません。

GPU の分離

デバイスを仮想マシンに割り当てるには、ホストマシンとの干渉を避けるためにこのデバイスと同じ IOMMU グループを共有する全てのデバイスがスタブドライバまたは VFIO ドライバに置き換えられている必要があります。この処理はほとんどのデバイスでは VM が起動する直前に行われます。

しかし、GPU ドライバーは巨大で複雑なため、動的な再バインドはあまりサポートされておらず、ホストの GPU を仮想マシンにお互いのドライバーが衝突すること無く透過的にパススルーすることは通常できません。 VM が起動する前に代わりのドライバーに GPU を手動でバインドし、他のドライバーが GPU を使用できないようにすることを推奨します。

続くセクションでは、代わりのドライバーがブートプロセスの早期にバインドされるように GPU を構成する詳細な方法を記載します。これにより VM が要求するかドライバーがスイッチバックされるまでデバイスは活動を停止します。これは一旦システムが完全にオンラインになってからドライバを切り替えるよりも問題が少なく、好ましい方法と言えます。2つの方法が存在しますが、使用しているカーネルがサポートしている場合は vfio-pci を使用することが推奨されます。

警告: 設定後にマシンを再起動すると、設定を解除しないかぎりホストから GPU は使えなくなります。再起動する前にホストで使用する GPU が正しく (マザーボードがホスト GPU を使って表示するように) 設定されているか確認してください。

Linux 4.1 から、カーネルには vfio-pci が含まれており、pci-stub と同じような機能を持ちながら、使用していないときはデバイスを D3 状態にするなどの機能が追加されています。

vfio-pci は基本的に PCI デバイスを ID で指定するため、パススルーしたいデバイスの ID を指定する必要があります。以下の IOMMU グループの場合、vfio-pci を 10de:13c210de:0fbb にバインドします。

IOMMU Group 13 06:00.0 VGA compatible controller: NVIDIA Corporation GM204 [GeForce GTX 970] [10de:13c2] (rev a1)
IOMMU Group 13 06:00.1 Audio device: NVIDIA Corporation GM204 High Definition Audio Controller [10de:0fbb] (rev a1)}}
ノート:
  • ホスト GPU とゲスト GPU のベンダーとデバイス ID が同じ場合 (同じ型番の GPU を使っている場合)、ベンダーとデバイス ID を使ってデバイスを分離させることはできません。そのような場合はゲストとホストで同じ GPU を使うのセクションを読んでください。
  • #独立していない CPU ベースの PCIe スロットにゲスト GPU を接続した場合にあるように、PCI のルートポートが IOMMU グループに属している場合、ID を vfio-pci に指定してはいけません。ルートポートを機能させるにはホスト側に割り当てたままにする必要があります。グループ内の他のデバイスも vfio-pci にバインドされてしまいます。

モジュールとして vfio-pci をロード

linux カーネルには組み込みモジュールとして vfio-pci が含まれていないため、設定でロードさせる必要があります。

ベンダーとデバイス ID を vfio-pci に渡されるデフォルトパラメータに追加します:

/etc/modprobe.d/vfio.conf
options vfio-pci ids=10de:13c2,10de:0fbb

上記の設定だけでは vfio-pci が他のグラフィックドライバーよりも前にロードされるとは限りません。必ずロードされるようにするには、カーネルイメージの中で静的にバインドされるようにする必要があります。vfio_pci, vfio, vfio_iommu_type1, vfio_virqfdmkinitcpio にこの順番で追加してください:

/etc/mkinitcpio.conf
MODULES=(... vfio_pci vfio vfio_iommu_type1 vfio_virqfd ...)
ノート: 初期モードセッティングのために他のドライバー (nouveau, radeon, amdgpu, i915 など) をロードしている場合、上記の VFIO モジュールが先にロードされるようにしてください。

さらに、mkinitcpio.conf の HOOKS リストに modconf フックを追加してください:

/etc/mkinitcpio.conf
HOOKS=(... modconf ...)

新しいモジュールを initramfs に追加したら、initramfs を再生成する必要があります。/etc/modprobe.d/vfio.conf でデバイスの ID を変更した場合も、initramfs を再生成してください。パラメータは起動の初期段階で initramfs で指定される必要があります。

カーネルに vfio-pci が組み込まれている場合

vfio-pci モジュールを組み込んだカーネルを使っている場合、以下のようにカーネルパラメータでデバイス ID を指定することで GPU を分離できます:

vfio-pci.ids=10de:13c2,10de:0fbb

設定を確認

再起動して vfio-pci が正しくロードされ適切なデバイスがバインドされていることを確認:

$ dmesg | grep -i vfio
[    0.329224] VFIO - User Level meta-driver version: 0.3
[    0.341372] vfio_pci: add [10de:13c2[ffff:ffff]] class 0x000000/00000000
[    0.354704] vfio_pci: add [10de:0fbb[ffff:ffff]] class 0x000000/00000000
[    2.061326] vfio-pci 0000:06:00.0: enabling device (0100 -> 0103)

vfio.conf の全てのデバイス (期待するデバイスであっても) が dmesg に出力される必要はありません。起動時にデバイスが出力に現れなくてもゲスト VM から問題なく使うことができます。

$ lspci -nnk -d 10de:13c2
06:00.0 VGA compatible controller: NVIDIA Corporation GM204 [GeForce GTX 970] [10de:13c2] (rev a1)
	Kernel driver in use: vfio-pci
	Kernel modules: nouveau nvidia
$ lspci -nnk -d 10de:0fbb
06:00.1 Audio device: NVIDIA Corporation GM204 High Definition Audio Controller [10de:0fbb] (rev a1)
	Kernel driver in use: vfio-pci
	Kernel modules: snd_hda_intel

OVMF によるゲスト VM のセットアップ

OVMF は QEMU 仮想マシン用のオープンソース UEFI ファームウェアです。SeaBIOS を使うことでも PCI パススルーと同じような結果を得ることはできますが、セットアップ手順が異なります。一般的にはハードウェアがサポートしているのであれば EFI を使用する方法を推奨します。

libvirt の設定

libvirt は様々な仮想化ユーティリティのラッパーであり、仮想マシンの設定とデプロイを簡単にします。KVM と QEMU の場合、フロントエンドを使用することで QEMU 用にパーミッションを設定する必要がなくなり簡単に様々なデバイスを仮想マシンに追加・削除できます。ラッパーと名乗ってはいますが、QEMU の最新機能全てをサポートしているわけではありません。QEMU の引数を追加するためにラッパースクリプトを使用する必要がある場合もあります。

qemu, libvirt, ovmf[リンク切れ: 置換パッケージ: edk2-ovmf], virt-manager をインストールしてから、OVMF ファームウェアイメージとランタイム変数テンプレートのパスを libvirt の設定に追加して、virt-installvirt-manager が認識できるようにしてください:

/etc/libvirt/qemu.conf
nvram = [
	"/usr/share/ovmf/x64/OVMF_CODE.fd:/usr/share/ovmf/x64/OVMF_VARS.fd"
]

設定後、libvirtd.service とログ出力コンポーネント virtlogd.socket起動有効化します。

ゲスト OS のセットアップ

virt-manager による仮想マシンの設定は画面上の指示に従うだけで完了します。ただし、以下のステップでは特別な注意を払う必要があります:

  • 仮想マシンの作成ウィザードで VM の名前を付けるとき、"Customize before install" チェックボックスにチェックを入れてください。
  • "Overview" セクションで、ファームウェアを "UEFI" に設定してください [1]。オプションがグレーになっている場合、/etc/libvirt/qemu.conf でファームウェアの場所が正しく指定されているか確認してください。修正した後 libvirtd.service を再起動してください。
  • "CPUs" セクションで、CPU モデルを "host-passthrough" に変更してください。リストに存在しない場合、手動で入力してください。これで libvirt が CPU の機能を実際の CPU と同じように反映するようになって CPU が正しく認識されるようになります。変更しないと、一部のアプリケーションで CPU のモデルが不明だとエラーが発生します。
  • IO のオーバーヘッドを抑えたい場合、"Add Hardware" から "VirtIO SCSI" モデルの SCSI ドライブのコントローラを追加してください。それからデフォルトの IDE ディスクを SCSI ディスクに変更して作成したコントローラーにバインドしてください。
    • Windows の仮想マシンはデフォルトでは SCSI ドライブを認識しないため、こちら からドライバーが含まれている ISO をダウンロードして IDE (あるいは Windows 7 以上の場合は SATA) の CD-ROM ストレージデバイスを作成してダウンロードした ISO にリンクしてください。この設定を行わないとインストール時に Windows がディスクを認識できません。Windows をインストールするディスクを選択するときは、vioscsi 下の CD-ROM に含まれているドライバーをロードしてください。

他のインストールは通常と同じです。標準の QXL ビデオアダプタをウィンドウで実行します。現時点では、仮想デバイスのためのドライバーをインストールする必要はありません。ほとんどが後で削除されるためです。ゲスト OS のインストールが完了したら、仮想マシンをオフにしてください。最初の VM 起動時にインストールが始まらず UEFI メニューに戻ってしまう場合があります。場合によっては正しい ISO ファイルが自動的に認識されないために、起動ドライブを手動で指定する必要があります。 exit とタイプして "boot manager" に移動するとデバイス選択メニューに入ることができます。

PCI デバイスの接続

インストールが完了したら、libvirt でハードウェアの詳細情報を編集して spice チャンネルや仮想ディスプレイ、QXL ビデオアダプタ、マウスやキーボード、USB タブレットデバイスのエミュレートなどの仮想デバイスを削除できます。入力デバイスがなくなるので、仮想マシンに USB ホストデバイスをバインドする場合、ゲストに何かあったときは最低でもひとつのマウスやキーボードをホストに割り当ててください。ここで、先に分離しておいた PCI デバイスを接続することができます。"Add Hardware" をクリックしてパススルーしたい PCI Host Device を選択してください。問題がなければ、GPU に接続されたディスプレイが OVMF のスプラッシュ画面を表示して通常通りに VM が起動します。そこから VM のドライバーの設定をおこなってください。

Evdev でキーボード・マウスを接続

ゲスト用のスペアのマウスやキーボードを持っておらず、Spice のオーバーヘッドを避けたい場合、evdev を設定することでマウスとキーボードのコントロールをホストとゲストで切り替えることができます。まず、/dev/input/by-id/ からキーボードとマウスのデバイスを探してください。マウスやキーボードに複数のデバイスが関連付けられている場合、cat /dev/input/by-id/device_id を試してみてキーを打ったりマウスを動かして入力が通ったかどうか確認してください。それからデバイスを設定に追加:

$ virsh edit [vmname]
...
 <qemu:commandline>
 <qemu:arg value='-object'/>
 <qemu:arg value='input-linux,id=mouse1,evdev=/dev/input/by-id/MOUSE_NAME'/>
 <qemu:arg value='-object'/>
 <qemu:arg value='input-linux,id=kbd1,evdev=/dev/input/by-id/KEYBOARD_NAME,grab_all=on,repeat=on'/>
 </qemu:commandline>
...

MOUSE_NAMEKEYBOARD_NAME は適切なデバイス id に置き換えてください。それから qemu の設定にデバイスを記述して、ユーザーとグループが入力デバイスにアクセスできるように設定:

/etc/libvirt/qemu.conf
...
user = "<your_user>"
group = "kvm"
...
cgroup_device_acl = [
    "/dev/kvm",
    "/dev/input/by-id/KEYBOARD_NAME",
    "/dev/input/by-id/MOUSE_NAME",
    "/dev/null", "/dev/full", "/dev/zero",
    "/dev/random", "/dev/urandom",
    "/dev/ptmx", "/dev/kvm", "/dev/kqemu",
    "/dev/rtc","/dev/hpet", "/dev/sev"
]
...

それから使用するユーザーが kvminput グループにアクセスできるようにしてください。libvirtd.service を再起動してください。これでゲスト OS を起動したら左と右の Control キーを両方同時に押すことでマウスとキーボードを切り替えることができます。

設定で PS/2 から Virtio の入力に切り替えることもできます:

$ virsh edit [vmname]
...
<input type='mouse' bus='virtio'>
        <address type='pci' domain='0x0000' bus='0x00' slot='0x0e' function='0x0'/>
</input>
<input type='keyboard' bus='virtio'>
        <address type='pci' domain='0x0000' bus='0x00' slot='0x0f' function='0x0'/>
</input>
<input type='mouse' bus='ps2'/>
<input type='keyboard' bus='ps2'/>
...

ゲスト OS を起動してデバイスオン virtIO ドライバーをインストールしてください。

注意事項

OVMF ベースの VM で非 EFI イメージを使う

OVMF ファームウェアは EFI 以外のメディアの起動をサポートしていません。起動後に UEFI シェルが開かれてしまう場合、EFI ブートメディアに問題がある可能性があります。他の linux/windows イメージを使ってみてイメージに問題がないか確認してください。

パフォーマンスチューニング

PCI パススルーを使うのはビデオゲームや GPU を使用する作業など大抵パフォーマンスが重要な場合です。PCI パススルーによってネイティブの性能に近づきますが、仮想マシンを最大限活用するにはホストとゲスト両方で設定が必要です。

CPU ピニング

KVM ゲストではデフォルトでゲストから要求された操作を仮想プロセッサを表すスレッドとして実行します。スレッドは Linux のスケジューラによって他のスレッドと同じように管理され、nice 値や優先度にあわせて手隙の CPU コアに割り当てられます。スレッド切り替えにはオーバーヘッドが存在するため (コンテキストスイッチによってコアのキャッシュが強制的に変更されるため)、ゲストのパフォーマンスに悪い影響を与えます。CPU ピニングはこの問題を解決してプロセスのスケジューリングを上書きして VM のスレッドは特定のコアでのみ動作するようになります。例えば、ゲストのコア 0, 1, 2, 3 をホストの 4, 5, 6, 7 番目のコアに割り当てるには:

$ virsh edit [vmname]
...
<vcpu placement='static'>4</vcpu>
<cputune>
    <vcpupin vcpu='0' cpuset='4'/>
    <vcpupin vcpu='1' cpuset='5'/>
    <vcpupin vcpu='2' cpuset='6'/>
    <vcpupin vcpu='3' cpuset='7'/>
</cputune>
...

ハイパースレッディングの場合

CPU がハードウェアによるマルチタスクをサポートしている場合 (Intel のチップではハイパースレッディングと呼ばれます)、CPU ピニングをする方法は2つ存在します。ハイパースレッディングは1つの CPU で2つのスレッドを効率的に動作させる手法であるため、クアッドコア CPU ならば8つの論理コアが使えます。物理コアの負担率が高い場合、論理コアは使われません。VM のスレッドを2つの物理コアに割り当てても、2つのコアが対応できる負担を超える作業では2つの論理コアの補助を得ることができません。4つのコアのうち2つのコアをパススルーしただけだからです。

以下はクアッドコアのマシンでハイパースレッディングが有効になっている場合の /proc/cpuinfo の要約です:

$ grep -e "processor" -e "core id" -e "^$" /proc/cpuinfo
processor	: 0
core id		: 0

processor	: 1
core id		: 1

processor	: 2
core id		: 2

processor	: 3
core id		: 3

processor	: 4
core id		: 0

processor	: 5
core id		: 1

processor	: 6
core id		: 2

processor	: 7
core id		: 3

仮想マシンを使っているときにホスト側で負担が重い計算をしない場合 (あるいはホストを全く使わない場合)、仮想マシンのスレッドを全ての論理コアに固定化して、仮想マシンがコアを活用できるようにすると良いでしょう。

クアッドコアのマシンの場合、以下のようになります:

$ virsh edit [vmname]
...
<vcpu placement='static'>4</vcpu>
<cputune>
    <vcpupin vcpu='0' cpuset='4'/>
    <vcpupin vcpu='1' cpuset='5'/>
    <vcpupin vcpu='2' cpuset='6'/>
    <vcpupin vcpu='3' cpuset='7'/>
</cputune>
...
<cpu mode='custom' match='exact'>
    ...
    <topology sockets='1' cores='4' threads='1'/>
    ...
</cpu>
...

ホストとゲストで同時に何か処理を行う場合、一部の物理コアとゲストのスレッドを固定して、後はホストでも使えるようにすると良いでしょう。

クアッドコアのマシンの場合、以下のようになります:

$ virsh edit [vmname]
...
<vcpu placement='static'>4</vcpu>
<cputune>
    <vcpupin vcpu='0' cpuset='2'/>
    <vcpupin vcpu='1' cpuset='6'/>
    <vcpupin vcpu='2' cpuset='3'/>
    <vcpupin vcpu='3' cpuset='7'/>
</cputune>
...
<cpu mode='custom' match='exact'>
    ...
    <topology sockets='1' cores='2' threads='2'/>
    ...
</cpu>
...

静的ヒュージページ

大量のメモリを必要するアプリケーションでは、メモリの遅延が問題になることがあります。使用するメモリページ (メモリ割り当ての基本単位) が増えれば増えるほど、複数のメモリページにまたがる情報にアプリケーションがアクセスするようになる確立が高まります。メモリページの実際のアドレスを解決するには複数のステップを踏まないとならないため、大抵の場合 CPU は最近使用されたメモリページの情報をキャッシュすることで同一ページの使用を高速化します。しかしながらアプリケーションが大量のメモリを使うとすると問題です。例えば仮想マシンが使用する 4GB のメモリが (メモリページのデフォルトサイズである) 4kB に分割されるような場合、頻繁にキャッシュミスが発生することになりメモリの遅延を増大させてしまいます。このような問題を緩和するためにヒュージページが存在します。大きなサイズのページをアプリケーションに割り当てることで、同一ページが使用される可能性を高めます。通常は必要に応じてヒュージページを動的に管理する、透過的ヒュージページが使用されます。

しかしながら仮想マシンで PCI パススルーを使う場合は透過ヒュージページは意味がありません。IOMMU がゲストのメモリ割り当てを必要とし仮想マシンが起動するとすぐに固定化されるためです。したがってヒュージページの効果を得るには静的に割り当てる必要があります。

警告: 静的ヒュージページは割り当てられたメモリをロックダウンするため、普通のアプリケーションはそれらのメモリを使用できなくなります。8GB のメモリが搭載されたマシンでヒュージページに 4GB を割り当てると、ホストで使用できるメモリは 4GB だけになります。たとえ VM が実行中でなくてもそれは変わりません。

起動時にヒュージページを割り当てるには、カーネルコマンドラインで hugepages=x を使って適切な量を指定します。例えば hugepages=1024 として1024ページを予約すると、ヒュージページあたりデフォルトで 2048kB のサイズが割り当てられるため、仮想マシンが使用するための 2GB 分のメモリが作成されます。

CPU がサポートしていれば手動でページサイズを設定できます。grep pdpe1gb /proc/cpuinfo を実行することで 1 GB のヒュージページがサポートされているか確認できます。カーネルパラメータで 1 GB のヒュージページサイズを設定するには: default_hugepagesz=1G hugepagesz=1G hugepages=X transparent_hugepage=never

また、静的ヒュージページは要求を行ったアプリケーションだけが使用できるため、libvirt のドメイン設定に kvm が割り当てたヒュージページを活用するように設定を追加する必要があります:

$ virsh edit [vmname]
...
<memoryBacking>
	<hugepages/>
</memoryBacking>
...

CPU 周波数ガバナー

CPU ガバナーの設定によっては、仮想マシンのスレッドによって周波数が引き上がる閾値まで CPU の負担が達しないことがあります。KVM が自力で CPU の周波数を変更することはできないため、CPU の使用率が思うように上がらないとパフォーマンスが出ないという問題になる可能性があります。ゲスト側で CPU 負担が重い作業を実行している間に watch lscpu によって報告される周波数に変化があるかどうか確認してみてください。周波数が最大値まで上がらない場合、CPU スケーリングがホスト OS によって制御されている ことが原因かもしれません。その場合、全てのコアを最大周波数に設定してみてパフォーマンスが改善しないか確認してください。最新の Intel 製チップをデフォルトの P-State ドライバーで使用している場合、cpupower コマンドは効果がないため、/proc/cpuinfo を監視して CPU が最大周波数になっていることを確認してください。

AMD CPU でパフォーマンスを改善する

以前は AMD 環境では Nested Page Tables (NPT) を無効化することで KVM の GPU 性能を引き上げることができました。これは 非常に古いバグ が原因で、トレードオフとして CPU の性能が落ちて、がたつきが発生することがありました。

カーネル 4.14 と 4.9 から問題を解決する カーネルパッチ がマージされています。公式の linux または linux-lts カーネルを使用している場合、パッチは既に適用されています (最新版のカーネルを使っていることを確認してください)。他のカーネルを使っている場合は手動でパッチを適用する必要があります。

ノート: 一部の Ryzen ユーザーによって上記パッチがテストされており、問題なく動作し GPU パススルーの性能がほとんどネイティブのレベルまで向上することが確認されています (こちらの Reddit スレッド を参照)。

QEMU 3.1 から TOPOEXT cpuid フラグはデフォルトで無効になっています。AMD の CPU でハイパースレッディングを使うには手動で有効にする必要があります:

<cpu mode='host-passthrough' check='none'>
<topology sockets='1' cores='4' threads='2'/>
<feature policy='require' name='topoext'/>
</cpu>

コミット: https://git.qemu.org/?p=qemu.git;a=commit;h=7210a02c58572b2686a3a8d610c6628f87864aed

特殊な構成

特定の構成では特別な設定が必要になります。ホストあるいは VM が正しく動作しない場合、あなたのシステムが以下のどれかにあてはまっていないか確認してください。

ゲストとホストで同じ GPU を使う

pci-stub と vfio-pci はどちらもベンダー・デバイス id の組み合わせを使って起動時にバインドするデバイスを認識するため、同じ ID の GPU が2つある場合、パススルードライバーをどちらか片方にバインドできません。スクリプトを使って driver_override の pci バスアドレスによって割り当てる必要があります。

スクリプトを作成して vfio-pci をブート GPU 以外の全ての GPU にバインドすることができます。/usr/bin/vfio-pci-override.sh スクリプトを作成:

#!/bin/sh

for i in /sys/bus/pci/devices/*/boot_vga; do
	if [ $(cat "$i") -eq 0 ]; then
		GPU="${i%/boot_vga}"
		AUDIO="$(echo "$GPU" | sed -e "s/0$/1/")"
		echo "vfio-pci" > "$GPU/driver_override"
		if [ -d "$AUDIO" ]; then
			echo "vfio-pci" > "$AUDIO/driver_override"
		fi
	fi
done

modprobe -i vfio-pci

/etc/modprobe.d/vfio.conf を以下の内容で作成:

install vfio-pci /usr/bin/vfio-pci-override.sh

/etc/mkinitcpio.conf を編集:

MODULES からビデオドライバーを全て削除して vfio-pcivfio_iommu_type1 を追加してください:

MODULES=(ext4 vfat vfio-pci vfio_iommu_type1)

/etc/modprobe.d/vfio.conf/usr/bin/vfio-pci-override.sh を FILES に追加してください:

FILES=(/etc/modprobe.d/vfio.conf /usr/bin/vfio-pci-override.sh)

initramfs を再生成して再起動してください:

# mkinitcpio -p linux

ブート GPU をゲストにパススルー

PCI パススルーをするときに boot_vga とマークされた GPU は特殊なケースになります。ブートメッセージや BIOS の設定メニューなどを表示するのに BIOS がその GPU を必要とするためです。ブート GPU はパススルー時に 自由に改造できる VGA ブート ROM のコピー を作成します。システムから認識されるのは改造されたコピーになり、パススルードライバーによって不正な GPU として拒否される可能性があります。一般的には BIOS の設定でブート GPU を変更して代わりにホスト GPU を使用するか、あるいはそれが不可能な場合、マシンのホストとゲストのカードを交換することが推奨されます。

IOMMU グループのバイパス (ACS 上書きパッチ)

パススルーしたくない PCI デバイスもグループに入ってしまっている場合、Alex Williamson の ACS override パッチを使うことでデバイスを分離できます。その場合は 危険性 を承知してください。

パッチが適用されたカーネルが必要になります。linux-vfioAUR パッケージでカーネルをインストールするのが一番簡単です。

さらに、ACS override パッチはカーネルのコマンドラインオプションで有効にしなければなりません。パッチファイルは以下のドキュメントを追加します:

pcie_acs_override =
        [PCIE] Override missing PCIe ACS support for:
    downstream
        All downstream ports - full ACS capabilties
    multifunction
        All multifunction devices - multifunction ACS subset
    id:nnnn:nnnn
        Specfic device - full ACS capabilities
        Specified as vid:did (vendor/device ID) in hex

通常は pcie_acs_override=downstream オプションで上手くいきます。

インストールと設定が終わったら、ブートローダーのカーネルパラメータを再設定して pcie_acs_override= オプションが有効になった状態で新しいカーネルをロードするようにしてください。

QEMU で libvirt を使わない

libvirt を使って仮想マシンをセットアップするかわりに、QEMU コマンドにカスタムパラメータを付けるだけで PCI パススルーを使用するように VM を起動できます。スクリプトによる設定などで有用です。

#IOMMU のセットアップ#GPU の分離を行ってから、QEMU の記事に従って仮想環境をセットアップして、KVM を有効にして -device vfio-pci,host=07:00.0 フラグを使ってください。識別子の (07:00.0) は GPU を分離するときに使用した実際のデバイスの ID に置き換えてください。

OVMF ファームウェアを利用するために、ovmf[リンク切れ: 置換パッケージ: edk2-ovmf] パッケージをインストールして、/usr/share/ovmf/x64/OVMF_VARS.fd から /tmp/MY_VARS.fd など一時的なディレクトリに UEFI 変数をコピーして QEMU コマンドに以下のパラメータを追加して OVMF のパスを指定します (パラメータの順序は重要です):

  • -drive if=pflash,format=raw,readonly,file=/usr/share/ovmf/x64/OVMF_CODE.fd - OVMF ファームウェアバイナリを指定、readonly オプションに注意してください。
  • -drive if=pflash,format=raw,file=/tmp/MY_VARS.fd - 変数のパスを指定。
ノート: OVMF の代わりに QEMU のデフォルトである SeaBIOS を使うこともできますが、パススルーの設定で問題が発生することがあるため推奨されません。

QEMU の記事を読んで virtio ドライバーの使用などパフォーマンスを向上させることができる設定を調べることを推奨します。

また、-cpu host,kvm=off パラメータを使ってホストの CPU モデル情報を VM に渡して Nvidia などメーカーのデバイスドライバーから仮想環境でないと認識させる必要があるかもしれません。

他のデバイスのパススルー

USB コントローラ

マザーボードに接続された複数の USB コントローラが複数のグループにマッピングされている場合、USB デバイスの代わりに USB コントローラをパススルーすることができます。個別の USB デバイスではなくコントローラをパススルーすることには以下の利点があります:

  • 特定の操作 (スマートフォンのアップデートなど) でデバイスが切断されたり ID が変わったりしても、仮想マシンから突然認識されなくなることはありません。
  • コントローラによって管理されている USB 端子を VM が直接扱うため、デバイスを接続・切断してもハイパーバイザに通知する必要がありません。
  • VM を起動したときにゲストにパススルーする USB デバイスがなくなってしまっていても Libvirt はエラーを出力しません。

GPU と違って、大抵の USB コントローラのドライバーでは VM で使用するのに特殊な設定を必要としません。副作用を起こさずにホストとゲストの間で制御を受け渡すことができます。

警告: USB コントローラがリセットに対応していることを確認してください。#リセットに対応していないデバイスのパススルーを参照。

以下のコマンドを使うことでコントローラや端子とデバイスがどのように PCI デバイスと割り当てられているか確認することができます:

$ for usb_ctrl in $(find /sys/bus/usb/devices/usb* -maxdepth 0 -type l); do pci_path="$(dirname "$(realpath "${usb_ctrl}")")"; echo "Bus $(cat "${usb_ctrl}/busnum") --> $(basename $pci_path) (IOMMU group $(basename $(realpath $pci_path/iommu_group)))"; lsusb -s "$(cat "${usb_ctrl}/busnum"):"; echo; done
Bus 1 --> 0000:00:1a.0 (IOMMU group 4)
Bus 001 Device 004: ID 04f2:b217 Chicony Electronics Co., Ltd Lenovo Integrated Camera (0.3MP)
Bus 001 Device 007: ID 0a5c:21e6 Broadcom Corp. BCM20702 Bluetooth 4.0 [ThinkPad]
Bus 001 Device 008: ID 0781:5530 SanDisk Corp. Cruzer
Bus 001 Device 002: ID 8087:0024 Intel Corp. Integrated Rate Matching Hub
Bus 001 Device 001: ID 1d6b:0002 Linux Foundation 2.0 root hub

Bus 2 --> 0000:00:1d.0 (IOMMU group 9)
Bus 002 Device 006: ID 0451:e012 Texas Instruments, Inc. TI-Nspire Calculator
Bus 002 Device 002: ID 8087:0024 Intel Corp. Integrated Rate Matching Hub
Bus 002 Device 001: ID 1d6b:0002 Linux Foundation 2.0 root hub

上記のノートパソコンには2つの USB コントローラによる3つの USB ポートがあり、それぞれに IOMMU グループが存在します。例として Bus 001 はひとつの USB ポートを管理していますが (SanDisk の USB ペンドライブが接続されています)、内蔵ウェブカメラや bluetooth カードなど内部デバイスも管理されています。一方 Bus 002 は接続されている電卓以外は何も管理していません。3つ目のポートは空で、リスト上には表示されていませんが、実際は Bus 002 によって管理されています。

様々なデバイスを接続してみてどのコントローラがどのポートを管理しているか判断して、どのコントローラをパススルーするか決めたら、ゲスト設定の VM によって制御する PCI ホストデバイスのリストにコントローラを追加してください。他の設定は不要です。

ノート: USB コントローラがリセットをサポートしていないか、独立したグループにないか、もしくはパススルーできない場合でも、udev ルールを通じて同様の結果を達成することが可能です。特定の USB ポートに接続された任意のデバイスを仮想マシンに自動的に接続できるようにする [2] を参照して下さい。

PulseAudio で仮想マシンの音声出力をホストにパススルー

libvirt を使うことで仮想マシンの音声出力をアプリケーションとしてホストに転送することが可能です。複数の音声ストリームをホストの出力に転送でき、パススルーをサポートしていない音声出力デバイスで使うことができます。転送するには PulseAudio が必要です。

まず、#user = "" 行のコメントを削除してください。それからクォートの中にユーザー名を入力してください。これで QEMU はユーザーの PulseAudio ストリームを転送するようになります。

/etc/libvirt/qemu.conf
user = "example"

次に、libvirt の設定を変更してください。

以下の行を:

virsh edit [vmname]
<domain type='kvm'>

以下のように変更してください:

virsh edit [vmname]
<domain type='kvm' xmlns:qemu='http://libvirt.org/schemas/domain/qemu/1.0'>

そして libvirt の xml ファイルの末尾に QEMU PulseAudio 環境変数を設定してください。

以下の行を:

virsh edit [vmname]
    </devices>
   </domain>

以下のように変更してください:

virsh edit [vmname]
    </devices>
      <qemu:commandline>
        <qemu:env name='QEMU_AUDIO_DRV' value='pa'/>
        <qemu:env name='QEMU_PA_SERVER' value='/run/user/1000/pulse/native'/>
      </qemu:commandline>
 </domain>

user ディレクトリの 1000 はあなたが使用しているユーザーの uid に置き換えてください (id コマンドを実行することで確認できます)。先に進む前にファイルを保存して終了しないと変更が登録されません。終了後に Domain [vmname] XML configuration edited. というメッセージが表示されれば、変更が適用されたということです。

設定したら libvirtd サービスと pulseaudio.serviceユーザーサービスを再起動してください。

これで仮想マシンの音声出力はアプリケーションとしてホストに転送されるようになります。pavucontrol アプリケーションを使うことで出力デバイスを制御できます。Windows ゲストの場合、メッセージシグナル割り込みを使用しないとノイズが発生するので注意してください。

QEMU 3.0 オーディオの変更

QEMU 3.0 以降では、オーディオパッチの一部がマージされました (reddit リンク)。パッチのいくつかはまだ正式に上流にマージされていないため、 qemu-patchedAUR[リンク切れ: パッケージが存在しません] パッケージにはオーディオパッチが複数含まれています。

新しいコードパスを使用するにはあなたの VM のセットアップに応じてチップセットを、例えば pc-q35-3.0 または pc-i440fx-3.0 (qemu 3.0 インストール後) に変更する必要があります:

$ virsh edit [vmname]
<domain type='kvm'>
  ...
  <os>
    <type arch='x86_64' machine='pc-q35-3.0'>hvm</type>
    ...
  </os>
$ virsh edit [vmname]
<domain type='kvm'>
  ...
  <os>
    <type arch='x86_64' machine='pc-i440fx-3.0'>hvm</type>
    ...
  </os>
ノート:
  • qemu-patchedAUR[リンク切れ: パッケージが存在しません] のコンパイル時間を早めるには --target-list=x86_64-softmmu を使って qemu の x86_64 ゲストサポートのみコンパイルします。
  • Qemu 3.0 以降で PulseAudio をユーザーとして実行している場合に /etc/libvirt/qemu.confnographics_allow_host_audio = 1 を有効にしたときは、上記の XML 引数 qemu:env は必要ありません。QEMU/Libvirt で別のユーザーを使用する場合は、QEMU_PA_SERVER 変数を維持する必要があります。そうしないとアクセス許可エラーが発生します。

注意事項

リセットに対応していないデバイスのパススルー

仮想マシンのシャットダウン時、ゲストが使用していたデバイスは全てシャットダウンの準備時に OS によって deinitialize されます。この状態ではデバイスは機能しなくなり、通常通りに機能させるには電源を入れ直さなくてはなりません。Linux は独自にパワーサイクルを処理しますが、デバイスのリセット方法がわからない場合、無効状態のままになりデバイスが利用不可能になります。Libvirt と Qemu はどちらも仮想マシンを完全に停止する前に全てのホスト PCI デバイスが再接続できる状態になっていることを求めるため、デバイスがリセットできない状態になると、"Shutting down" 状態でフリーズしてホストマシンを再起動するまで仮想マシンを再起動できなくなってしまいます。そのため、カーネルによってリセットが可能な PCI デバイスのみパススルーすることを推奨します。PCI デバイスの sysfs ノードに reset ファイルが存在するかどうかでリセット可能かどうか確認できます (例: /sys/bus/pci/devices/0000:00:1a.0/reset)。

以下の bash コマンドを実行するとどのデバイスがリセットできてどのデバイスがリセットできないか表示されます:

for iommu_group in $(find /sys/kernel/iommu_groups/ -maxdepth 1 -mindepth 1 -type d);do echo "IOMMU group $(basename "$iommu_group")"; for device in $(\ls -1 "$iommu_group"/devices/); do if [[ -e "$iommu_group"/devices/"$device"/reset ]]; then echo -n "[RESET]"; fi; echo -n $'\t';lspci -nns "$device"; done; done
IOMMU group 0
	00:00.0 Host bridge [0600]: Intel Corporation Xeon E3-1200 v2/Ivy Bridge DRAM Controller [8086:0158] (rev 09)
IOMMU group 1
	00:01.0 PCI bridge [0604]: Intel Corporation Xeon E3-1200 v2/3rd Gen Core processor PCI Express Root Port [8086:0151] (rev 09)
	01:00.0 VGA compatible controller [0300]: NVIDIA Corporation GK208 [GeForce GT 720] [10de:1288] (rev a1)
	01:00.1 Audio device [0403]: NVIDIA Corporation GK208 HDMI/DP Audio Controller [10de:0e0f] (rev a1)
IOMMU group 2
	00:14.0 USB controller [0c03]: Intel Corporation 7 Series/C210 Series Chipset Family USB xHCI Host Controller [8086:1e31] (rev 04)
IOMMU group 4
[RESET]	00:1a.0 USB controller [0c03]: Intel Corporation 7 Series/C210 Series Chipset Family USB Enhanced Host Controller #2 [8086:1e2d] (rev 04)
IOMMU group 5
[RESET]	00:1b.0 Audio device [0403]: Intel Corporation 7 Series/C210 Series Chipset Family High Definition Audio Controller [8086:1e20] (rev 04)
IOMMU group 10
[RESET]	00:1d.0 USB controller [0c03]: Intel Corporation 7 Series/C210 Series Chipset Family USB Enhanced Host Controller #1 [8086:1e26] (rev 04)
IOMMU group 13
	06:00.0 VGA compatible controller [0300]: NVIDIA Corporation GM204 [GeForce GTX 970] [10de:13c2] (rev a1)
	06:00.1 Audio device [0403]: NVIDIA Corporation GM204 High Definition Audio Controller [10de:0fbb] (rev a1)

上記の場合 00:14.0 の xHCI USB コントローラはリセットができないため、仮想マシンが正しくシャットダウンできなくなります。00:1b.0 の内蔵サウンドカードと 00:1a.0 および 00:1d.0 のコントローラはリセット可能であるため問題が起こりません。

トラブルシューティング

以下で問題が見つけられない場合、QEMU#トラブルシューティングも見てください。

Windows の仮想マシンに NVIDIA の GPU をパススルーした場合に "Error 43 : Driver failed to load"

ノート: 以下の設定により Nvidia ドライバーによって起動時に SYSTEM_THREAD_EXCEPTION_NOT_HANDLED でクラッシュする問題も解決します。

バージョン 337.88 から、Windows の Nvidia ドライバーはハイパーバイザが動作しているかどうかを確認して、動作していることを認識すると Windows のデバイスマネージャに Error 43 を吐くようになりました。QEMU 2.5.0 と libvirt 1.3.3 以上では、ハイパーバイザの vendor_id を偽装することができ、Nvidia ドライバーを騙してロードさせることができます。QEMU コマンドの cpu パラメータに hv_vendor_id=whatever を追加するか、libvirt のドメイン設定に以下の行を追加するだけです。ID は12文字ちょうどの英数字 (例: '1234567890ab') に設定してください。

$ virsh edit [vmname]
...
<features>
	<hyperv>
		...
		<vendor_id state='on' value='whatever'/>
		...
	</hyperv>
	...
	<kvm>
	<hidden state='on'/>
	</kvm>
</features>
...

古いバージョンの QEMU や libvirt を使用している場合は、ハイパーバイザの拡張を無効化する必要があり、かなり性能が落ちてしまいます。libvirt のドメイン設定ファイルに以下を記述してください:

$ virsh edit [vmname]
...
<features>
	<hyperv>
		<relaxed state='on'/>
		<vapic state='on'/>
		<spinlocks state='on' retries='8191'/>
	</hyperv>
	...
</features>
...
<clock offset='localtime'>
	<timer name='hypervclock' present='yes'/>
</clock>
...
...

<clock offset='localtime'>
	<timer name='hypervclock' present='no'/>
</clock>
...
<features>
	<kvm>
	<hidden state='on'/>
	</kvm>
	...
	<hyperv>
		<relaxed state='off'/>
		<vapic state='off'/>
		<spinlocks state='off'/>
	</hyperv>
	...
</features>
...

VM を起動した後に dmesg に "BAR 3: can't reserve [mem]" エラーが表示される

上記の方法を試してもコード 43 が発生する場合、dmesg にメモリ予約エラーが記録されていないか確認してください:

vfio-pci 0000:09:00.0: BAR 3: can't reserve [mem 0xf0000000-0xf1ffffff 64bit pref]

上記のようなメッセージが出力される場合、グラフィックカードを接続している PCI ブリッジを確認してください。以下のコマンドでデバイスツリーを確認できます:

$ lspci -t

VM を起動する前に以下のコマンドを実行してください (ID は上記のコマンドで確認できた実際の ID に置き換えてください):

# echo 1 > /sys/bus/pci/devices/0000\:00\:03.1/remove
# echo 1 > /sys/bus/pci/rescan

詳しくは こちらの記事 を参照。

ノート: おそらく video=efifb:off カーネルパラメータの設定も必要です [3]

CPU 例外によってクラッシュが発生する

QEMU#特定の Windows のゲームやアプリケーションでクラッシュやブルスクリーンが発生するを参照。

Windows の仮想マシンを起動したときに "System Thread Exception Not Handled"

QEMU#Windows の仮想マシンを起動したときに "System Thread Exception Not Handled" を参照。

ビデオカードの HDMI 出力からの音声がおかしい

ビデオカードの HDMI 端子を使用したときに、ユーザーによっては仮想マシンの音声出力が遅れたり音が割れたりすることがあります。大抵の場合、グラフィックも遅れるようになります。解決方法としてはデフォルトの割り込み方法 (Line-Based Interrupts) の代わりに MSI (Message Signaled-Based Interrupts) を有効にする方法があります。

MSI がサポートされているか・有効になっているか確認するには、以下のコマンドを root で実行してください:

# lspci -vs $device | grep 'MSI:'

`$device` はカードのアドレスに置き換えてください (例: `01:00.0`)。

出力は以下のようになります:

Capabilities: [60] MSI: Enable- Count=1/1 Maskable- 64bit+

Enable の後ろの - は MSI がサポートされおり VM によって使われていないことを意味します。+ であれば VM によって使われています。

有効にする手順は非常に複雑です。こちら に設定の手順と概要が載っています。

他にも lime-technology の wikiVFIO tips and tricks の記事にヒントが載っています。

MSI Utility (FOSS Version 2) という UI ツールが64ビットの Windows 10 で動作しこの手順を簡素化します。

nVidia カードの 0 function の MSI を有効にするだけでは問題が解決しない場合 (01:00.0 VGA compatible controller: NVIDIA Corporation GM206 [GeForce GTX 960] (rev a1) (prog-if 00 [VGA controller]))、他の function の MSI も有効にする必要があります (01:00.1 Audio device: NVIDIA Corporation Device 0fba (rev a1))。

intel_iommu を有効にしたときにホスト側で HDMI から音声が出力されない

intel_iommu を有効にしたときにホストの Intel GPU の HDMI 出力デバイスが使えなくなった場合、igfx_off (i.e. intel_iommu=on,igfx_off) オプションを設定することで音声が出力できるようになることがあります。igfx_off の設定について詳しくは Intel-IOMMU.txtGraphics Problems? を読んでください。

vfio_pci を有効化したあとに X が起動しない

ホスト GPU がセカンダリ GPU として認識されている場合、ゲスト GPU のドライバーをロードしようとしたときに X がエラーを起こします。Xorg の設定でホスト GPU の BusID を指定することで解決します。BusID は lspci や Xorg のログで確認できます。

/etc/X11/xorg.conf.d/10-intel.conf
Section "Device"
        Identifier "Intel GPU"
        Driver "modesetting"
        BusID  "PCI:0:2:0"
EndSection

詳しくは [4] を参照してください。

Chromium が内蔵グラフィックをアクセラレーションに使わない

Chromium はシステム内の GPU をできるかぎり多く検出してから使用する GPU を選択します (大抵はディスクリートの NVIDIA/AMD グラフィック)。使用する GPU は PCI デバイスによって選択されます。OpenGL レンダラが利用できるかどうかは考慮されません。結果として Chromium は内蔵 GPU を無視して、ゲスト VM が動作していてホスト環境から GPU が使えなくなっているかどうかに関係なく、vfio-pci ドライバーに紐付けられた専用 GPU を使用しようとすることがあります。その場合 GPU が使えないためにソフトウェアレンダリングが使われることになります (CPU の負担が高まり、動画の再生が途切れがちになったりスクロールがスムーズに機能しなくなったりします)。

解決方法は Chromium 設定#特定の GPU の使用を強制するを見てください。

VM がひとつしかコアを使わない

IOMMU を有効にしてコアのカウントを 1 よりも大きくしても、VM が使用する CPU コアとスレッドがひとつしか現れないことがあります。解決するには virt-manager で "Manually set CPU topology" を有効にして使用したい CPU ソケット・コア・スレッド数を設定してください。"Threads" は合計スレッド数ではなく各 CPU ごとのスレッド数なので注意してください。

パススルーは機能しているのに出力が表示されない

virt-manager を使用している場合、仮想マシンで UEFI ファームウェアが選択されていることを確認してください。また、仮想マシンに適切なデバイスが渡されていることも確認してください。

virt-manager のパーミッション問題

virt-manager でパーミッションエラーが発生する場合、以下を /etc/libvirt/qemu.conf に追加してください:

group="kvm"
user="user"

上記で解決しない場合は使用しているユーザーアカウントを kvmlibvirt グループに追加してください。

VM シャットダウン後にホストがロックアップする

Windows10 ゲストを実行している場合に、VM を長時間実行した後、ホストの複数の CPU コアがロックアップするという問題が発生することがあります ([5]を参照)。この問題を解決するには、ゲストにパススルーした GPU でメッセージシグナル割り込みを有効にしてみてください。有効化する方法のガイドは [6] にあります。

スリープ時にゲストが実行されているとホストがロックアップする

VFIO を有効にした仮想マシンを起動したまま、スリープ/復帰を行おうとすると不安定になることがあり、ホストマシンをシャットダウンしようとするとロックアップする既知の問題があります。以下の libvirt フックスクリプトと systemd ユニットを使用して、ゲストを実行している間にホストがスリープ状態になるのを防止することで問題を避けることができます。フックファイルの動作には実行権限が必要です。

/etc/libvirt/hooks/qemu
#!/bin/bash

OBJECT="$1"
OPERATION="$2"
SUBOPERATION="$3"
EXTRA_ARG="$4"

case "$OPERATION" in
        "prepare")
                systemctl start libvirt-nosleep@"$OBJECT"
                ;;
        "release")
                systemctl stop libvirt-nosleep@"$OBJECT"
                ;;
esac
/etc/systemd/system/libvirt-nosleep@.service
[Unit]
Description=Preventing sleep while libvirt domain "%i" is running

[Service]
Type=simple
ExecStart=/usr/bin/systemd-inhibit --what=sleep --why="Libvirt domain \"%i\" is running" --who=%U --mode=block sleep infinity

ovmf のアップグレード後にブートできない

ovmf-1:r23112.018432f0ce-1 からアップグレードしたときに起動できなくなった場合、 /var/lib/libvirt/qemu/nvram にある古い *VARS.fd ファイルを削除する必要があります:

# mv /var/lib/libvirt/qemu/nvram/vmname_VARS.fd /var/lib/libvirt/qemu/nvram/vmname_VARS.fd.old

詳しくは FS#57825 を参照。

参照