ソリッドステートドライブ/NVMe

提供: ArchWiki
2022年12月9日 (金) 08:06時点におけるAshMyzk (トーク | 投稿記録)による版 (→‎トラブルシューティング: 追加)
ナビゲーションに移動 検索に移動

関連記事

NVM Express (NVMe) とは、PCI Express バスで接続されている SSD にアクセスするための規格です。論理デバイスインターフェイスとして、NVM Express は新規に設計されました。PCI Express SSD の低遅延性と並列性を活かし、現代の CPU、プラットフォーム、アプリケーションの並列性を映し出しています。

インストール

Linux の NVMe ドライバはバージョン 3.3 からネイティブにカーネルに含まれています。NVMe デバイスは /dev/nvme* に現れるはずです。

その他のユーザスペース NVMe ツールは nvme-clinvme-cli-gitAUR に含まれています。

サポートされているファイルシステム、パフォーマンスの最適化、ディスクの読み書きの最小化などは ソリッドステートドライブ を見てください。

管理

ノート: この章は [1] を元にしています。

接続されているすべての NVMe SSD の名前、シリアル番号、サイズ、LBAフォーマット、シリアルを一覧表示します:

# nvme list

ドライブとドライブがサポートする機能に関する情報を、人間にわかりやすい方法で一覧表示します:

# nvme id-ctrl -H /dev/nvme0
ヒント: 使用されている略語の意味を理解するには、関連する NVMe 仕様書のリファレンスセクション 5.15.2.2 ("Identify Controller data structure") を参照してください (例: 1.4a 仕様書の172ページの下部)。

名前空間とサポートされている機能に関する情報を一覧表示します:

ノート: 名前空間 (namespace) とは NVMe 技術の構成要素で、ユーザデータを保持します。NVMe コントローラには複数の名前空間を付けることができます。今日のほとんどの NVMe SSD は単一の名前空間しか使用しませんが、マルチテナント型アプリケーション、仮想化、セキュリティの場面においては複数の名前空間が使用されることがあります。
# nvme id-ns /dev/nvme0n1
ヒント: 使用されている略語の意味を理解するには、関連する NVMe 仕様書のリファレンスセクション 5.15.2.1 ("Identify Namespace data structure") を参照してください (例: 1.4a 仕様書の163ページ)。

NVMeエラーログページを表示します:

# nvme error-log /dev/nvme0
ヒント: エラーログにエラーが記録されているか調べるには、エラーカウント (error_count) が0でないエントリを探してください。

名前空間を削除します:

警告: このコマンドは、指定された名前空間のすべてのデータを削除します。注意して使用してください。
# nvme delete-ns /dev/nvme0n1

新しい名前空間を作成します。例えば、より小さなサイズの名前空間を作成して、SSDをオーバープロビジョニングし、耐久性、パフォーマンスおよび遅延を改善します:

# nvme create-ns /dev/nvme0

すべてのコマンドのリストと簡潔な説明については、nvme helpnvme(1) を参照してください。

SMART

健康状態、温度、耐久性などの NVMe SMART ログページを出力します:

# nvme smart-log /dev/nvme0
ヒント: -H オプションを使うと更に多くの情報を出力できます。例: nvme smart-log -H /dev/nvme0

NVMe サポートは smartmontools バージョン 6.5 で追加されました。

ノート: smartmontools の公式 wiki では、このサポートは実験的であると報告されています。

現在実装されている機能は (wiki から拝借):

  • コントローラ名、ファームウェア、容量に関する基本的な情報 (smartctl -i)
  • コントローラと名前空間の機能 (smartctl -c)
  • SMART の総合的健康状態の自己評価テストの結果と警告 (smartctl -H)
  • NVMe の SMART 属性 (smartctl -A)
  • NVMe のエラーログ (smartctl -l error[,NUM])
  • nvme ログをフェッチする機能 (smartctl -l nvmelog,N,SIZE)
  • smartd デーモンによる健康状態 (-H)、エラーカウント (-l error)、温度 (-W DIFF,INFO,CRIT) の追跡

詳細は S.M.A.R.T.公式 wiki エントリ を参照してください。コマンドの出力に関する文脈情報は この記事 を見てください。

Secure erase

ソリッドステートドライブ/メモリセルの消去#NVMe ドライブ を見てください。

ファームウェアアップデート

一般

ファームウェアは nvme-cli を使って管理できます。利用可能なスロットを出力し、スロット1が読み取り専用になっているかどうかを確認するには:

# nvme fw-log /dev/nvme0
Firmware Log for device:nvme0
afi  : 0x11
frs1 : 0x32303132345a3553 (S5Z42102)
frs2 : 0x32303132345a3553 (S5Z42102)
# nvme id-ctrl /dev/nvme0 -H | grep Firmware
[0:0] : 0	Firmware Slot 1 Read/Write

ファームウェアをダウンロードし、指定されたスロットにコミットしてください。下記の例では、ファームウェアはまずアクティブ化されずにコミットされます (-a 0)。次に、既存のイメージをアクティベーションします (-a 2)。ファームウェアコミットの action 値に関する詳細は、NVMe 仕様書を参照してください。

# nvme fw-download -f S5Z42_fw_S5Z42105.bin /dev/nvme0
Firmware download success
# nvme fw-commit -s 2 -a 0 /dev/nvme0
Success committing firmware action:0 slot:2
# nvme fw-log /dev/nvme0
Firmware Log for device:nvme0
afi  : 0x21
frs1 : 0x32303132345a3553 (S5Z42102)
frs2 : 0x35303132345a3553 (S5Z42105)
# nvme fw-commit -s 2 -a 2 /dev/nvme0
Success committing firmware action:2 slot:2

最後に、コントローラをリセットし、新しいファームウェアをロードしてください:

# echo 1 > /sys/class/nvme/nvme0/reset_controller

Intel

「インテル®メモリおよびストレージツール (インテル® MAS) は、インテル®SSDおよび®インテルのオプタン™メモリデバイス用のドライブ管理ツールであり、Windows*、Linux*、およびESXi*でサポートされています。[...] このツールを使用して、PCIe*-/NVMe*-および SATA ベースのクライアントおよびデータセンターインテル®SSDデバイスを管理し、最新のファームウェアにアップデートします。」[2]

solidigm-sst-storage-tool-cliAUR/intel-mas-cli-toolAURインストールし、あなたのドライブに利用可能なアップデートがあるかチェックしてください:

# intelmas show -intelssd
- Intel SSD 660p Series redacted -

Capacity : 512.11 GB
CurrentPercent : Property not found
DevicePath : /dev/nvme0n1
DeviceStatus : Healthy
Firmware : 002C
FirmwareUpdateAvailable : 004C
Index : 0
MaximumLBA : 1000215215
ModelNumber : INTEL SSDPEKNW512G8
ProductFamily : Intel SSD 660p Series
SMARTEnabled : True
SectorDataSize : 512
SerialNumber : redacted

ある場合は、以下のように load コマンドを実行してください:

# intelmas load -intelssd 0
WARNING! You have selected to update the drives firmware! 
Proceed with the update? (Y|N): Y
Checking for firmware update...

- Intel SSD 660p Series redacted -

Status : Firmware updated successfully. Please reboot the system.

Kingston

Kingston はウェブサイトでの個別のファームウェアダウンロードを提供しておらず、その代わりに Windows のみのユーティリティを紹介しています。ファームウェアファイルは、ファームウェアのリビジョンに基づく予測可能な命名規則を使用しているようです:

https://media.kingston.com/support/downloads/S5Z42105.zip

次に、一般的なフラッシュの手順に進んでください。

パフォーマンス

セクタサイズ

Advanced Format#ネイティブなセクタサイズを設定する を見てください。

Discard

警告: 連続的な TRIM (continuous TRIM) は SSD のオプション (非推奨) ですが、NVMe デバイスでは discard は実行するべきではありません

ext4LVM を使用する普通のセットアップではデフォルトで Discard は無効になりますが、ファイルシステムによっては明示的に無効化する必要があります。

SSD メーカーの Intel はファイルシステムレベルで discard を有効にすることを推奨していませんが、定期的な TRIM の方法や fstrim を手動で適用することを提案しています。[3]

エアフロー

NVMe SSD は負担時に高熱になることが知られており、特定の閾値に達すると性能が制限されます。[4]

テスト

Raw デバイスの性能テストは hdparm で実行できます:

# hdparm -Tt --direct /dev/nvme0n1

省電力 (APST)

NVMe の電源状態 (power state) を確認するには、nvme-clinvme-cli-gitAUR をインストールし、nvme get-feature /dev/nvme[0-9] -f 0x0c -H を実行してください:

# nvme get-feature /dev/nvme0 -f 0x0c -H
get-feature:0xc (Autonomous Power State Transition), Current value:0x000001
        Autonomous Power State Transition Enable (APSTE): Enabled
        Auto PST Entries        .................

...

APST が有効化されているときは、出力に "Autonomous Power State Transition Enable (APSTE): Enabled" という文章が含まれているはずであり、その下のテーブルには、利用可能な各状態に移行する前のアイドル時間を示す非ゼロなエントリが存在するはずです。

APST は有効化されているが、テーブル内に非ゼロな状態が存在しない場合、レイテンシが高すぎて状態がデフォルトで有効化されていないのかもしれません。nvme id-ctrl /dev/nvme[0-9] (root として実行) の出力には、NVMe コントローラの利用可能な非動作電源状態が出力されるはずです。どれかの状態の合計のレイテンシ (enlat + xlat) が 25000 (25ms) より大きい場合、nvme_core カーネルモジュールdefault_ps_max_latency_us パラメータにそのレイテンシ値以上の値を渡す必要があります。これにより、APST が有効になり、nvme get-feature (root として実行) の表にエントリが表示されるようになるはずです。

トラブルシューティング

APST サポートの問題によるコントローラの機能不全

一部の NVMe デバイスでは省電力 (APST) に関連する問題が発生する場合があります。これはファームウェア S5Z42105 の時点で Kingston A2000 [5] の既知の問題であり、以前に Samsung NVMe ドライブ (Linux v4.10) で報告されていました [6][7]

機能不全が発生すると、システムをリセットするまでデバイスが利用できなくなり、以下に似たカーネルログが出力されます:

 nvme nvme0: I/O 566 QID 7 timeout, aborting
 nvme nvme0: I/O 989 QID 1 timeout, aborting
 nvme nvme0: I/O 990 QID 1 timeout, aborting
 nvme nvme0: I/O 840 QID 6 timeout, reset controller
 nvme nvme0: I/O 24 QID 0 timeout, reset controller
 nvme nvme0: Device not ready; aborting reset, CSTS=0x1
 ...
 nvme nvme0: Device not ready; aborting reset, CSTS=0x1
 nvme nvme0: Device not ready; aborting reset, CSTS=0x1
 nvme nvme0: failed to set APST feature (-19)

回避策として、nvme_core.default_ps_max_latency_us=0 カーネルパラメータを追加することで APST を完全に無効化するか、あるいはカスタムの閾値を設定して特定の状態を無効化することができます。

この記事またはセクションは情報が古くなっています。
理由: このカーネルパラメータは Linux カーネルの最近のリビジョンではもはや必要ないかもしれません。(例: v4.14.221、v4.19.175、v5.4.97、v5.10.15、v5.11-rc7、そしてこれら以降)。[8] (Discuss)

2021年3月から、Kingston からのファームウェアアップデート 9 が利用可能です。Kingston は Windows のみをサポートしているため、Linux 用のダウンロードは heise.degithub で入手できます。カーネルの回避策が行われている限り、最も深い省電力状態には到達しないため、ファームウェアのアップデートはあまり効果がないことが予想されます。

# smartctl -a /dev/nvme0
Supported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     9.00W       -        -    0  0  0  0        0       0
 1 +     4.60W       -        -    1  1  1  1        0       0
 2 +     3.80W       -        -    2  2  2  2        0       0
 3 -   0.0450W       -        -    3  3  3  3     2000    2000
 4 -   0.0040W       -        -    4  4  4  4    15000   15000

渡される値は exit レイテンシ (Ex_Lat) の最大値です。例えば、PS4 を無効化するには nvme_core.default_ps_max_latency_us=2000 を設定してください。

サスペンドサポートの問題によるコントローラの機能不全

一部のユーザ (例えば、ノートパソコン/HP を見てください) は、特定の NVMe ドライブでサスペンドに失敗すると報告しています。上記の通り、機能不全により、システムをリセットするまでデバイスが操作不能になり、カーネルメッセージが出力されます:

nvme nvme0: Device not ready; aborting reset, CSTS=0x3
nvme nvme0: Removing after probe failure status: -19

回避策として、iommu=soft カーネルパラメータを追加し、ハードウェア IOMMU の代わりにソフトウェアのものを使用することができます。(詳細はこのドキュメントを見てください。) これにより、処理の僅かなオーバーヘッドが発生する可能性があります。

参照