「S.M.A.R.T.」の版間の差分
(同期) |
|||
(3人の利用者による、間の7版が非表示) | |||
1行目: | 1行目: | ||
[[Category:ストレージ]] |
[[Category:ストレージ]] |
||
[[en:S.M.A.R.T.]] |
[[en:S.M.A.R.T.]] |
||
+ | [[fr:S.M.A.R.T.]] |
||
− | S.M.A.R.T. (Self-Monitoring, Analysis, and Reporting Technology) は近代的なストレージデバイスに内蔵されている補助コンポーネントです。温度・代替処理された不良セクタの数・シークエラーなどの統計が保存され、ソフトウェアはそれらの値からデバイスの健康状態を推察し、故障を予測したり値が不安定なときに通知することができます。 |
||
+ | [[ru:S.M.A.R.T.]] |
||
+ | [[Wikipedia:ja:Self-Monitoring, Analysis and Reporting Technology|S.M.A.R.T.]] (Self-Monitoring, Analysis, and Reporting Technology) は、最近のストレージデバイスの多くに内蔵されている補助コンポーネントであり、これによってデバイスは動作の健康状態を監視、保存、そして分析します。ソフトウェアは、収集された統計 (温度、代替処理されたセクタ数、シークエラーなど) を用いてデバイスの健康状態の計測、デバイスの障害の予測、危険な値に達した際の通知を行うことができます。 |
||
+ | |||
== Smartmontools == |
== Smartmontools == |
||
− | smartmontools パッケージはストレージデバイス |
+ | smartmontools パッケージには、ストレージデバイスの分析と監視のためのユーティリティプログラム {{ic|smartctl}} と {{ic|smartd}}、サードパーティのデータベース更新ユーティリティ {{ic|update-smart-drivedb}} が含まれています。 |
+ | これらのツールを使用するには {{Pkg|smartmontools}} パッケージを[[インストール]]してください。 |
||
− | === デバイスが SMART 対応かどうか確認する === |
||
− | デバイスが SMART 機能を有しているかどうかチェックするには次のコマンドを実行します (対象が ATA デバイスの場合 {{ic|-d ata}} オプションが必要です): |
||
+ | これらのツールを効果的に使用するには、各ストレージデバイスで SMART サポートが利用可能であり、かつ有効化されていなければなりません。[[#smartctl]] を使うことで SMART サポートを確認したり有効化したりすることができます。それが済んだら、手動で [[#テストを実行する]] ことも [[#テスト結果を表示する]] こともできますし、[[#smartd]] を使って自動的にテストを実行してメールで通知することもできます。 |
||
− | # smartctl -i /dev/<device> |
||
+ | === smartctl === |
||
− | (<device> は {{ic|sda, hda,...}} のように置き換えて下さい)。このコマンドはデバイスに関する全般的な情報を表示します。対応している場合、下の2つの行が確認できるはずです: |
||
+ | smartctl は、「ほとんどの ATA/SATA 及び SCSI/SAS ハードドライブやソリッドステートドライブに組み込まれている Self-Monitoring, Analysis and Reporting Technology (SMART) システムを制御する」コマンドラインツールです。 |
||
− | SMART support is: Available - device has SMART capability. |
||
− | SMART support is: Enabled |
||
+ | {{ic|-i}}/{{ic|--info}} オプションは、デバイスに関する様々な情報を出力します (SMART が利用可能で有効であるかどうかに関する情報を含む): |
||
− | SMART が有効でない場合、以下を実行して有効化します: |
||
− | + | {{hc|# smartctl --info /dev/sda {{!}} grep 'SMART support is:'| |
|
+ | SMART support is: Available - device has SMART capability. |
||
+ | SMART support is: Enabled |
||
+ | }} |
||
+ | SMART が利用可能であるが、有効でない場合、有効化することができます: |
||
− | === デバイスの健康状態を調べる === |
||
− | 実行中のデバイスの健康状態を調べる3つの方法があります(どれもユーザーデータには影響を与えません): |
||
+ | # smartctl --smart=on /dev/''device'' |
||
− | # Short (検出されているデバイスの中で問題のありそうなデバイスを精査する) |
||
− | # Extended (または Long。Short のチェックを全ての部分で行う) |
||
− | # Conveyance (デバイスの転送中に深刻なエラーが発生した場合にそれを特定する) |
||
+ | 場合によっては、デバイスのタイプを指定する必要があります。例えば、{{ic|1=--device=ata}} は、デバイスのタイプが ATA であることを smartctl に伝え、smartctl がそのデバイスに SCSI コマンドを発行してしまうことを防ぎます。 |
||
− | デバイスがどのテストに対応しているのか、そしてそれらの診断にどれくらい時間がかかるのか調べるには以下を実行します: |
||
− | # smartctl -c /dev/<device> |
||
− | テストを実行する |
+ | ==== テストを実行する ==== |
+ | デバイスが実行できる自己テストには3種類あります (どのテストもユーザデータに対して安全です): |
||
− | # smartctl -t short /dev/<device> |
||
− | # smartctl -t long /dev/<device> |
||
− | # smartctl -t conveyance /dev/<device> |
||
+ | * Short: デバイスの問題を検出する可能性の高いテストを実行します。 |
||
− | {{Note|SSD などのディスクは全てのテストに対応していないことがあります。デバイスが何に対応しているか調べるには {{ic|smartctl --capabilities /dev/<device>}} を実行してください。}} |
||
+ | * Extended 或いは Long: このテストは short チェックと同じですが、時間制限が無く、完全なディスクサーフェス検査を行います。 |
||
− | ==== 結果 ==== |
||
+ | * Conveyance: デバイスの輸送中にダメージが発生したかどうかを調べます。 |
||
+ | * Selective: LBA の範囲をテストします (詳細は {{man|8|smartctl|t}} を参照)。 |
||
+ | {{ic|-c}}/{{ic|--capabilities}} フラグは、デバイスがサポートしているテストと各テストの推定実行時間を出力します。例えば: |
||
− | (全てのテストから集めた)テストによる全体の健康状態を見るには: |
||
− | + | {{hc|# smartctl -c /dev/sda| |
|
+ | ... |
||
+ | Short self-test routine |
||
+ | recommended polling time: ( 1) minutes. |
||
+ | Extended self-test routine |
||
+ | recommended polling time: ( 74) minutes. |
||
+ | Conveyance self-test routine |
||
+ | recommended polling time: ( 2) minutes. |
||
+ | ... |
||
+ | }} |
||
− | テスト |
+ | テストを実行するには {{ic|-t}}/{{ic|1=--test=''test_name''}} フラグを使用してください: |
− | # smartctl - |
+ | # smartctl -t short /dev/''device'' |
+ | # smartctl -t long /dev/''device'' |
||
+ | # smartctl -t conveyance /dev/''device'' |
||
+ | # smartctl -t select,123+345 /dev/''device'' |
||
− | テスト |
+ | ==== テスト結果を表示する ==== |
+ | {{ic|-H}} フラグでデバイスの全体的な健康状態を表示できます。「デバイスが健康状態に問題があると報告した場合、デバイスがすでに故障しているか、24時間以内にデバイス自体が故障することが予測されていることを意味します。この場合 […] 可能な限り早くディスクからデータを取り出し、別の安全な場所に移してください。」 |
||
− | # smartctl -a /dev/<device> |
||
+ | # smartctl -H /dev/''device'' |
||
− | エラーが記録されていない場合、おそらくデバイスは健康です。もしエラーが多少記録された場合、問題があるかもしれないのでさらなる調査が必要です。デバイスが再起不能に陥る前にデータのバックアップを取りリプレースすることを推奨します。 |
||
+ | 最近のテスト結果の一覧やデバイスの詳細な情報を表示することもできます: |
||
− | === デバイスの監視 === |
||
− | smartmontools デーモンにより、デバイスをバックグラウンドで定期的に監視して、任意で潜在的問題をメールするようにすることができます。起動時にデバイスを監視するには、smartd サービスを有効にしてください: |
||
− | systemctl enable smartd.service |
||
+ | # smartctl -l selftest /dev/''device'' |
||
− | smart デーモンは {{ic|/etc/smartd.conf}} に更に細かい設定をすることが可能です。 |
||
+ | # smartctl -x /dev/''device'' |
||
+ | ==== 全ディスクの属性表を生成する ==== |
||
− | {{Tip|{{ic|/etc/smartd.conf}} は幾分難解なコマンドライン式のオプションを使って設定します。ファイルの中にあるコメントや例を見たり、[http://smartmontools.sourceforge.net/man/smartd.conf.5.html manpage] を参照してください。以下は監視オプションの例です。}} |
||
− | ==== 監視するデバイスの定義 ==== |
||
+ | #!/bin/bash |
||
− | 全てのデバイスの全ての属性を監視するには以下を定義します: |
||
+ | function drives_csv { |
||
+ | declare -A drive_values |
||
+ | for d in `smartctl --scan -d scsi | cut -d' ' -f1`; do |
||
+ | drive_values["-Drive-----------------"]="${drive_values[-Drive-----------------]},$d" |
||
+ | for l in `smartctl -A $d | grep ATTRIBUTE_NAME -A30 | grep -v ATTRIBUTE_NAME | column -H1,3,4,5,6,7,8,9,11,12,13,14,15 -t -o, | sed 's/ //g'`; do |
||
+ | key=`echo $l | cut -d',' -f1` |
||
+ | value=`echo $l | cut -d',' -f2` |
||
+ | existing=${drive_values["$key"]} |
||
+ | drive_values["${key}"]="${existing},${value}" |
||
+ | #~ echo "${key},${drive_values[$key]}" |
||
+ | done |
||
+ | done |
||
+ | for key in "${!drive_values[@]}"; do |
||
+ | echo "${key}${drive_values[$key]}" |
||
+ | done | sort |
||
+ | } |
||
+ | drives_csv | column -s, -t |
||
+ | === smartd === |
||
− | DEVICESCAN |
||
+ | smartd デーモンは SMART の状態を監視して、何か問題が発生したら通知します。このデーモンは systemd で管理でき、設定ファイル {{ic|/etc/smartd.conf}} で設定できます。設定ファイルの構文は難解であり、この wiki ページではクイックリファレンスしか提供しません。より完全な情報は設定ファイル内の例やコメントを読んだり、{{man|5|smartd.conf}} を読んだりしてください。 |
||
− | あるいは、個々のデバイスを監視対象にするには以下のように定義します: |
||
− | #DEVICESCAN |
||
− | /dev/<first_device> -a |
||
− | /dev/<second_device> -a |
||
+ | ==== デーモン管理 ==== |
||
− | {{Tip|ディスク別に異なるモニタリングオプションを指定したい場合、{{ic|DEVICESCAN}} を使うのではなく個々に設定してください。}} |
||
+ | デーモンの起動、ステータスの確認、システムブート時の自動起動、最近のログファイルエントリの確認を行うには、{{ic|smartd.service}} systemd ユニットを[[起動/有効化]]してください。 |
||
− | ==== 潜在的な問題をメールする ==== |
||
+ | ==== 管理すべきデバイスを定義する ==== |
||
− | 新しいエラーが発生したり、なんらかの問題が発生した時にメールされるようにします。{{ic|-m}} を用います: |
||
+ | 全ディスク上のすべての SMART エラーを監視するには、以下の設定を設定ファイルに追加しなければなりません: |
||
− | DEVICESCAN -m address@domain.com |
||
+ | {{hc|/etc/smartd.conf|DEVICESCAN -a}} |
||
− | (root メールアカウントではなく) 外部にメールを送信するには、MTA (Mail Transport Agent) か MUA (Mail User Agent) の事前の設定が必要です。一般的な MTA は [[msmtp|MSMTP]] と [[SSMTP]] です。一般的な MTU は sendmail か [[Postfix]] です。メールするだけなら、[[S-nail]] を設定するだけで足ります。 |
||
+ | 注意点として、これはデフォルトの ''smartd'' 設定であり、{{ic|-a}} パラメータ (デフォルトのパラメータ) は省略できます。 |
||
− | メールエージェントを設定したら、{{ic|-M test}} を使って一度メールが正しく送れるかどうか確認することができます (デーモンをすぐに再起動してください): |
||
+ | |||
− | DEVICESCAN -m address@domain.com -M test |
||
+ | {{ic|/dev/sda}} と {{ic|/dev/sdb}} のすべての SMART エラーを監視し、他のデバイスすべてを無視するには: |
||
+ | |||
+ | {{hc|/etc/smartd.conf| |
||
+ | /dev/sda -a |
||
+ | /dev/sdb -a |
||
+ | }} |
||
+ | |||
+ | 外部接続のディスクのすべての SMART エラーを監視する場合、ドライブの {{ic|/dev/sd''X''}} は再起動後に変化するかもしれないので、ドライブの UUID を ''smartd'' に渡すのが賢明です。 |
||
+ | |||
+ | まず、監視すべきディスクの UUID を手に入れなければなりません。{{ic|ls -lah /dev/disk/by-uuid/}} を実行して、監視したいディスクを見つけてください: |
||
+ | |||
+ | {{hc|$ ls -lah /dev/disk/by-uuid/| |
||
+ | lrwxrwxrwx 1 root root 9 Nov 5 22:41 820cdd8a-866a-444d-833c-1edb0f4becac -> ../../sde |
||
+ | lrwxrwxrwx 1 root root 10 Nov 5 22:41 b51b87f3-425e-4fe7-883f-f4ff1689189e -> ../../sdf2 |
||
+ | lrwxrwxrwx 1 root root 9 Nov 5 22:42 ea2199dd-8f9f-4065-a7ba-71bde11a462c -> ../../sda |
||
+ | lrwxrwxrwx 1 root root 10 Nov 5 22:41 fe9e886a-8031-439f-a909-ad06c494fadb -> ../../sdf1 |
||
+ | }} |
||
+ | |||
+ | この例では、対象のデバイスは ''sde'' です。{{ic|/dev/disk/by-uuid/}} のパスを使って ''smartd'' にこのディスクを監視するように指示します: |
||
+ | |||
+ | {{hc|/etc/smartd.conf| |
||
+ | /dev/disk/by-uuid/820cdd8a-866a-444d-833c-1edb0f4becac -a |
||
+ | }} |
||
+ | |||
+ | 注意点として、''smartd'' を機能させるために {{ic|-d removable}} も必要である場合があります。 |
||
+ | |||
+ | これで、{{ic|/dev/sd''X''}} のパスが再起動によって変化しても、USB ディスクが監視されるようになりました。 |
||
+ | |||
+ | ==== 潜在的な問題を通知する ==== |
||
+ | |||
+ | 障害や新しいエラーが発生した場合にメールを送信させるには、{{ic|-m}} オプションを使用してください: |
||
+ | |||
+ | {{hc|/etc/smartd.conf| |
||
+ | DEVICESCAN -m address@domain.com |
||
+ | }} |
||
+ | |||
+ | (root メールアカウントではなく) 外部にメールを送信するには、MTA (Mail Transport Agent) か MUA (Mail User Agent) のインストール・設定が必要です。一般的な MUA は [[msmtp]] と [[Postfix]] ですが、おそらく最も簡単な [[dma]] で十分でしょう。一般的な MTA は sendmail と [[Postfix]] です。メールだけであれば [[S-nail]] を設定するだけで十分ですが、[//web.archive.org/web/20161011211420/https://dominicm.com/configure-email-notifications-on-arch-linux/ これらの手順]に従う必要があります。 |
||
+ | |||
+ | {{ic|-M test}} オプションで、smartd デーモンが起動する度にテストメールを送信します: |
||
+ | |||
+ | {{hc|/etc/smartd.conf| |
||
+ | DEVICESCAN -m address@domain.com -M test |
||
+ | }} |
||
+ | |||
+ | メールが届くまでに時間がかかることもあります。ハードドライブの障害が発生したときにすぐに対応が必要な場合、メールの送信に加えて実行されるスクリプトを定義することもできます: |
||
+ | |||
+ | {{hc|/etc/smartd.conf| |
||
+ | DEVICESCAN -m address@domain.com -M exec /usr/local/bin/smartdnotify |
||
+ | }} |
||
+ | |||
+ | メールとシステム通知を送信するには、{{ic|/usr/local/bin/smartdnotify}} に以下のようなコードを記述してください: |
||
+ | |||
+ | #!/bin/sh |
||
+ | # Send email |
||
+ | echo "$SMARTD_MESSAGE" | mail -s "$SMARTD_FAILTYPE" "$SMARTD_ADDRESS" |
||
+ | # Notify user |
||
+ | wall "$SMARTD_MESSAGE" |
||
+ | |||
+ | デスクトップ環境を使っている場合、デスクトップ上にポップアップを表示させたい場合があります。そのようなときは、以下のスクリプトを使用することができます ({{ic|''X_user''}} と {{ic|''X_userid''}} は X を実行しているユーザとユーザ ID にそれぞれ置き換えてください): |
||
+ | |||
+ | {{hc|/usr/local/bin/smartdnotify|2= |
||
+ | #!/bin/sh |
||
+ | |||
+ | sudo -u ''X_user'' DISPLAY=:0 DBUS_SESSION_BUS_ADDRESS=unix:path=/run/user/''X_userid''/bus notify-send "S.M.A.R.T Error ($SMARTD_FAILTYPE)" "$SMARTD_MESSAGE" --icon=dialog-warning -u critical |
||
+ | }} |
||
+ | |||
+ | このスクリプトは {{Pkg|libnotify}} と完全なデスクトップ環境を必要とします。詳細は [[デスクトップ通知]] を見てください。 |
||
+ | |||
+ | また、カスタムのスクリプトを {{ic|/usr/share/smartmontools/smartd_warning.d/}} に置くこともできます: |
||
+ | |||
+ | このスクリプトは、システム上のログイン中の全ユーザに libnotify を介して通知を送ります。 |
||
+ | |||
+ | {{hc|/usr/share/smartmontools/smartd_warning.d/smartdnotify|2= |
||
+ | #!/bin/sh |
||
+ | |||
+ | IFS=$'\n' |
||
+ | for LINE in `w -hs` |
||
+ | do |
||
+ | USER=`echo $LINE {{!}} awk '{print $1}'` |
||
+ | USER_ID=`id -u $USER` |
||
+ | DISP_ID=`echo $LINE {{!}} awk '{print $8}'` |
||
+ | sudo -u $USER DISPLAY=$DISP_ID DBUS_SESSION_BUS_ADDRESS=unix:path=/run/user/$USER_ID/bus notify-send "S.M.A.R.T Error ($SMARTD_FAILTYPE)" "$SMARTD_MESSAGE" --icon=dialog-warning -u critical |
||
+ | done |
||
+ | }} |
||
+ | |||
+ | このスクリプトは {{Pkg|libnotify}}、{{Pkg|procps-ng}} そして完全なデスクトップ環境を必要とします。 |
||
+ | |||
+ | 以下でカスタムのスクリプトを実行することができます: {{hc|/etc/smartd.conf|DEVICESCAN -m @smartdnotify}} |
||
==== 電源管理 ==== |
==== 電源管理 ==== |
||
− | あなたのコンピューターが電源管理下にあるのなら、smartd に低電圧時の HDD の扱いについて定義しておくべきです。通常スピンアップ時は SMART への反応は smartd コマンドによって発行されます。もしこのオプションを使用しないなら,低電圧運転中に smartd による定期的な監視時にスピンアップし高電力モードになることがあります。 |
||
− | DEVICESCAN -n standby,15,q |
||
+ | 電源管理の制御下にあるコンピュータを使用している場合、低消費電力モードでディスクを扱う方法を smartd に指示する必要があります。通常、ディスクプラッタは、smartd によって発行された SMART コマンドに応答してスピンアップします。なので、以下のオプションを使用しなかった場合、smartd によって定期的にポーリングされたときに、低消費電力モードにあるディスクがスピンアップして高電力モードになる場合があります。 |
||
− | 詳しい情報は [http://sourceforge.net/apps/trac/smartmontools/wiki/Powermode smartmontools wiki] を見てください。 |
||
− | ==== 自己診断の予定を組む ==== |
||
+ | {{hc|/etc/smartd.conf| |
||
− | smartd はスケジュールに従って自己診断の実行をするようディスクに通知することができます。以下の {{ic|/etc/smartd.conf}} 設定例では毎日午前2-3時の間に短い自己診断が、 |
||
+ | DEVICESCAN -n standby,15,q |
||
− | 加えて、土曜日の午前3-4時の間に長い自己診断が行われるようにします: |
||
+ | }} |
||
+ | 詳細は [https://www.smartmontools.org/wiki/Powermode smartmontools wiki] を参照してください。 |
||
− | DEVICESCAN -s (S/../.././02|L/../../6/03) |
||
+ | 一部のデバイスでは {{ic|-n}} が機能しません。syslog に以下のエラーメッセージが出力されます: |
||
− | ==== 温度が変わったら警告する ==== |
||
− | smartd はディスクの温度を記録して、急激な温度上昇が起こった時や温度の上限に達した時に警告をすることができます。以下の例では温度が4度以上変わった時と35度に到達した時にログを記録し、さらに温度が40度と危険なときにはログを取ってメールを送信します: |
||
− | DEVICESCAN -W 4,35,40 |
||
+ | {{hc|# journalctl -u smartd| |
||
− | {{Tip|{{ic|smartctl -A /dev/<device> | grep Temperature_Celsius}} を実行することで現在のディスクの温度を知ることができます。}} |
||
+ | CHECK POWER MODE: incomplete response, ATA output registers missing |
||
+ | Device: /dev/sdb [SAT], no ATA CHECK POWER STATUS support, ignoring -n Directive |
||
+ | }} |
||
+ | 別の方法として smartd の {{ic|-i}} オプションを使用することができます。このオプションは、ドライブの状態を確認するためにディスクをスピンアップする頻度を制御します。デフォルトは30分です。頻度を変更するには {{ic|/etc/conf.d/smartd}} を編集してください。 |
||
− | {{Tip|特定のディスクが専ら他のディスクより熱い/冷たい場合、{{ic|DEVICESCAN}} を削除して個々のデバイスを定義し、適切な温度設定をしてください。}} |
||
+ | |||
− | ==== 完全な {{ic|smartd.conf}} の例 ==== |
||
+ | {{hc|/etc/conf.d/smartd| |
||
+ | output=SMARTD_ARGS="-i 10800" Check status every 10800 seconds (3 hours) |
||
+ | }} |
||
+ | |||
+ | 詳細は {{man|8|smartd}} を参照してください。 |
||
+ | |||
+ | ==== 自己テストをスケジュールする ==== |
||
+ | |||
+ | smartd は、スケジュールに従って自己診断の実行をするようディスクに指示を出すことができます。以下の {{ic|/etc/smartd.conf}} の設定では毎日午前2-3時の間に短い自己診断、土曜日の午前3-4時の間に長い自己診断が行われるようにします: |
||
+ | |||
+ | {{hc|/etc/smartd.conf| |
||
+ | DEVICESCAN -s (S/../.././02{{!}}L/../../6/03) |
||
+ | }} |
||
+ | |||
+ | ==== 温度の変化を警告する ==== |
||
+ | |||
+ | smartd はディスクの温度を記録して、急激な温度上昇が起こった時や温度の上限に達した時に警告をすることができます。以下の例では、温度が4度以上変化したときにログを取り、温度が35度に達したときにログを取り、40度に達したときに警告をログに記録しメールを送信します: |
||
+ | |||
+ | {{hc|/etc/smartd.conf| |
||
+ | DEVICESCAN -W 4,35,40 |
||
+ | }} |
||
+ | |||
+ | {{Tip| |
||
+ | * コマンド {{ic|smartctl -A /dev/''device'' {{!}} grep Temperature_Celsius}} を実行することで、現在のディスクの温度を知ることができます。 |
||
+ | * 一部のディスクが専ら他のディスクより熱い/冷たい場合、{{ic|DEVICESCAN}} を削除して個々のデバイスを定義し、適切な温度設定をしてください。 |
||
+ | }} |
||
+ | |||
+ | ==== 完全な smartd.conf の例 ==== |
||
上記の例を全てまとめると以下のような設定になります: |
上記の例を全てまとめると以下のような設定になります: |
||
− | * {{ic|DEVICESCAN}} |
+ | * {{ic|DEVICESCAN}}: smartd ディスクをスキャンし、検出されたディスクすべてを監視する |
− | * {{ic|-a}} |
+ | * {{ic|-a}}: 全ての属性を監視する |
− | * {{ic|-o on}} |
+ | * {{ic|-o on}}: オンラインデータの自動収集を有効化する |
− | * {{ic|-S on}} |
+ | * {{ic|-S on}}: 属性の自動保存を有効化する |
− | * {{ic|-n standby,q}} |
+ | * {{ic|-n standby,q}}: ディスクが待機中の時チェックを実行せず、ディスクアクセスが発生しないようにログに書き込まない |
− | * {{ic|-s ...}} |
+ | * {{ic|-s ...}}: 短いテストと長いテストの予定を立てる |
− | * {{ic|-W ...}} |
+ | * {{ic|-W ...}}: 温度を監視する |
− | * {{ic|-m ...}} |
+ | * {{ic|-m ...}}: メールアラート |
+ | |||
+ | {{hc|/etc/smartd.conf| |
||
+ | DEVICESCAN -a -o on -S on -n standby,q -s (S/../.././02{{!}}L/../../6/03) -W 4,35,40 -m ''username-or-email'' |
||
+ | }} |
||
+ | |||
+ | === update-smart-drivedb === |
||
+ | |||
+ | このユーティリティは smartmontools のソースリポジトリから {{ic|drivedb.h}} の最新バージョンをダウンロードし、新しいデバイスとそのパラメータを認識できるようにします。 |
||
+ | ダウンロードされたファイルは {{ic|/usr/share/smartmontools/drivedb.h}} にあるデフォルトのものを置き換えることができます。このファイルは、各ドライブに対してコンマで区切られた値を含む平文ファイルです。 |
||
− | DEVICESCAN -a -o on -S on -n standby,q -s (S/../.././02|L/../../6/03) -W 4,35,40 -m <username or email> |
||
+ | あなたのドライブがまだ認識されない場合は、[https://www.smartmontools.org/wiki/FAQ#MyATASATAdriveisnotinthesmartctlsmartddatabase 上流に投稿する]ことができます。 |
||
− | ==== {{ic|smartd}} サービスの起動・リロードと状態の確認 ==== |
||
− | # systemctl start smartd |
||
+ | コマンドラインオプションの完全なリストは {{man|8|update-smart-drivedb}} を見てください。 |
||
− | または |
||
− | # systemctl reload smartd |
||
+ | == コンソールアプリケーション == |
||
− | 状態を確認する: |
||
+ | * {{App|skdump|SMART デバイスの監視と管理、及びハードディスクドライブの健康状態の監視と報告を行うユーティリティ。|https://0pointer.de/blog/projects/being-smart.html|{{Pkg|libatasmart}}}} |
||
− | # systemctl status smartd |
||
+ | * {{ic|iostat -x}} ({{Pkg|sysstat}} に含まれる) もいくつかのディスクの健康指標を提供します。特に、f_await 列の値が大きい場合は、ディスクがリクエストに素早く応答していないことを意味しており、障害が発生しているのかもしれません。 |
||
− | 全ての {{ic|smartd}} ログ: |
||
+ | == GUI アプリケーション == |
||
− | # journalctl -u smartd |
||
+ | * {{App|DisKMonitor|SMART デバイスと MDRaid 健康状態を監視する KDE 向けツール集。|https://github.com/papylhomme/diskmonitor|{{AUR|diskmonitor}}}} |
||
− | === GUI アプリケーション === |
||
+ | * {{App|[[Wikipedia:ja:GNOME Disks|GNOME Disks]]|{{Pkg|libatasmart}} を使用する GNOME フロントエンドで、ハードディスクドライブの健康状態を監視し、報告します。{{Grp|gnome}} に含まれています。|https://apps.gnome.org/DiskUtility/|{{Pkg|gnome-disk-utility}}}} |
||
+ | * {{App|GSmartControl|smartctl の GUI です。ドライブの SMART データを調査して健康状態を判定することができ、ドライブに様々なテストを実行することもできます。|https://gsmartcontrol.shaduri.dev/|{{Pkg|gsmartcontrol}}}} |
||
+ | * {{App|Plasma Disks|KDE Plasma のためのハードディスクの健康状態の監視。{{Grp|plasma}} に含まれています。|https://invent.kde.org/plasma/plasma-disks/|{{Pkg|plasma-disks}}}} |
||
+ | == 参照 == |
||
− | * {{App|Gsmartcontrol|smartctl ハードディスクドライブ状態調査ツールの GNOME フロントエンド。|http://gsmartcontrol.sourceforge.net|{{Pkg|gsmartcontrol}} または {{AUR|gsmartcontrol-svn}}}} |
||
+ | * [https://www.smartmontools.org/ Smartmontools ホームページ] |
||
− | == 情報元 == |
||
+ | * [https://help.ubuntu.com/community/Smartmontools Ubuntu Wiki の Smartmontools] |
||
+ | * [[Gentoo: smartmontools]] |
||
+ | {{TranslationStatus|S.M.A.R.T.|2024-06-15|809164}} |
||
− | * [http://www.smartmontools.org/ Smartmontools ホームページ] |
||
− | * [https://help.ubuntu.com/community/Smartmontools Smartmontools on Ubuntu Wiki] |
2024年6月15日 (土) 12:21時点における最新版
S.M.A.R.T. (Self-Monitoring, Analysis, and Reporting Technology) は、最近のストレージデバイスの多くに内蔵されている補助コンポーネントであり、これによってデバイスは動作の健康状態を監視、保存、そして分析します。ソフトウェアは、収集された統計 (温度、代替処理されたセクタ数、シークエラーなど) を用いてデバイスの健康状態の計測、デバイスの障害の予測、危険な値に達した際の通知を行うことができます。
目次
Smartmontools
smartmontools パッケージには、ストレージデバイスの分析と監視のためのユーティリティプログラム smartctl
と smartd
、サードパーティのデータベース更新ユーティリティ update-smart-drivedb
が含まれています。
これらのツールを使用するには smartmontools パッケージをインストールしてください。
これらのツールを効果的に使用するには、各ストレージデバイスで SMART サポートが利用可能であり、かつ有効化されていなければなりません。#smartctl を使うことで SMART サポートを確認したり有効化したりすることができます。それが済んだら、手動で #テストを実行する ことも #テスト結果を表示する こともできますし、#smartd を使って自動的にテストを実行してメールで通知することもできます。
smartctl
smartctl は、「ほとんどの ATA/SATA 及び SCSI/SAS ハードドライブやソリッドステートドライブに組み込まれている Self-Monitoring, Analysis and Reporting Technology (SMART) システムを制御する」コマンドラインツールです。
-i
/--info
オプションは、デバイスに関する様々な情報を出力します (SMART が利用可能で有効であるかどうかに関する情報を含む):
# smartctl --info /dev/sda | grep 'SMART support is:'
SMART support is: Available - device has SMART capability. SMART support is: Enabled
SMART が利用可能であるが、有効でない場合、有効化することができます:
# smartctl --smart=on /dev/device
場合によっては、デバイスのタイプを指定する必要があります。例えば、--device=ata
は、デバイスのタイプが ATA であることを smartctl に伝え、smartctl がそのデバイスに SCSI コマンドを発行してしまうことを防ぎます。
テストを実行する
デバイスが実行できる自己テストには3種類あります (どのテストもユーザデータに対して安全です):
- Short: デバイスの問題を検出する可能性の高いテストを実行します。
- Extended 或いは Long: このテストは short チェックと同じですが、時間制限が無く、完全なディスクサーフェス検査を行います。
- Conveyance: デバイスの輸送中にダメージが発生したかどうかを調べます。
- Selective: LBA の範囲をテストします (詳細は smartctl(8) § t を参照)。
-c
/--capabilities
フラグは、デバイスがサポートしているテストと各テストの推定実行時間を出力します。例えば:
# smartctl -c /dev/sda
... Short self-test routine recommended polling time: ( 1) minutes. Extended self-test routine recommended polling time: ( 74) minutes. Conveyance self-test routine recommended polling time: ( 2) minutes. ...
テストを実行するには -t
/--test=test_name
フラグを使用してください:
# smartctl -t short /dev/device # smartctl -t long /dev/device # smartctl -t conveyance /dev/device # smartctl -t select,123+345 /dev/device
テスト結果を表示する
-H
フラグでデバイスの全体的な健康状態を表示できます。「デバイスが健康状態に問題があると報告した場合、デバイスがすでに故障しているか、24時間以内にデバイス自体が故障することが予測されていることを意味します。この場合 […] 可能な限り早くディスクからデータを取り出し、別の安全な場所に移してください。」
# smartctl -H /dev/device
最近のテスト結果の一覧やデバイスの詳細な情報を表示することもできます:
# smartctl -l selftest /dev/device # smartctl -x /dev/device
全ディスクの属性表を生成する
#!/bin/bash function drives_csv { declare -A drive_values for d in `smartctl --scan -d scsi | cut -d' ' -f1`; do drive_values["-Drive-----------------"]="${drive_values[-Drive-----------------]},$d" for l in `smartctl -A $d | grep ATTRIBUTE_NAME -A30 | grep -v ATTRIBUTE_NAME | column -H1,3,4,5,6,7,8,9,11,12,13,14,15 -t -o, | sed 's/ //g'`; do key=`echo $l | cut -d',' -f1` value=`echo $l | cut -d',' -f2` existing=${drive_values["$key"]} drive_values["${key}"]="${existing},${value}" #~ echo "${key},${drive_values[$key]}" done done for key in "${!drive_values[@]}"; do echo "${key}${drive_values[$key]}" done | sort } drives_csv | column -s, -t
smartd
smartd デーモンは SMART の状態を監視して、何か問題が発生したら通知します。このデーモンは systemd で管理でき、設定ファイル /etc/smartd.conf
で設定できます。設定ファイルの構文は難解であり、この wiki ページではクイックリファレンスしか提供しません。より完全な情報は設定ファイル内の例やコメントを読んだり、smartd.conf(5) を読んだりしてください。
デーモン管理
デーモンの起動、ステータスの確認、システムブート時の自動起動、最近のログファイルエントリの確認を行うには、smartd.service
systemd ユニットを起動/有効化してください。
管理すべきデバイスを定義する
全ディスク上のすべての SMART エラーを監視するには、以下の設定を設定ファイルに追加しなければなりません:
/etc/smartd.conf
DEVICESCAN -a
注意点として、これはデフォルトの smartd 設定であり、-a
パラメータ (デフォルトのパラメータ) は省略できます。
/dev/sda
と /dev/sdb
のすべての SMART エラーを監視し、他のデバイスすべてを無視するには:
/etc/smartd.conf
/dev/sda -a /dev/sdb -a
外部接続のディスクのすべての SMART エラーを監視する場合、ドライブの /dev/sdX
は再起動後に変化するかもしれないので、ドライブの UUID を smartd に渡すのが賢明です。
まず、監視すべきディスクの UUID を手に入れなければなりません。ls -lah /dev/disk/by-uuid/
を実行して、監視したいディスクを見つけてください:
$ ls -lah /dev/disk/by-uuid/
lrwxrwxrwx 1 root root 9 Nov 5 22:41 820cdd8a-866a-444d-833c-1edb0f4becac -> ../../sde lrwxrwxrwx 1 root root 10 Nov 5 22:41 b51b87f3-425e-4fe7-883f-f4ff1689189e -> ../../sdf2 lrwxrwxrwx 1 root root 9 Nov 5 22:42 ea2199dd-8f9f-4065-a7ba-71bde11a462c -> ../../sda lrwxrwxrwx 1 root root 10 Nov 5 22:41 fe9e886a-8031-439f-a909-ad06c494fadb -> ../../sdf1
この例では、対象のデバイスは sde です。/dev/disk/by-uuid/
のパスを使って smartd にこのディスクを監視するように指示します:
/etc/smartd.conf
/dev/disk/by-uuid/820cdd8a-866a-444d-833c-1edb0f4becac -a
注意点として、smartd を機能させるために -d removable
も必要である場合があります。
これで、/dev/sdX
のパスが再起動によって変化しても、USB ディスクが監視されるようになりました。
潜在的な問題を通知する
障害や新しいエラーが発生した場合にメールを送信させるには、-m
オプションを使用してください:
/etc/smartd.conf
DEVICESCAN -m address@domain.com
(root メールアカウントではなく) 外部にメールを送信するには、MTA (Mail Transport Agent) か MUA (Mail User Agent) のインストール・設定が必要です。一般的な MUA は msmtp と Postfix ですが、おそらく最も簡単な dma で十分でしょう。一般的な MTA は sendmail と Postfix です。メールだけであれば S-nail を設定するだけで十分ですが、これらの手順に従う必要があります。
-M test
オプションで、smartd デーモンが起動する度にテストメールを送信します:
/etc/smartd.conf
DEVICESCAN -m address@domain.com -M test
メールが届くまでに時間がかかることもあります。ハードドライブの障害が発生したときにすぐに対応が必要な場合、メールの送信に加えて実行されるスクリプトを定義することもできます:
/etc/smartd.conf
DEVICESCAN -m address@domain.com -M exec /usr/local/bin/smartdnotify
メールとシステム通知を送信するには、/usr/local/bin/smartdnotify
に以下のようなコードを記述してください:
#!/bin/sh # Send email echo "$SMARTD_MESSAGE" | mail -s "$SMARTD_FAILTYPE" "$SMARTD_ADDRESS" # Notify user wall "$SMARTD_MESSAGE"
デスクトップ環境を使っている場合、デスクトップ上にポップアップを表示させたい場合があります。そのようなときは、以下のスクリプトを使用することができます (X_user
と X_userid
は X を実行しているユーザとユーザ ID にそれぞれ置き換えてください):
/usr/local/bin/smartdnotify
#!/bin/sh sudo -u X_user DISPLAY=:0 DBUS_SESSION_BUS_ADDRESS=unix:path=/run/user/X_userid/bus notify-send "S.M.A.R.T Error ($SMARTD_FAILTYPE)" "$SMARTD_MESSAGE" --icon=dialog-warning -u critical
このスクリプトは libnotify と完全なデスクトップ環境を必要とします。詳細は デスクトップ通知 を見てください。
また、カスタムのスクリプトを /usr/share/smartmontools/smartd_warning.d/
に置くこともできます:
このスクリプトは、システム上のログイン中の全ユーザに libnotify を介して通知を送ります。
/usr/share/smartmontools/smartd_warning.d/smartdnotify
#!/bin/sh IFS=$'\n' for LINE in `w -hs` do USER=`echo $LINE | awk '{print $1}'` USER_ID=`id -u $USER` DISP_ID=`echo $LINE | awk '{print $8}'` sudo -u $USER DISPLAY=$DISP_ID DBUS_SESSION_BUS_ADDRESS=unix:path=/run/user/$USER_ID/bus notify-send "S.M.A.R.T Error ($SMARTD_FAILTYPE)" "$SMARTD_MESSAGE" --icon=dialog-warning -u critical done
このスクリプトは libnotify、procps-ng そして完全なデスクトップ環境を必要とします。
以下でカスタムのスクリプトを実行することができます:
/etc/smartd.conf
DEVICESCAN -m @smartdnotify
電源管理
電源管理の制御下にあるコンピュータを使用している場合、低消費電力モードでディスクを扱う方法を smartd に指示する必要があります。通常、ディスクプラッタは、smartd によって発行された SMART コマンドに応答してスピンアップします。なので、以下のオプションを使用しなかった場合、smartd によって定期的にポーリングされたときに、低消費電力モードにあるディスクがスピンアップして高電力モードになる場合があります。
/etc/smartd.conf
DEVICESCAN -n standby,15,q
詳細は smartmontools wiki を参照してください。
一部のデバイスでは -n
が機能しません。syslog に以下のエラーメッセージが出力されます:
# journalctl -u smartd
CHECK POWER MODE: incomplete response, ATA output registers missing Device: /dev/sdb [SAT], no ATA CHECK POWER STATUS support, ignoring -n Directive
別の方法として smartd の -i
オプションを使用することができます。このオプションは、ドライブの状態を確認するためにディスクをスピンアップする頻度を制御します。デフォルトは30分です。頻度を変更するには /etc/conf.d/smartd
を編集してください。
/etc/conf.d/smartd
SMARTD_ARGS="-i 10800" Check status every 10800 seconds (3 hours)
詳細は smartd(8) を参照してください。
自己テストをスケジュールする
smartd は、スケジュールに従って自己診断の実行をするようディスクに指示を出すことができます。以下の /etc/smartd.conf
の設定では毎日午前2-3時の間に短い自己診断、土曜日の午前3-4時の間に長い自己診断が行われるようにします:
/etc/smartd.conf
DEVICESCAN -s (S/../.././02|L/../../6/03)
温度の変化を警告する
smartd はディスクの温度を記録して、急激な温度上昇が起こった時や温度の上限に達した時に警告をすることができます。以下の例では、温度が4度以上変化したときにログを取り、温度が35度に達したときにログを取り、40度に達したときに警告をログに記録しメールを送信します:
/etc/smartd.conf
DEVICESCAN -W 4,35,40
完全な smartd.conf の例
上記の例を全てまとめると以下のような設定になります:
DEVICESCAN
: smartd ディスクをスキャンし、検出されたディスクすべてを監視する-a
: 全ての属性を監視する-o on
: オンラインデータの自動収集を有効化する-S on
: 属性の自動保存を有効化する-n standby,q
: ディスクが待機中の時チェックを実行せず、ディスクアクセスが発生しないようにログに書き込まない-s ...
: 短いテストと長いテストの予定を立てる-W ...
: 温度を監視する-m ...
: メールアラート
/etc/smartd.conf
DEVICESCAN -a -o on -S on -n standby,q -s (S/../.././02|L/../../6/03) -W 4,35,40 -m username-or-email
update-smart-drivedb
このユーティリティは smartmontools のソースリポジトリから drivedb.h
の最新バージョンをダウンロードし、新しいデバイスとそのパラメータを認識できるようにします。
ダウンロードされたファイルは /usr/share/smartmontools/drivedb.h
にあるデフォルトのものを置き換えることができます。このファイルは、各ドライブに対してコンマで区切られた値を含む平文ファイルです。
あなたのドライブがまだ認識されない場合は、上流に投稿することができます。
コマンドラインオプションの完全なリストは update-smart-drivedb(8) を見てください。
コンソールアプリケーション
- skdump — SMART デバイスの監視と管理、及びハードディスクドライブの健康状態の監視と報告を行うユーティリティ。
iostat -x
(sysstat に含まれる) もいくつかのディスクの健康指標を提供します。特に、f_await 列の値が大きい場合は、ディスクがリクエストに素早く応答していないことを意味しており、障害が発生しているのかもしれません。
GUI アプリケーション
- DisKMonitor — SMART デバイスと MDRaid 健康状態を監視する KDE 向けツール集。
- GNOME Disks — libatasmart を使用する GNOME フロントエンドで、ハードディスクドライブの健康状態を監視し、報告します。gnome に含まれています。
- GSmartControl — smartctl の GUI です。ドライブの SMART データを調査して健康状態を判定することができ、ドライブに様々なテストを実行することもできます。
- Plasma Disks — KDE Plasma のためのハードディスクの健康状態の監視。plasma に含まれています。