「マシンチェック例外」の版間の差分

提供: ArchWiki
ナビゲーションに移動 検索に移動
(Pkg/AUR テンプレートの更新)
(同期)
8行目: 8行目:
 
== インストール ==
 
== インストール ==
   
{{Pkg|mcelog}}{{Broken package link|{{aur-mirror|mcelog}}}} パッケージを[[インストール]]してください。[http://www.mcelog.org/ mcelog] は Andi Kleen によって書かれた MCE 情報を収集するツールの一つです。
+
{{aur|rasdaemon}} パッケージを[[インストール]]してください。[https://pagure.io/rasdaemon rasdaemon] は Mauro Carvalho Chehab によって書かれた MCE 情報を収集するツールの一つです。
  +
  +
以前は、{{ic|mcelog}} パッケージがつかわれていましたが、非推奨となり、Arch のカーネルは必要なカーネルコンフィグ {{ic|CONFIG_X86_MCELOG_LEGACY}} を有効にしてコンパイルされていません ({{Bug|55657}})。
   
 
== 設定 ==
 
== 設定 ==
   
  +
[[起動]]・[[有効化]]する必要がある systemd サービスは2つあります。{{ic|ras-mc-ctl.service}} は EDAC ドライバーを使って DIMM ラベルを ({{ic|/etc/ras/dimm_labels.d/}} から) 登録します。一般市場向けのマザーボードは大抵 {{ic|No dimm labels for <motherboard model>}} エラーをログ出力して何も行いません。{{ic|rasdaemon.service}} はデーモンとして起動し RAS イベントを [[systemd#Journal|systemd journal]] に保存します。
mcelog の設定ファイルは {{ic|/etc/mcelog/mcelog.conf}} にあります。詳しくは {{ic|man mcelog}}, {{ic|man mcelog.conf}}, {{ic|man mcelog.triggers}} を参照してください。
 
   
  +
詳しい情報は {{man|8|ras-mc-ctl|url=https://www.mankier.com/8/ras-mc-ctl}} や {{man|1|rasdaemon|url=https://www.mankier.com/1/rasdaemon}} を見てください。
{{ic|mcelog.service}} を[[起動]]・有効化してください。デフォルトで、デーモンとして ''mcelog'' がサービスによって実行されます。
 
   
 
== 参照 ==
 
== 参照 ==
20行目: 22行目:
 
* [[Wikipedia:Machine_Check_Exception]]
 
* [[Wikipedia:Machine_Check_Exception]]
 
* [[Wikipedia:Machine_check_architecture]]
 
* [[Wikipedia:Machine_check_architecture]]
  +
* [https://lwn.net/Articles/543097/ Rasdaemon initial announcement]
  +
* [https://events.linuxfoundation.org/sites/events/files/slides/RAS_presentation_LinuxCon_NA_0.pdf RAS presentation]
 
* [http://www.mcelog.org/ mcelog ホーム]
 
* [http://www.mcelog.org/ mcelog ホーム]
 
* [http://www.mcelog.org/references.html mcelog リファレンス]
 
* [http://www.mcelog.org/references.html mcelog リファレンス]

2018年1月3日 (水) 19:36時点における版

この記事ではハードウェアのエラーを能動的に監視・記録・報告するサービスについて説明します。マシンチェック例外 (MCE) は CPU によって生成されるエラーで、ハードウェアのエラーや故障が検出されたときに発せられます。

マシンチェック例外 (MCE) が発生する理由は幅広く存在します。電源供給の電圧が仕様に満たされなかったりすることから、宇宙線によるメモリ DIMM や CPU のビットの反転まで、様々な要因が考えられます。ハードウェアのエラーを引き起こすソフトウェアの欠陥なども含まれます。

インストール

rasdaemonAUR パッケージをインストールしてください。rasdaemon は Mauro Carvalho Chehab によって書かれた MCE 情報を収集するツールの一つです。

以前は、mcelog パッケージがつかわれていましたが、非推奨となり、Arch のカーネルは必要なカーネルコンフィグ CONFIG_X86_MCELOG_LEGACY を有効にしてコンパイルされていません (FS#55657)。

設定

起動有効化する必要がある systemd サービスは2つあります。ras-mc-ctl.service は EDAC ドライバーを使って DIMM ラベルを (/etc/ras/dimm_labels.d/ から) 登録します。一般市場向けのマザーボードは大抵 No dimm labels for <motherboard model> エラーをログ出力して何も行いません。rasdaemon.service はデーモンとして起動し RAS イベントを systemd journal に保存します。

詳しい情報は ras-mc-ctl(8)rasdaemon(1) を見てください。

参照

ハードウェアのドキュメント