「パフォーマンスの向上」の版間の差分

提供: ArchWiki
ナビゲーションに移動 検索に移動
 
(文字列「Tips_and_tricks」を「ヒントとテクニック‎」に置換)
(3人の利用者による、間の10版が非表示)
1行目: 1行目:
 
[[Category:ハードウェア]]
 
[[Category:ハードウェア]]
 
[[Category:システム管理]]
 
[[Category:システム管理]]
[[ar:Maximizing Performance]]
+
[[ar:Maximizing performance]]
[[en:Maximizing Performance]]
+
[[en:Maximizing performance]]
[[es:Maximizing Performance]]
+
[[es:Maximizing performance]]
[[ru:Maximizing Performance]]
+
[[ru:Maximizing performance]]
[[zh-CN:Maximizing Performance]]
+
[[zh-hans:Maximizing performance]]
 
{{Related articles start}}
 
{{Related articles start}}
{{Related2|ccache|ccache}}
+
{{Related|ccache}}
{{Related2|Improve Pacman Performance|pacman のパフォーマンスの向上}}
+
{{Related|pacman のパフォーマンスの向上}}
{{Related2|SSH#SSH の高速化|SSH#SSH の高速化}}
+
{{Related|SSH#SSH の高速化}}
{{Related2|LibreOffice#LibreOffice の高速化|LibreOffice#LibreOffice の高速化}}
+
{{Related|LibreOffice#LibreOffice の高速化}}
{{Related2|Openoffice#Speed up OpenOffice|OpenOffice#OpenOffice の高速化}}
+
{{Related|OpenOffice#OpenOffice の高速化}}
  +
{{Related|ノートパソコン}}
{{Related2|Laptop|ラップトップ}}
 
{{Related2|Swap#Swappiness|スワップ#Swappiness}}
+
{{Related|スワップ#Swappiness}}
{{Related2|Preload|Preload}}
+
{{Related|Preload}}
  +
{{Related|Cpulimit}}
{{Related2|Improve Boot Performance|ブートパフォーマンスの向上}}
 
  +
{{Related|ブートパフォーマンスの向上}}
 
{{Related articles end}}
 
{{Related articles end}}
 
この記事ではパフォーマンスに関する基本的なシステムの診断法と、リソースの消費を減らしたりシステムを最適化することができる、また、システムのパフォーマンスを向上させると言われている手順の情報を提供しています。
 
この記事ではパフォーマンスに関する基本的なシステムの診断法と、リソースの消費を減らしたりシステムを最適化することができる、また、システムのパフォーマンスを向上させると言われている手順の情報を提供しています。
27行目: 28行目:
 
* 起動時間が非常に長い場合、または、アプリケーションを初めて起動するときにロードに長い時間がかかるが起動後は順調に動作する場合、おそらくハードドライブが遅過ぎます。ハードドライブの速度を計測するには {{ic|hdparm}} コマンドを使います:
 
* 起動時間が非常に長い場合、または、アプリケーションを初めて起動するときにロードに長い時間がかかるが起動後は順調に動作する場合、おそらくハードドライブが遅過ぎます。ハードドライブの速度を計測するには {{ic|hdparm}} コマンドを使います:
 
$ hdparm -t /dev/sdx
 
$ hdparm -t /dev/sdx
ハードドライブの純粋な読み込み速度なので、正しいベンチマークとは言えませんが、(アイドル状態のときにドライブをテストして)平均的なコンピュータでは 40MB/s より高い数値が出るのが普通だと思われます。hdparm は[[Official Repositories|公式リポジトリ]]に入っています。
+
ハードドライブの純粋な読み込み速度なので、正しいベンチマークとは言えませんが、(アイドル状態のときにドライブをテストして)平均的なコンピュータでは 40MB/s より高い数値が出るのが普通だと思われます。hdparm は[[公式リポジトリ]]に入っています。
 
* RAM が利用できる時でも CPU 負担が一貫して高い場合、CPU 使用量を減らすことが優先事項でしょう。{{ic|top}} コマンドを使うなど多くの方法で CPU 負担をモニタすることができます:
 
* RAM が利用できる時でも CPU 負担が一貫して高い場合、CPU 使用量を減らすことが優先事項でしょう。{{ic|top}} コマンドを使うなど多くの方法で CPU 負担をモニタすることができます:
 
$ top
 
$ top
36行目: 37行目:
 
===初めにすること===
 
===初めにすること===
 
パフォーマンスを向上させるのに、一番簡単で最も効果的な方法は軽量な環境・アプリケーションを動かすことです。
 
パフォーマンスを向上させるのに、一番簡単で最も効果的な方法は軽量な環境・アプリケーションを動かすことです。
* [[Desktop Environment|デスクトップ環境]]の代わりに[[Window Manager|ウィンドウマネージャ]]を使いましょう。[[dwm]], [[wmii]], [[i3|i3]], [[Awesome|Awesome]], [[Openbox|Openbox]], [[Fluxbox|Fluxbox]], [[JWM]], [[xmonad|xmonad]] などがあります。
+
* [[デスクトップ環境]]の代わりに[[ウィンドウマネージャ]]を使いましょう。[[dwm]], [[wmii]], [[i3]], [[Awesome]], [[Openbox]], [[Fluxbox]], [[JWM]], [[xmonad]] などがあります。
* 重量級のデスクトップ環境、[[GNOME|GNOME]] や [[KDE|KDE]] の代わりに、[[LXDE|LXDE]] や [[Xfce|Xfce]] などの軽量な環境を使いましょう。
+
* 重量級のデスクトップ環境、[[GNOME]] や [[KDE]] の代わりに、[[LXDE]] や [[Xfce]] などの軽量な環境を使いましょう。
* 軽量なアプリケーションを使いましょう。[[List of Applications|アプリケーション一覧]]でコンソールアプリケーションを探したり、フォーラム内のライトアンドファースト・アプリケーション・アワードのスレッドを見て下さい: [https://bbs.archlinux.org/viewtopic.php?id=41168 2007], [https://bbs.archlinux.org/viewtopic.php?id=67951 2008], [https://bbs.archlinux.org/viewtopic.php?id=78490 2009], [https://bbs.archlinux.org/viewtopic.php?id=88515 2010], [https://bbs.archlinux.org/viewtopic.php?id=111878 2011], [https://bbs.archlinux.org/viewtopic.php?id=138281 2012]。
+
* 軽量なアプリケーションを使いましょう。[[アプリケーション一覧]]でコンソールアプリケーションを探したり、フォーラム内のライトアンドファースト・アプリケーション・アワードのスレッドを見て下さい: [https://bbs.archlinux.org/viewtopic.php?id=41168 2007], [https://bbs.archlinux.org/viewtopic.php?id=67951 2008], [https://bbs.archlinux.org/viewtopic.php?id=78490 2009], [https://bbs.archlinux.org/viewtopic.php?id=88515 2010], [https://bbs.archlinux.org/viewtopic.php?id=111878 2011], [https://bbs.archlinux.org/viewtopic.php?id=138281 2012]。
* 不必要な[[Daemons|デーモン]]を停止させたり {{ic|[[systemd#systemctl の基本的な使い方|systemctl]]}} を使ってバックグラウンドで動かしているデーモンを削除しましょう。
+
* 不必要な[[デーモン]]を停止させたり {{ic|[[systemd#systemctl の基本的な使い方|systemctl]]}} を使ってバックグラウンドで動かしているデーモンを削除しましょう。
   
 
===妥協===
 
===妥協===
45行目: 46行目:
   
 
===ベンチマーク===
 
===ベンチマーク===
最適化の効果を判断できないことがたびたびあります。そういった場合は[[benchmarking|ベンチマーク]]ツールで計測することができます。
+
最適化の効果を判断できないことがたびたびあります。そういった場合は[[ベンチマーク]]ツールで計測することができます。
   
 
==ストレージデバイス==
 
==ストレージデバイス==
55行目: 56行目:
   
 
====RAID====
 
====RAID====
(2つ以上の)複数のディスクを使える場合、ソフトウェア [[RAID|RAID]] を設定することでスピードを向上させることが可能です。RAID 0 アレイではドライブ障害に対する冗長性はありませんが、アレイにディスクを追加すればそれだけディスクの速度を高速にできます。賢い選択は RAID 5 を使うことです、RAID 5 はスピードとデータ保護の両方を提供します。
+
(2つ以上の)複数のディスクを使える場合、ソフトウェア [[RAID]] を設定することでスピードを向上させることが可能です。RAID 0 アレイではドライブ障害に対する冗長性はありませんが、アレイにディスクを追加すればそれだけディスクの速度を高速にできます。賢い選択は RAID 5 を使うことです、RAID 5 はスピードとデータ保護の両方を提供します。
   
 
====ハードウェアの接続端子====
 
====ハードウェアの接続端子====
72行目: 73行目:
   
 
===パーティション===
 
===パーティション===
パーティションレイアウトもシステムのパフォーマンスに影響を与えることがあります。ドライブの最初のセクター(ディスクの中心部)は最後のセクターよりも高速です。また、パーティションを小さくすれば必要なドライブヘッドの移動が少なくなり、ディスク操作をスピードアップできます。従って、システムのために作るパーティションは小さくして、できるだけドライブの最初に配置することが推奨されます。他のデータ(画像・動画など)は分割パーティションに置くべきです。通常、システム ({{ic|/}}) から home ディレクトリ ({{ic|/home/''user''}}) を分割することでこれを達成できます。
+
パーティションレイアウトもシステムのパフォーマンスに影響を与えることがあります。ドライブの最初のセクター(ディスクの周辺部)は最後のセクターよりも高速です。また、パーティションを小さくすれば必要なドライブヘッドの移動が少なくなり、ディスク操作をスピードアップできます。従って、システムのために作るパーティションは小さくして、できるだけドライブの最初に配置することが推奨されます。他のデータ(画像・動画など)は分割パーティションに置くべきです。通常、システム ({{ic|/}}) から home ディレクトリ ({{ic|/home/''user''}}) を分割することでこれを達成できます。
   
 
===ファイルシステムの選択とチューニング===
 
===ファイルシステムの選択とチューニング===
ファイルシステムごとに強みが異なるのでシステムごとにファイルシステムを選ぶことはとても重要です。[[File Systems#ファイルシステムのタイプ|ファイルシステム]]の記事に人気のあるファイルシステムの簡単な説明がされています。[[:Category:File systems|ここ]]から関連記事も見ることができます。
+
ファイルシステムごとに強みが異なるのでシステムごとにファイルシステムを選ぶことはとても重要です。[[ファイルシステム]]の記事に人気のあるファイルシステムの簡単な説明がされています。[[:カテゴリ:ファイルシステム|ここ]]から関連記事も見ることができます。
   
 
====マウントオプション====
 
====マウントオプション====
84行目: 85行目:
 
{{Ic|noatime,nodiratime}} マウントオプションはほとんど全てのファイルシステムでパフォーマンスを向上させることができるとして知られています。前者は後者の上位版です ({{Ic|nodiratime}} はディレクトリにだけ適用されます -- {{Ic|noatime}} はファイルとディレクトリ両方に適用されます)。レアケースで、例えば、あなたが ''mutt'' を使っている場合など、小さな問題が起こることがあります。代わりに {{Ic|relatime}} オプションを使うこともできます (カーネル 2.6.30 以上ではデフォルトです)。
 
{{Ic|noatime,nodiratime}} マウントオプションはほとんど全てのファイルシステムでパフォーマンスを向上させることができるとして知られています。前者は後者の上位版です ({{Ic|nodiratime}} はディレクトリにだけ適用されます -- {{Ic|noatime}} はファイルとディレクトリ両方に適用されます)。レアケースで、例えば、あなたが ''mutt'' を使っている場合など、小さな問題が起こることがあります。代わりに {{Ic|relatime}} オプションを使うこともできます (カーネル 2.6.30 以上ではデフォルトです)。
   
  +
特定のファイルシステムにしかないマウントオプションも存在します。それぞれのファイルシステムのページを見て下さい:
====Ext3====
 
[[Ext3]] を見て下さい。
 
   
  +
* [[Ext3]]
====Ext4====
 
  +
* [[Ext4#ヒントとテクニック‎]]
[[Ext4#Tips_and_tricks|Ext4]] を見て下さい。
 
  +
* [[JFS#最適化]]
  +
* [[XFS]]
  +
* [[Btrfs#デフラグメンテーション]] と [[Btrfs#圧縮]]
  +
* [[ZFS#チューニング]]
   
====JFS====
+
===== Reiserfs =====
[[JFS Filesystem#Optimizations|JFS Filesystem]] を見て下さい。
 
 
====XFS====
 
XFS ファイルシステムは作成するときに [http://xfs.org/index.php/XFS_FAQ#Q:_I_want_to_tune_my_XFS_filesystems_for_.3Csomething.3E デフォルトで "boost knobs" が有効になっています]:
 
$ mkfs.xfs /dev/thetargetpartition
 
 
==== Reiserfs ====
 
   
 
{{Ic|<nowiki>data=writeback</nowiki>}} マウントオプションはスピードを向上させますが、電源喪失でデータが破損します。{{Ic|notail}} マウントオプションはファイルシステムが使う容量を 5% ほど増やしますが、全体的なスピードが向上します。ジャーナルとデータを分割してドライブに置くことで読み込み時間を減らすこともできます。これをするにはファイルシステムを作成する際に次のようにしてください:
 
{{Ic|<nowiki>data=writeback</nowiki>}} マウントオプションはスピードを向上させますが、電源喪失でデータが破損します。{{Ic|notail}} マウントオプションはファイルシステムが使う容量を 5% ほど増やしますが、全体的なスピードが向上します。ジャーナルとデータを分割してドライブに置くことで読み込み時間を減らすこともできます。これをするにはファイルシステムを作成する際に次のようにしてください:
103行目: 100行目:
 
# mkreiserfs –j /dev/sd'''a1''' /dev/sd'''b1'''
 
# mkreiserfs –j /dev/sd'''a1''' /dev/sd'''b1'''
   
{{ic|/dev/sd''a1''}} をジャーナルとして使うパーティションに、{{ic|/dev/sd''b1''}} をデータ用のパーティションに置き換えてください。reiserfs について詳しくは[http://www.funtoo.org/Funtoo_Filesystem_Guide,_Part_2 この記事]を見て下さい。
+
{{ic|/dev/sd''a1''}} をジャーナルとして使うパーティションに、{{ic|/dev/sd''b1''}} をデータ用のパーティションに置き換えてください。reiserfs について詳しくは [http://www.funtoo.org/Funtoo_Filesystem_Guide,_Part_2 この記事] を見て下さい。
 
====Btrfs====
 
[[Btrfs#デフラグメンテーション|デフラグメンテーション]]や[[Btrfs#圧縮|圧縮]]を見て下さい。
 
   
 
===カーネルパラメータの調整===
 
===カーネルパラメータの調整===
ブロックデバイスのパフォーマンスに影響するキーが複数存在します、詳しくは [[sysctl#仮想メモリ|sysctl#仮想メモリ]] を見て下さい。
+
ブロックデバイスのパフォーマンスに影響するキーが複数存在します、詳しくは [[sysctl#仮想メモリ]] を見て下さい。
   
===SSD 向けのチューニング===
+
=== IO スケジューラの調整 ===
[[SSD#SSD のパフォーマンスを最大化させるヒント|SSD#SSD のパフォーマンスを最大化させるヒント]]
 
   
  +
カーネルはストレージデバイスの入出力 (IO) について複数のスケジューラをサポートしています。[[wikipedia:CFQ|CFQ]] (Completely Fair Queuing) スケジューラと [[wikipedia:NOOP_scheduler|NOOP]] と [[wikipedia:Deadline_scheduler|Deadline]] スケジューラです。また、AUR の {{Aur|Linux-ck}} カーネルでは [[Linux-ck#BFQ I/O スケジューラを有効にする方法|BFQ]] (Budget Fair Scheduler) スケジューラが使えます。
===RAM ディスク / 本当に遅いディスクのためのチューニング===
 
  +
* [http://cs.joensuu.fi/~mmeri/usbraid/ USB stick RAID]
 
  +
また、(カーネルバージョン 3.16 から導入された) 新しいオプションとして [https://www.thomas-krenn.com/en/wiki/Linux_Multi-Queue_Block_IO_Queueing_Mechanism_(blk-mq) Multi-Queue Block IO Queuing Mechanism] (略して blk-mq) が存在します。Blk-mq はマルチコア CPU を活かして I/O クエリを複数のキューに割り当てます。複数のスレッドにタスクを分散させることで伝統的な I/O スケジューラよりも読み書き速度がぐっと高まります。
* [https://bbs.archlinux.org/viewtopic.php?pid=493773#p493773 Combine RAM disk with disk in RAID]
 
  +
  +
blk-mq はカーネルコマンドラインに以下の行を追加することで有効にできます:
  +
scsi_mod.use_blk_mq=1
  +
  +
HDD は回転ディスクでありヘッドが物理的に必要な場所に移動します。そのため以下のような特徴が生まれます:
  +
* ランダムな遅延が発生する確率が高い。(ディスクコントローラの書き込みバッファは無視するとして) 最近の HDD なら 10ms 以下。
  +
* 連続アクセスなら高いスループットを得られる。連続アクセスならヘッドが動く必要がある距離が少なくなるため。
  +
  +
プロセスを大量に実行してストレージの様々な場所の IO リクエストを発生させているとき (つまりランダムアクセスをしている状態)、ディスクは毎秒100回ほどの IO リクエストを処理することができます。近代的なシステムの場合、毎秒100回以上のリクエストが発生することは珍しくないので、ストレージにアクセスできるまで待機するリクエストの待ち行列を作ることになります。スループットを改善する方法の一つとして、待機リクエストの順番を論理アドレスで並び替えて出来るだけ一番近いリクエストを通すことで、アクセスをリニア化する方法があります。これがエレベータースケジューラと呼ばれる Linux の最初の IO スケジューラでした。
  +
  +
エレベーターアルゴリズムの問題点はシーケンシャルアクセスをするプロセスが上手く動かなくなることです。そのようなプロセスは、データブロックを読み取って数マイクロ秒で処理してから次のブロックを読み出します。エレベータースケジューラはプロセスが近くのブロックを呼びだそうとしていることを知らないため、他の場所のリクエストに移ってしまいます。この問題を解決するために anticipatory IO スケジューラが追加されました。同期リクエストの場合、このアルゴリズムでは他のリクエストに移るまで数秒間待機します。
  +
  +
上述のスケジューラはどちらも全体のスループットを改善することを目指していましたが、それによって不幸にも長い間待たされてしまうリクエストも発生していました。例えば、プロセスの多くがストレージ領域の最初の部分をリクエストしていて、不幸なプロセスはストレージの末端付近をリクエストしているような状況を考えて下さい。そのため、開発者は公平なアルゴリズムを作成することを決めて deadline スケジューラが追加されました。deadline スケジューラはアドレスによってキューの順番を決めますが (エレベーターと同じ)、一定期間、リクエストがキューの中で待機した場合、リクエストを (経過時間によって順番が付けられる) "expired" キューに移動します。スケジューラは先に expired キューをチェックして、リクエストを処理してからエレベーターキューに移動します。このアルゴリズムは公平性のために全体のスループットを犠牲にしているわけです。
  +
  +
CFQ (現在のデフォルトスケジューラ) は上記のアイデアを全てまとめて {{ic|cgroup}} のサポートを追加することで特定の {{ic|cgroup}} に一定の IO を予約できるようにしました。これは共有 (クラウド) サーバーで特に役立ちます。必要であれば毎秒 20 IO ごとに料金を払えばリソースを得ることができます。
  +
  +
また、SSD は異なった特性を持っています。SSD には物理的に移動する部品がありません。ランダムアクセスはシーケンシャルアクセスと同じ速度が出ます。SSD は複数のリクエストを一度にこなすこともできます。最近のデバイスのスループットは毎秒 10K IO ですが、これは大抵の環境における仕事量を上回ります。SSD をフルに使用するリクエスト数はとても生成できないので、リクエストキューは基本的に空の状態になります。この場合 IO スケジューラを使っても意味がないわけです。そのため、SSD では noop スケジューラを使うことが推奨されています。
  +
  +
スケジューラは実行中でも変更することができ、ストレージデバイスごとに同時に別々のスケジューラを使うことも可能です。変更するためのコマンドと例は [[ソリッドステートドライブ#I/O スケジューラー|SSD IO スケジューラ]]を見て下さい。
  +
  +
===RAM ディスク===
  +
[[tmpfs]] を見てください。
  +
  +
=== USB ストレージデバイス ===
  +
  +
USB ドライブのファイルコピーが遅い場合、以下の行を [[systemd]] の tmpfile に追加してみてください:
  +
  +
{{hc|/etc/tmpfiles.d/local.conf|
  +
w /sys/kernel/mm/transparent_hugepage/enabled - - - - madvise
  +
w /sys/kernel/mm/transparent_hugepage/defrag - - - - madvise
  +
w /sys/kernel/mm/transparent_hugepage/khugepaged/defrag - - - - 0
  +
}}
  +
  +
[[sysctl#仮想メモリ]]を見て下さい。[http://unix.stackexchange.com/questions/107703/why-is-my-pc-freezing-while-im-copying-a-file-to-a-pendrive] や [http://lwn.net/Articles/572911/] も参照。
   
 
==CPU==
 
==CPU==
 
直接 CPU の速度をあげる唯一の方法がオーバークロックです。煩雑でリスクが伴う作業が必要なので、上級者以外には推奨されません。オーバークロックするのに最適な方法は BIOS を使うことです。パソコンを買うときに、Intel マザーボードがオーバークロックを出来ないようにしていないか確認しておきましょう。
 
直接 CPU の速度をあげる唯一の方法がオーバークロックです。煩雑でリスクが伴う作業が必要なので、上級者以外には推奨されません。オーバークロックするのに最適な方法は BIOS を使うことです。パソコンを買うときに、Intel マザーボードがオーバークロックを出来ないようにしていないか確認しておきましょう。
   
多くの Intel i5・i7 チップは、BIOS や UEFI インターフェースを通して正しくオーバークロックされた場合でも、acpi_cpufreq などのユーティリティに正しいクロック周波数を伝えません。この結果、acpi_cpufreq をアンロードしてブラックリスト化しない限り dmesg は極端なメッセージを表示します。オーバークロックしたチップのクロック速度を Linux で正しく読むことができる唯一のツールが i7z です。{{Pkg|i7z}} パッケージは community リポジトリから利用可能で、{{AUR|i7z-git}} は [[Arch User Repository|AUR]] から利用可能です。
+
多くの Intel i5・i7 チップは、BIOS や UEFI インターフェースを通して正しくオーバークロックされた場合でも、acpi_cpufreq などのユーティリティに正しいクロック周波数を伝えません。この結果、acpi_cpufreq をアンロードしてブラックリスト化しない限り dmesg は極端なメッセージを表示します。オーバークロックしたチップのクロック速度を Linux で正しく読むことができる唯一のツールが i7z です。{{Pkg|i7z}} パッケージは community リポジトリから利用可能で、{{AUR|i7z-git}}{{Broken package link|パッケージが存在しません}} は [[Arch User Repository|AUR]] から利用可能です。
   
 
パフォーマンスを改善する方法には ([http://lkml.org/lkml/2009/9/6/136 ref])、Con Kolivas の、デスクトップ中心のカーネルパッチセットを使って、Completely Fair Scheduler (CFS) を Brain Fuck Scheduler (BFS) に置き換えるという方法もあります。
 
パフォーマンスを改善する方法には ([http://lkml.org/lkml/2009/9/6/136 ref])、Con Kolivas の、デスクトップ中心のカーネルパッチセットを使って、Completely Fair Scheduler (CFS) を Brain Fuck Scheduler (BFS) に置き換えるという方法もあります。
   
BFS パッチを含んだカーネル PKGBUILD は [[Arch User Repository|AUR]] や[[Unofficial user repositories|非公式ユーザーリポジトリ]]からインストールできます。追加パッチについての詳しい情報は、{{AUR|linux-ck}} は [[Linux-ck|Linux-ck]] ページを、{{AUR|linux-bfs}} や {{AUR|linux-pf}} はそれぞれのページを見て下さい。
+
BFS パッチを含んだカーネル PKGBUILD は [[Arch User Repository|AUR]] や[[非公式ユーザーリポジトリ]]からインストールできます。追加パッチについての詳しい情報は、{{AUR|linux-ck}} は [[Linux-ck]] ページを、{{AUR|linux-bfs}}{{Broken package link|{{aur-mirror|linux-bfs}}}} や {{AUR|linux-pf}} はそれぞれのページを見て下さい。
   
{{Note|BFS/CK はデスクトップ・ラップトップでの利用を考えてデザインされています、サーバーとしての利用は考慮されていません。低レイテンシを提供し 16 CPU 以下で動作します。また、Con Kolivas は HZ を 1000 に設定することを提案しています。詳しくは、[http://ck.kolivas.org/patches/bfs/bfs-faq.txt BFS FAQ] や [http://users.on.net/~ckolivas/kernel/ Kernel patch homepage of Con Kolivas] を見て下さい。}}
+
{{Note|BFS/CK はデスクトップ・ラップトップでの利用を考えてデザインされています、サーバーとしての利用は考慮されていません。低レイテンシを提供し 16 CPU 以下で動作します。また、Con Kolivas は HZ を 1000 に設定することを提案しています。詳しくは、[http://ck.kolivas.org/patches/bfs/bfs-faq.txt BFS FAQ] や [http://users.on.net/~ckolivas/kernel/ Con Kolivas のカーネルパッチホームページ] を見て下さい。}}
   
 
===Verynice===
 
===Verynice===
[[Verynice]] は動的に実行可能ファイルの nice レベルを調整するためのデーモンで、[[Arch User Repository|AUR]] では {{AUR|verynice}} として利用可能です。nice レベルとは、CPU 資源を配分するときに実行可能ファイルの優先度を表すものです。X やマルチメディアアプリケーションなどレスポンスが重要なアプリケーションを {{ic|/etc/verynice.conf}} で ''goodexe'' と定義しましょう。同じように、make などの、バックグラウンドで CPU を使う実行可能ファイルを ''badexe'' として定義することができます。こうやって優先順位をつけることで重い処理を行なっている時のシステムのレスポンスを向上させることができます。
+
[[VeryNice]] は動的に実行可能ファイルの nice レベルを調整するためのデーモンで、[[Arch User Repository|AUR]] では {{AUR|verynice}} として利用可能です。nice レベルとは、CPU 資源を配分するときに実行可能ファイルの優先度を表すものです。X やマルチメディアアプリケーションなどレスポンスが重要なアプリケーションを {{ic|/etc/verynice.conf}} で ''goodexe'' と定義しましょう。同じように、make などの、バックグラウンドで CPU を使う実行可能ファイルを ''badexe'' として定義することができます。こうやって優先順位をつけることで重い処理を行なっている時のシステムのレスポンスを向上させることができます。
   
 
=== irqbalance ===
 
=== irqbalance ===
137行目: 164行目:
   
 
==ネットワーク==
 
==ネットワーク==
[[General Recommendations#ネットワーク]] も見て下さい。
+
[[一般的な推奨事項#ネットワーク]]も見て下さい。
   
 
==グラフィック==
 
==グラフィック==
   
 
===Xorg.conf 設定===
 
===Xorg.conf 設定===
グラフィックパフォーマンスは主に {{ic|/etc/X11/xorg.conf}} の設定に依存しています。[[NVIDIA|Nvidia]], [[ATI|ATI]], [[Intel Graphics|Intel]] のカードを使うためのチュートリアルを見ましょう。不適当な設定は Xorg の動作を止めます、警告が参考になるでしょう。
+
グラフィックパフォーマンスは主に {{ic|/etc/X11/xorg.conf}} の設定に依存しています。[[NVIDIA]], [[ATI]], [[Intel Graphics|Intel]] のカードを使うためのチュートリアルを見ましょう。不適当な設定は Xorg の動作を止めます、警告が参考になるでしょう。
   
 
===Driconf===
 
===Driconf===
{{Pkg|driconf}} はオープンソースドライバのダイレクトレンダリング設定を変えるための小さなユーティリティです。[[Official Repositories|公式リポジトリ]]からインストールできます。HyperZ を有効にすることで劇的にパフォーマンスを向上させることができるかもしれません。
+
{{Pkg|driconf}} はオープンソースドライバのダイレクトレンダリング設定を変えるための小さなユーティリティです。[[公式リポジトリ]]からインストールできます。HyperZ を有効にすることで劇的にパフォーマンスを向上させることができるかもしれません。
   
 
===GPU オーバークロック===
 
===GPU オーバークロック===
グラフィックカードをオーバークロックすることは CPU のそれよりも一般的に好都合です、なぜなら、オンザフライで GPU のクロックを調節できる分かりやすいソフトウェアパッケージがあるからです。ATI ユーザーは、{{AUR|rovclock}} か {{AUR|amdoverdrivectrl}} を使って下さい。Nvidia ユーザーは {{AUR|nvclock}} が必要です。Intel チップセットのユーザーは {{AUR|gmabooster}} AUR パッケージで [http://www.gmabooster.com/ GMABooster] をインストールできます。
+
グラフィックカードをオーバークロックすることは CPU のそれよりも一般的に好都合です、なぜなら、オンザフライで GPU のクロックを調節できる分かりやすいソフトウェアパッケージがあるからです。ATI ユーザーは、{{AUR|rovclock}}{{Broken package link|{{aur-mirror|rovclock}}}} か {{AUR|amdoverdrivectrl}} を使って下さい。Nvidia ユーザーは {{AUR|nvclock}} が必要です。Intel チップセットのユーザーは {{AUR|gmabooster}} AUR パッケージで [http://www.gmabooster.com/ GMABooster] をインストールできます。
   
 
変更を永続的にするには、X 起動後に適当なコマンドを実行させてください、例えば、{{ic|~/.xinitrc}} にコマンドを追加するなど。ただし、必要な時だけにオーバークロック設定を適用させるほうがより安全ではあります。
 
変更を永続的にするには、X 起動後に適当なコマンドを実行させてください、例えば、{{ic|~/.xinitrc}} にコマンドを追加するなど。ただし、必要な時だけにオーバークロック設定を適用させるほうがより安全ではあります。
154行目: 181行目:
 
==RAM とスワップ==
 
==RAM とスワップ==
 
=== ファイルを tmpfs に再配置する ===
 
=== ファイルを tmpfs に再配置する ===
ブラウザプロファイルなどのファイルを {{ic|/tmp}} や {{ic|/dev/shm}} などの [[Wikipedia:tmpfs|tmpfs]] ファイルシステムに再配置すれと、ファイルが RAM に保存され、アプリケーションのレスポンスを向上させることができます。
+
ブラウザプロファイルなどのファイルを {{ic|/tmp}} や {{ic|/dev/shm}} などの [[tmpfs]] ファイルシステムに再配置すれと、ファイルが RAM に保存され、アプリケーションのレスポンスを向上させることができます。
   
 
信頼性を上げ使いやすくするために活発な管理スクリプトを使いましょう。
 
信頼性を上げ使いやすくするために活発な管理スクリプトを使いましょう。
   
ブラウザプロファイルの同期についての情報は [[Profile-sync-daemon|Profile-sync-daemon]] を参照してください。
+
ブラウザプロファイルの同期についての情報は [[Profile-sync-daemon]] を参照してください。
   
 
特定のフォルダの同期についての情報は [[Anything-sync-daemon]] を参照してください。
 
特定のフォルダの同期についての情報は [[Anything-sync-daemon]] を参照してください。
164行目: 191行目:
 
=== Swappiness ===
 
=== Swappiness ===
   
[[Swap#Swappiness]] を参照してください。
+
[[スワップ#Swappiness]] を参照してください。
  +
  +
=== Root on RAM オーバーレイ ===
  +
  +
書き込みが遅いメディア (USB や HDD) を使う場合、(ディスク上の) 読み取り専用の root の上で RAM オーバーレイを作って root を動作させることができます。root に書き込みできる領域が制限されるかわりにパフォーマンスが劇的に改善します。{{AUR|liveroot}} を見て下さい。
  +
  +
=== Zram または zswap ===
  +
  +
[https://www.kernel.org/doc/Documentation/blockdev/zram.txt zram] カーネルモジュール (旧名 '''compcache''') は RAM に圧縮ブロックデバイスを作成します。スワップデバイスとして Zram を使うと、RAM 上に保持できる情報が増やせますが、CPU の使用量は増加します。ただし、ハードドライブにスワップするよりかは大いに高速です。システムがスワップをよく使う場合、レスポンスを向上させることができるかもしれません。[[zswap]] を使うことでも同じような利益を享受することができます。
  +
  +
例: lz4 で圧縮する zram デバイスを 32GiB で設定して優先度を通常より高く設定 (現在のセッションのみで有効):
  +
  +
# modprobe zram
  +
# echo lz4 > /sys/block/zram0/comp_algorithm
  +
# echo 32G > /sys/block/zram0/disksize
  +
# mkswap --label zram0 /dev/zram0
  +
# swapon --priority 100 /dev/zram0
  +
  +
無効化するには、再起動するか以下を実行:
  +
  +
# swapoff /dev/zram0
  +
# rmmod zram
  +
  +
起動時に自動的に zram を初期化したい場合、[[systemd]] サービスを記述してください。
   
  +
上記の手順の詳しい説明やオプション、問題点などは [https://www.kernel.org/doc/Documentation/blockdev/zram.txt こちら] のモジュールの公式ドキュメントに載っています。
===Compcache / Zram ===
 
[https://code.google.com/p/compcache/ Compcache] はデバイスを RAM に作成して圧縮する機構です。最近 compcache は '''zram''' カーネルモジュールに置き換えられました。スワップに Zram を使うと、RAM 上に保持できる情報が増やせますが、CPU の使用量は増加します。ただし、ハードドライブにスワップするよりかは大いに高速です。システムがスワップをよく使う場合、レスポンスを向上させることができるかもしれません。Zram はカーネル 3.14 から安定状態になりました ([http://kernelnewbies.org/Linux_3.14#head-72b295b09fea85de2e80f0b7850048264fed887e Kernel Newbies の報告])、そのため古いカーネルバージョンを使っている場合は気をつけて下さい。
 
   
  +
{{Pkg|systemd-swap}} パッケージに含まれている {{ic|systemd-swap.service}} ユニットは自動的に zram デバイスを初期化します。設定は {{ic|/etc/systemd-swap.conf}} で行うことができます。
AUR パッケージ {{AUR|zramswap}} はあなたのシステムに最適な設定で (RAM サイズや CPU コア数にあわせて) スワップデバイスをセットする自動スクリプトを提供します。スクリプトは1つの CPU コアに1つの zram デバイスを作成し、全体のスペースが RAM の量と同じになるようにします。起動時に自動でこれを行わせるには、[[systemd#systemctl の基本的な使い方|systemctl]] を使って {{ic|zramswap.service}} を有効にしてください。
 
   
  +
AUR パッケージ {{AUR|zramswap}} はあなたのシステムに最適な設定で (RAM サイズや CPU コア数にあわせて) スワップデバイスをセットする自動スクリプトを提供します。スクリプトは1つの CPU コアに1つの zram デバイスを作成し、全体のスペースが RAM の量と同じになるようにします。また、標準スワップよりも圧縮スワップに高い優先度を持たせることでデータの圧縮に複数の CPU コアを利用してください。起動時に自動でこれを行わせるには、[[systemd#systemctl の基本的な使い方|systemctl]] を使って {{ic|zramswap.service}} を有効にしてください。
標準スワップよりも圧縮スワップに高い優先度を持たせることでデータの圧縮に複数の CPU コアを利用します。
 
   
 
{{Tip|zram の使用は、スワップが SSD にある場合、読み書き回数を減らすのにも役立ちます。}}
 
{{Tip|zram の使用は、スワップが SSD にある場合、読み書き回数を減らすのにも役立ちます。}}
   
 
===グラフィックカードの RAM を使う===
 
===グラフィックカードの RAM を使う===
搭載している RAM が僅かでビデオ RAM の余りがないような場合でなければ、ビデオ RAM をスワップとして使うことができます。[[Swap on video ram]] を見て下さい。
+
搭載している RAM が僅かでビデオ RAM の余りがないような場合でなければ、ビデオ RAM をスワップとして使うことができます。[[ビデオメモリにスワップ]]を見て下さい。
   
 
=== プリロード ===
 
=== プリロード ===
182行目: 231行目:
   
 
==== Go-preload ====
 
==== Go-preload ====
{{AUR|gopreload-git}} は [http://forums.gentoo.org/viewtopic-t-789818-view-next.html?sid=5457cff93039fc7d4a3e445ef90f9821 Gentoo forum] で作成された小さなデーモンです。使うには、まず、起動時にプリロードしたいプログラムごとに、次のコマンドを端末で実行してください:
+
{{AUR|gopreload-git}} は [http://forums.gentoo.org/viewtopic-t-789818-view-next.html?sid=5457cff93039fc7d4a3e445ef90f9821 Gentoo フォーラム] で作成された小さなデーモンです。使うには、まず、起動時にプリロードしたいプログラムごとに、次のコマンドを端末で実行してください:
 
# gopreload-prepare program
 
# gopreload-prepare program
   
191行目: 240行目:
   
 
====Preload====
 
====Preload====
[[Preload|Preload]] はもっと自動化されたアプローチを取ります。あなたがするべきことは systemd で Preload を有効にすることだけです。
+
[[Preload]] はもっと自動化されたアプローチを取ります。あなたがするべきことは systemd で Preload を有効にすることだけです。
 
# systemctl enable preload
 
# systemctl enable preload
 
システムで一番よく使われるファイルを監視して、起動時にプリロードするファイル一覧に組み込みます。
 
システムで一番よく使われるファイルを監視して、起動時にプリロードするファイル一覧に組み込みます。
   
 
==起動時間==
 
==起動時間==
[[Improve Boot Performance]] にチュートリアルとヒントがあります。
+
[[ブートパフォーマンスの向上]]にチュートリアルとヒントがあります。
   
 
===Suspend to RAM===
 
===Suspend to RAM===
起動時間を短縮する最適解は全く起動しないことです。[[Suspend and Hibernate#Suspend to RAM|Suspend to RAM]] を使えないか考えてみて下さい。
+
起動時間を短縮する最適解は全く起動しないことです。[[サスペンドとハイバネート#Suspend to RAM|Suspend to RAM]] を使えないか考えてみて下さい。
   
 
===カスタムカーネル===
 
===カスタムカーネル===
カスタムカーネルをコンパイルすることで起動時間やメモリ使用量を減らすことができるかもしれません、ただし、逆に増えてしまったり、問題が生じることもありえます。基本的に試す価値はありませんが、面白みを感じたり良い勉強の経験になるかもしれません。どうすればいいのか知りたいのなら、[[Kernels|ここから]]始めて下さい。
+
カスタムカーネルをコンパイルすることで起動時間やメモリ使用量を減らすことができるかもしれません、ただし、逆に増えてしまったり、問題が生じることもありえます。基本的に試す価値はありませんが、面白みを感じたり良い勉強の経験になるかもしれません。どうすればいいのか知りたいのなら、[[カーネル|ここから]]始めて下さい。
   
 
== ネットワーク ==
 
== ネットワーク ==
   
ローカルネットワーク上の DNS キャッシュサーバーを使いましょう。接続が作成される度に、TCP/IP スタックは IP アドレスの完全修飾ドメイン名を解決する必要があります。それから接続が可能になります。DNS キャッシュサーバーを使うことで新しい接続の遅延を減らすことが可能です。サーバーをインストールできない場合、DSL ルーターにそのようなサーバーがあるはずです。詳しくは [[dnsmasq|Dnsmasq]] を見て下さい。
+
ローカルネットワーク上の DNS キャッシュサーバーを使いましょう。接続が作成される度に、TCP/IP スタックは IP アドレスの完全修飾ドメイン名を解決する必要があります。それから接続が可能になります。DNS キャッシュサーバーを使うことで新しい接続の遅延を減らすことが可能です。サーバーをインストールできない場合、DSL ルーターにそのようなサーバーがあるはずです。詳しくは [[dnsmasq]] を見て下さい。
   
 
==アプリケーションごとの最適化==
 
==アプリケーションごとの最適化==
 
===Firefox===
 
===Firefox===
[[Firefox tweaks]] にはパフォーマンスを向上させる方法が載っています; 特に[[Firefox tweaks#Turn off anti-phishing|アンチフィッシングの停止]]、[[Firefox tweaks#Defragment the profile's SQLite databases|SQlite データベースのデフラグ]]は効果的です。次も参照: [[Firefox Ramdisk|Firefox in Ramdisk]]。
+
[[Firefox 設定]]にはパフォーマンスを向上させる方法が載っています; 特に[[Firefox 設定#アンチフィッシングの無効化|アンチフィッシングの停止]]、[[Firefox 設定#プロファイルの SQLite データベースのデフラグ|SQlite データベースのデフラグ]]は効果的です。次も参照: [[Firefox Ramdisk]]。
   
 
公式リポジトリの Firefox は Profile Guided Optimization が有効になっているプロファイルでビルドされています。カスタムビルドでも PGO を有効にするには {{ic|.mozconfig}} に次を加えて下さい:
 
公式リポジトリの Firefox は Profile Guided Optimization が有効になっているプロファイルでビルドされています。カスタムビルドでも PGO を有効にするには {{ic|.mozconfig}} に次を加えて下さい:
219行目: 268行目:
   
 
===LibreOffice===
 
===LibreOffice===
[[LibreOffice#LibreOffice の高速化]] を見て下さい。
+
[[LibreOffice#LibreOffice の高速化]]を見て下さい。
   
 
===Pacman===
 
===Pacman===
[[Improve Pacman Performance]] を見て下さい。
+
[[Pacman のパフォーマンスの向上]]を見て下さい。
   
 
===SSH===
 
===SSH===
228行目: 277行目:
   
 
==ノートパソコン==
 
==ノートパソコン==
[[Laptop]] を見て下さい。
+
[[ノートパソコン]]を見て下さい。

2017年10月12日 (木) 23:34時点における版

関連記事

この記事ではパフォーマンスに関する基本的なシステムの診断法と、リソースの消費を減らしたりシステムを最適化することができる、また、システムのパフォーマンスを向上させると言われている手順の情報を提供しています。

基本

システムを知る

システムをチューンするには、まず全体のスピードを下げているボトルネックのサブシステムを見つける必要があります。普通システムの仕様を知ることで特定することができますが、目に見える兆候もあります:

  • OpenOffice.org や Firefox などの大きなアプリケーションを同時に動作させたときにコンピュータが遅くなる場合、RAM の量が十分でないのかもしれません。利用できる RAM の量を知るには、次のコマンドを使い、-/+buffers で始まる行をチェックしてください:
$ free -m
  • 起動時間が非常に長い場合、または、アプリケーションを初めて起動するときにロードに長い時間がかかるが起動後は順調に動作する場合、おそらくハードドライブが遅過ぎます。ハードドライブの速度を計測するには hdparm コマンドを使います:
$ hdparm -t /dev/sdx

ハードドライブの純粋な読み込み速度なので、正しいベンチマークとは言えませんが、(アイドル状態のときにドライブをテストして)平均的なコンピュータでは 40MB/s より高い数値が出るのが普通だと思われます。hdparm は公式リポジトリに入っています。

  • RAM が利用できる時でも CPU 負担が一貫して高い場合、CPU 使用量を減らすことが優先事項でしょう。top コマンドを使うなど多くの方法で CPU 負担をモニタすることができます:
$ top
  • ダイレクトレンダリングを使うアプリケーション、つまりビデオプレーヤーやゲームなどグラフィックカードを使うアプリケーションにラグが生じる場合、グラフィックパフォーマンスを向上させることで解決するはずです。まず初めにダイレクトレンダリングが有効になっているかどうか確認しましょう。glxinfo コマンドを使います:
$ glxinfo | grep direct

glxinfomesa-demos パッケージに含まれています。

初めにすること

パフォーマンスを向上させるのに、一番簡単で最も効果的な方法は軽量な環境・アプリケーションを動かすことです。

妥協

ほとんど全てのチューニングには代償が伴います。軽量なアプリケーションは一般的に機能が少ないですし、調整がシステムを不安定にすることもあります。また、実行と管理に時間が必要になるでしょう。このページではそうした欠点もできるだけ触れますが、最終的に決定を下すのはユーザーです。

ベンチマーク

最適化の効果を判断できないことがたびたびあります。そういった場合はベンチマークツールで計測することができます。

ストレージデバイス

デバイスレイアウト

パフォーマンスを一番大きく向上させるもののひとつが、オペレーティングシステムが動くレイアウトを複数のデバイスで作ることです。/ /home /var /usr を異なるディスクに置くと、全てを同じハードドライブに置く、シングルディスクレイアウトに比べて劇的に速くなります。

スワップファイル

スワップファイルを分割したディスクに作成するのも、特にマシンがスワップを頻繁に使う場合、多くの利益があります。利用したい環境に十分な量の RAM がない場合によく使われます。多くの機能とアプリケーションを装備した KDE を使うには数 GiB のメモリが必要になりますが、小さなウィンドウマネージャとコンソールアプリケーションなら 512 MiB メモリ以下でも完全に適合します。

RAID

(2つ以上の)複数のディスクを使える場合、ソフトウェア RAID を設定することでスピードを向上させることが可能です。RAID 0 アレイではドライブ障害に対する冗長性はありませんが、アレイにディスクを追加すればそれだけディスクの速度を高速にできます。賢い選択は RAID 5 を使うことです、RAID 5 はスピードとデータ保護の両方を提供します。

ハードウェアの接続端子

内部ハードウェア端子によってストレージデバイスはマザーボードに接続されます。NIC を通る TCP/IP のように、マザーボードに接続する方法は複数あり、PCIe/PCI を使って直接つなぐ、Firewire、Raid カード、USB、などがあります。ストレージデバイスをこれらの複数の接続端子を使うようにすることで、マザーボードを最大限に使うことできます。例えば、6つのハードドライブを接続するのに全部 USB を使うのは、3つずつ USB と Firewire を使いわけるのよりも、ずっとずっと遅くなります。なぜならば、マザーボードに接続する各々の端子はパイプのようになっており、そのパイプを一度に通過できる量はセットで制限されているからです。吉報は、マザーボードには一般的に複数のパイプがあるということです。

その他の例

  1. pci/PCIe/ata を使って直接マザーボードに接続
  2. 外部容器を使ってディスクを USB/Firewire を通して収納する
  3. tcp/ip で接続してデバイスをネットワークストレージデバイスに変える

また、あなたがマシンのフロントに2つの USB 端子、バックに4つの USB 端子、そして4つのディスクを持っている場合、おそらく一番速くなる構成は、フロント2/バック2もしくはフロント1/バック3です。フロントの端子はバックとは異なり、分割されたルートハブのようになっているため、2倍のデータを送ることができるのです。以下のコマンドを使うことでマシンにある様々な接続経路を確認できます。

USB デバイスツリー
$ lsusb -tv
PCI デバイスツリー
$ lspci -tv

パーティション

パーティションレイアウトもシステムのパフォーマンスに影響を与えることがあります。ドライブの最初のセクター(ディスクの周辺部)は最後のセクターよりも高速です。また、パーティションを小さくすれば必要なドライブヘッドの移動が少なくなり、ディスク操作をスピードアップできます。従って、システムのために作るパーティションは小さくして、できるだけドライブの最初に配置することが推奨されます。他のデータ(画像・動画など)は分割パーティションに置くべきです。通常、システム (/) から home ディレクトリ (/home/user) を分割することでこれを達成できます。

ファイルシステムの選択とチューニング

ファイルシステムごとに強みが異なるのでシステムごとにファイルシステムを選ぶことはとても重要です。ファイルシステムの記事に人気のあるファイルシステムの簡単な説明がされています。ここから関連記事も見ることができます。

マウントオプション

マウントオプションを使えばフォーマットする必要なく簡単にスピードを改善できます。マウントコマンドを使うときにマウントオプションを設定できます:

$ mount -o option1,option2 /dev/partition /mnt/partition

永続的に設定するには、/etc/fstab を編集して対象の行を次のようにしてください:

/dev/partition /mnt/partition partitiontype option1,option2 0 0

noatime,nodiratime マウントオプションはほとんど全てのファイルシステムでパフォーマンスを向上させることができるとして知られています。前者は後者の上位版です (nodiratime はディレクトリにだけ適用されます -- noatime はファイルとディレクトリ両方に適用されます)。レアケースで、例えば、あなたが mutt を使っている場合など、小さな問題が起こることがあります。代わりに relatime オプションを使うこともできます (カーネル 2.6.30 以上ではデフォルトです)。

特定のファイルシステムにしかないマウントオプションも存在します。それぞれのファイルシステムのページを見て下さい:

Reiserfs

data=writeback マウントオプションはスピードを向上させますが、電源喪失でデータが破損します。notail マウントオプションはファイルシステムが使う容量を 5% ほど増やしますが、全体的なスピードが向上します。ジャーナルとデータを分割してドライブに置くことで読み込み時間を減らすこともできます。これをするにはファイルシステムを作成する際に次のようにしてください:

# mkreiserfs –j /dev/sda1 /dev/sdb1

/dev/sda1 をジャーナルとして使うパーティションに、/dev/sdb1 をデータ用のパーティションに置き換えてください。reiserfs について詳しくは この記事 を見て下さい。

カーネルパラメータの調整

ブロックデバイスのパフォーマンスに影響するキーが複数存在します、詳しくは sysctl#仮想メモリ を見て下さい。

IO スケジューラの調整

カーネルはストレージデバイスの入出力 (IO) について複数のスケジューラをサポートしています。CFQ (Completely Fair Queuing) スケジューラと NOOPDeadline スケジューラです。また、AUR の Linux-ckAUR カーネルでは BFQ (Budget Fair Scheduler) スケジューラが使えます。

また、(カーネルバージョン 3.16 から導入された) 新しいオプションとして Multi-Queue Block IO Queuing Mechanism (略して blk-mq) が存在します。Blk-mq はマルチコア CPU を活かして I/O クエリを複数のキューに割り当てます。複数のスレッドにタスクを分散させることで伝統的な I/O スケジューラよりも読み書き速度がぐっと高まります。

blk-mq はカーネルコマンドラインに以下の行を追加することで有効にできます:

scsi_mod.use_blk_mq=1

HDD は回転ディスクでありヘッドが物理的に必要な場所に移動します。そのため以下のような特徴が生まれます:

  • ランダムな遅延が発生する確率が高い。(ディスクコントローラの書き込みバッファは無視するとして) 最近の HDD なら 10ms 以下。
  • 連続アクセスなら高いスループットを得られる。連続アクセスならヘッドが動く必要がある距離が少なくなるため。

プロセスを大量に実行してストレージの様々な場所の IO リクエストを発生させているとき (つまりランダムアクセスをしている状態)、ディスクは毎秒100回ほどの IO リクエストを処理することができます。近代的なシステムの場合、毎秒100回以上のリクエストが発生することは珍しくないので、ストレージにアクセスできるまで待機するリクエストの待ち行列を作ることになります。スループットを改善する方法の一つとして、待機リクエストの順番を論理アドレスで並び替えて出来るだけ一番近いリクエストを通すことで、アクセスをリニア化する方法があります。これがエレベータースケジューラと呼ばれる Linux の最初の IO スケジューラでした。

エレベーターアルゴリズムの問題点はシーケンシャルアクセスをするプロセスが上手く動かなくなることです。そのようなプロセスは、データブロックを読み取って数マイクロ秒で処理してから次のブロックを読み出します。エレベータースケジューラはプロセスが近くのブロックを呼びだそうとしていることを知らないため、他の場所のリクエストに移ってしまいます。この問題を解決するために anticipatory IO スケジューラが追加されました。同期リクエストの場合、このアルゴリズムでは他のリクエストに移るまで数秒間待機します。

上述のスケジューラはどちらも全体のスループットを改善することを目指していましたが、それによって不幸にも長い間待たされてしまうリクエストも発生していました。例えば、プロセスの多くがストレージ領域の最初の部分をリクエストしていて、不幸なプロセスはストレージの末端付近をリクエストしているような状況を考えて下さい。そのため、開発者は公平なアルゴリズムを作成することを決めて deadline スケジューラが追加されました。deadline スケジューラはアドレスによってキューの順番を決めますが (エレベーターと同じ)、一定期間、リクエストがキューの中で待機した場合、リクエストを (経過時間によって順番が付けられる) "expired" キューに移動します。スケジューラは先に expired キューをチェックして、リクエストを処理してからエレベーターキューに移動します。このアルゴリズムは公平性のために全体のスループットを犠牲にしているわけです。

CFQ (現在のデフォルトスケジューラ) は上記のアイデアを全てまとめて cgroup のサポートを追加することで特定の cgroup に一定の IO を予約できるようにしました。これは共有 (クラウド) サーバーで特に役立ちます。必要であれば毎秒 20 IO ごとに料金を払えばリソースを得ることができます。

また、SSD は異なった特性を持っています。SSD には物理的に移動する部品がありません。ランダムアクセスはシーケンシャルアクセスと同じ速度が出ます。SSD は複数のリクエストを一度にこなすこともできます。最近のデバイスのスループットは毎秒 10K IO ですが、これは大抵の環境における仕事量を上回ります。SSD をフルに使用するリクエスト数はとても生成できないので、リクエストキューは基本的に空の状態になります。この場合 IO スケジューラを使っても意味がないわけです。そのため、SSD では noop スケジューラを使うことが推奨されています。

スケジューラは実行中でも変更することができ、ストレージデバイスごとに同時に別々のスケジューラを使うことも可能です。変更するためのコマンドと例は SSD IO スケジューラを見て下さい。

RAM ディスク

tmpfs を見てください。

USB ストレージデバイス

USB ドライブのファイルコピーが遅い場合、以下の行を systemd の tmpfile に追加してみてください:

/etc/tmpfiles.d/local.conf
w /sys/kernel/mm/transparent_hugepage/enabled - - - - madvise
w /sys/kernel/mm/transparent_hugepage/defrag - - - - madvise
w /sys/kernel/mm/transparent_hugepage/khugepaged/defrag - - - - 0

sysctl#仮想メモリを見て下さい。[1][2] も参照。

CPU

直接 CPU の速度をあげる唯一の方法がオーバークロックです。煩雑でリスクが伴う作業が必要なので、上級者以外には推奨されません。オーバークロックするのに最適な方法は BIOS を使うことです。パソコンを買うときに、Intel マザーボードがオーバークロックを出来ないようにしていないか確認しておきましょう。

多くの Intel i5・i7 チップは、BIOS や UEFI インターフェースを通して正しくオーバークロックされた場合でも、acpi_cpufreq などのユーティリティに正しいクロック周波数を伝えません。この結果、acpi_cpufreq をアンロードしてブラックリスト化しない限り dmesg は極端なメッセージを表示します。オーバークロックしたチップのクロック速度を Linux で正しく読むことができる唯一のツールが i7z です。i7z パッケージは community リポジトリから利用可能で、i7z-gitAUR[リンク切れ: パッケージが存在しません]AUR から利用可能です。

パフォーマンスを改善する方法には (ref)、Con Kolivas の、デスクトップ中心のカーネルパッチセットを使って、Completely Fair Scheduler (CFS) を Brain Fuck Scheduler (BFS) に置き換えるという方法もあります。

BFS パッチを含んだカーネル PKGBUILD は AUR非公式ユーザーリポジトリからインストールできます。追加パッチについての詳しい情報は、linux-ckAURLinux-ck ページを、linux-bfsAUR[リンク切れ: アーカイブ: aur-mirror]linux-pfAUR はそれぞれのページを見て下さい。

ノート: BFS/CK はデスクトップ・ラップトップでの利用を考えてデザインされています、サーバーとしての利用は考慮されていません。低レイテンシを提供し 16 CPU 以下で動作します。また、Con Kolivas は HZ を 1000 に設定することを提案しています。詳しくは、BFS FAQCon Kolivas のカーネルパッチホームページ を見て下さい。

Verynice

VeryNice は動的に実行可能ファイルの nice レベルを調整するためのデーモンで、AUR では veryniceAUR として利用可能です。nice レベルとは、CPU 資源を配分するときに実行可能ファイルの優先度を表すものです。X やマルチメディアアプリケーションなどレスポンスが重要なアプリケーションを /etc/verynice.confgoodexe と定義しましょう。同じように、make などの、バックグラウンドで CPU を使う実行可能ファイルを badexe として定義することができます。こうやって優先順位をつけることで重い処理を行なっている時のシステムのレスポンスを向上させることができます。

irqbalance

irqbalance はマルチプロセッサシステムでパフォーマンスを向上させるためにプロセッサ間でハードウェア割り込みを分散させます。irqbalance.service操作することが可能です。

ネットワーク

一般的な推奨事項#ネットワークも見て下さい。

グラフィック

Xorg.conf 設定

グラフィックパフォーマンスは主に /etc/X11/xorg.conf の設定に依存しています。NVIDIA, ATI, Intel のカードを使うためのチュートリアルを見ましょう。不適当な設定は Xorg の動作を止めます、警告が参考になるでしょう。

Driconf

driconf はオープンソースドライバのダイレクトレンダリング設定を変えるための小さなユーティリティです。公式リポジトリからインストールできます。HyperZ を有効にすることで劇的にパフォーマンスを向上させることができるかもしれません。

GPU オーバークロック

グラフィックカードをオーバークロックすることは CPU のそれよりも一般的に好都合です、なぜなら、オンザフライで GPU のクロックを調節できる分かりやすいソフトウェアパッケージがあるからです。ATI ユーザーは、rovclockAUR[リンク切れ: アーカイブ: aur-mirror]amdoverdrivectrlAUR を使って下さい。Nvidia ユーザーは nvclockAUR が必要です。Intel チップセットのユーザーは gmaboosterAUR AUR パッケージで GMABooster をインストールできます。

変更を永続的にするには、X 起動後に適当なコマンドを実行させてください、例えば、~/.xinitrc にコマンドを追加するなど。ただし、必要な時だけにオーバークロック設定を適用させるほうがより安全ではあります。

RAM とスワップ

ファイルを tmpfs に再配置する

ブラウザプロファイルなどのファイルを /tmp/dev/shm などの tmpfs ファイルシステムに再配置すれと、ファイルが RAM に保存され、アプリケーションのレスポンスを向上させることができます。

信頼性を上げ使いやすくするために活発な管理スクリプトを使いましょう。

ブラウザプロファイルの同期についての情報は Profile-sync-daemon を参照してください。

特定のフォルダの同期についての情報は Anything-sync-daemon を参照してください。

Swappiness

スワップ#Swappiness を参照してください。

Root on RAM オーバーレイ

書き込みが遅いメディア (USB や HDD) を使う場合、(ディスク上の) 読み取り専用の root の上で RAM オーバーレイを作って root を動作させることができます。root に書き込みできる領域が制限されるかわりにパフォーマンスが劇的に改善します。liverootAUR を見て下さい。

Zram または zswap

zram カーネルモジュール (旧名 compcache) は RAM に圧縮ブロックデバイスを作成します。スワップデバイスとして Zram を使うと、RAM 上に保持できる情報が増やせますが、CPU の使用量は増加します。ただし、ハードドライブにスワップするよりかは大いに高速です。システムがスワップをよく使う場合、レスポンスを向上させることができるかもしれません。zswap を使うことでも同じような利益を享受することができます。

例: lz4 で圧縮する zram デバイスを 32GiB で設定して優先度を通常より高く設定 (現在のセッションのみで有効):

# modprobe zram
# echo lz4 > /sys/block/zram0/comp_algorithm
# echo 32G > /sys/block/zram0/disksize
# mkswap --label zram0 /dev/zram0
# swapon --priority 100 /dev/zram0

無効化するには、再起動するか以下を実行:

# swapoff /dev/zram0
# rmmod zram

起動時に自動的に zram を初期化したい場合、systemd サービスを記述してください。

上記の手順の詳しい説明やオプション、問題点などは こちら のモジュールの公式ドキュメントに載っています。

systemd-swap パッケージに含まれている systemd-swap.service ユニットは自動的に zram デバイスを初期化します。設定は /etc/systemd-swap.conf で行うことができます。

AUR パッケージ zramswapAUR はあなたのシステムに最適な設定で (RAM サイズや CPU コア数にあわせて) スワップデバイスをセットする自動スクリプトを提供します。スクリプトは1つの CPU コアに1つの zram デバイスを作成し、全体のスペースが RAM の量と同じになるようにします。また、標準スワップよりも圧縮スワップに高い優先度を持たせることでデータの圧縮に複数の CPU コアを利用してください。起動時に自動でこれを行わせるには、systemctl を使って zramswap.service を有効にしてください。

ヒント: zram の使用は、スワップが SSD にある場合、読み書き回数を減らすのにも役立ちます。

グラフィックカードの RAM を使う

搭載している RAM が僅かでビデオ RAM の余りがないような場合でなければ、ビデオ RAM をスワップとして使うことができます。ビデオメモリにスワップを見て下さい。

プリロード

プリロードとは、ターゲットファイルを RAM に置くことです。ハードドライブよりも RAM のほうが速く読み込まれるので、プリロードされたアプリケーションはより早く起動するという利益があります。しかしながら、RAM の一部を(アプリケーションを起動していないときでも)そのために取っておくことになります。したがって、プリロードは Firefox や OpenOffice など巨大でよく使うアプリケーションと一緒に使うのがベストです。

Go-preload

gopreload-gitAURGentoo フォーラム で作成された小さなデーモンです。使うには、まず、起動時にプリロードしたいプログラムごとに、次のコマンドを端末で実行してください:

# gopreload-prepare program

それから、指示通りに、プログラムが完全にロードされたら Enter を押します。これでそのプログラムが必要とするファイルの一覧が /usr/share/gopreload/enabled に追加されます。起動時に全てのリストをロードするには、systemd のサービスファイルを有効にしてください。

# systemctl enable gopreload.service

プログラムのロードを無効化するには、/usr/share/gopreload/enabled の適切なリストを削除するか、/usr/share/gopreload/disabled に移動してください。

Preload

Preload はもっと自動化されたアプローチを取ります。あなたがするべきことは systemd で Preload を有効にすることだけです。

# systemctl enable preload

システムで一番よく使われるファイルを監視して、起動時にプリロードするファイル一覧に組み込みます。

起動時間

ブートパフォーマンスの向上にチュートリアルとヒントがあります。

Suspend to RAM

起動時間を短縮する最適解は全く起動しないことです。Suspend to RAM を使えないか考えてみて下さい。

カスタムカーネル

カスタムカーネルをコンパイルすることで起動時間やメモリ使用量を減らすことができるかもしれません、ただし、逆に増えてしまったり、問題が生じることもありえます。基本的に試す価値はありませんが、面白みを感じたり良い勉強の経験になるかもしれません。どうすればいいのか知りたいのなら、ここから始めて下さい。

ネットワーク

ローカルネットワーク上の DNS キャッシュサーバーを使いましょう。接続が作成される度に、TCP/IP スタックは IP アドレスの完全修飾ドメイン名を解決する必要があります。それから接続が可能になります。DNS キャッシュサーバーを使うことで新しい接続の遅延を減らすことが可能です。サーバーをインストールできない場合、DSL ルーターにそのようなサーバーがあるはずです。詳しくは dnsmasq を見て下さい。

アプリケーションごとの最適化

Firefox

Firefox 設定にはパフォーマンスを向上させる方法が載っています; 特にアンチフィッシングの停止SQlite データベースのデフラグは効果的です。次も参照: Firefox Ramdisk

公式リポジトリの Firefox は Profile Guided Optimization が有効になっているプロファイルでビルドされています。カスタムビルドでも PGO を有効にするには .mozconfig に次を加えて下さい:

ac_add_options --enable-profile-guided-optimization

Gcc/Makepkg

Ccache を見て下さい。

LibreOffice

LibreOffice#LibreOffice の高速化を見て下さい。

Pacman

Pacman のパフォーマンスの向上を見て下さい。

SSH

SSH の高速化を見て下さい。

ノートパソコン

ノートパソコンを見て下さい。