「Btrfs」の版間の差分
(同期) |
(同期) |
||
4行目: | 4行目: | ||
{{Related articles start}} |
{{Related articles start}} |
||
{{Related|ファイルシステム}} |
{{Related|ファイルシステム}} |
||
+ | {{Related|mkinitcpio}} |
||
− | {{Related4|Btrfs - Tips and tricks}} |
||
− | {{Related4|Mkinitcpio-btrfs}} |
||
{{Related|Snapper}} |
{{Related|Snapper}} |
||
+ | {{Related|dm-crypt/システム全体の暗号化#Btrfs サブボリュームとスワップ}} |
||
{{Related articles end}} |
{{Related articles end}} |
||
17行目: | 17行目: | ||
:''Btrfs は Linux 用の全く新しいコピーオンライト (COW) のファイルシステムです。先進的な機能を実装することを目指しつつ、障害耐性を持ち簡単に管理できることに焦点が置かれています。Btrfs は Oracle, Red Hat, Fujitsu, Intel, SUSE, STRATO やその他多くの人々によって共同で開発されており GPL でライセンスされていて誰でも貢献できるように開かれています。'' |
:''Btrfs は Linux 用の全く新しいコピーオンライト (COW) のファイルシステムです。先進的な機能を実装することを目指しつつ、障害耐性を持ち簡単に管理できることに焦点が置かれています。Btrfs は Oracle, Red Hat, Fujitsu, Intel, SUSE, STRATO やその他多くの人々によって共同で開発されており GPL でライセンスされていて誰でも貢献できるように開かれています。'' |
||
+ | {{Warning|Btrfs には実験的な機能が存在します。詳しくは Btrfs Wiki の [https://btrfs.wiki.kernel.org/index.php/Status Status] や [https://btrfs.wiki.kernel.org/index.php/FAQ#Is_btrfs_stable.3F Is Btrfs stable?]、[https://btrfs.wiki.kernel.org/index.php/Getting_started Getting started] などを見てください。[[#既知の問題]]も参照。}} |
||
− | {{Warning| |
||
− | * Btrfs は未だに実験的であると考えられてます。詳しくは Btrfs Wiki の [https://btrfs.wiki.kernel.org/index.php/Main_Page#Stability_status Stability status] や [https://btrfs.wiki.kernel.org/index.php/FAQ#Is_btrfs_stable.3F Is Btrfs stable]、[https://btrfs.wiki.kernel.org/index.php/Getting_started Getting started] などを見て下さい。 |
||
− | * [[#制限|制限]]について注意してください。 |
||
− | }} |
||
== インストール == |
== インストール == |
||
43行目: | 40行目: | ||
# mkfs.btrfs -L ''mylabel'' /dev/''partition'' |
# mkfs.btrfs -L ''mylabel'' /dev/''partition'' |
||
− | {{Note|1=2013年11月の[https://git.kernel.org/cgit/linux/kernel/git/mason/btrfs-progs.git/commit/?id=c652e4efb8e2dd76ef1627d8cd649c6af5905902 この]コミット以降、Btrfs のデフォルトのブロックサイズは 16KB になっています。}} |
+ | {{Note|1=2013年11月の[https://git.kernel.org/cgit/linux/kernel/git/mason/btrfs-progs.git/commit/?id=c652e4efb8e2dd76ef1627d8cd649c6af5905902 この] コミット以降、Btrfs のデフォルトのブロックサイズは 16KB になっています。}} |
大きいブロックサイズをデータ・メタデータに使うには、下の例のように {{ic|-n}} スイッチを使って {{ic|nodesize}} の値を指定して下さい (例: 16KB ブロック): |
大きいブロックサイズをデータ・メタデータに使うには、下の例のように {{ic|-n}} スイッチを使って {{ic|nodesize}} の値を指定して下さい (例: 16KB ブロック): |
||
120行目: | 117行目: | ||
{{Note|1={{ic|btrfs filesystem usage}} コマンドは RAID レベルが {{ic|RAID5/RAID6}} だと上手く機能しません。}} |
{{Note|1={{ic|btrfs filesystem usage}} コマンドは RAID レベルが {{ic|RAID5/RAID6}} だと上手く機能しません。}} |
||
− | == |
+ | == 既知の問題 == |
試行する前に知っておくべき制限事項が存在します。 |
試行する前に知っておくべき制限事項が存在します。 |
||
211行目: | 208行目: | ||
# btrfs balance start -mconvert=RAIDレベル -dconvert=RAIDレベル マウントポイント |
# btrfs balance start -mconvert=RAIDレベル -dconvert=RAIDレベル マウントポイント |
||
− | ディスクが2つある場合、md-raid (mdadm) で定義する raid レベルと一致します。ディスクが3つ以上の場合は、md-raid とは全く異なるものになります。 |
+ | ディスクが2つある場合、md-raid ([[mdadm]]) で定義する raid レベルと一致します。ディスクが3つ以上の場合は、md-raid とは全く異なるものになります。 |
例えば: |
例えば: |
||
217行目: | 214行目: | ||
* data=raid1 の Btrfs ボリュームの3つの 1TB ディスクを使って、満杯になるまでほぼ 1.5TB のデータを保存することができます。ディスクが1つなくなってもデータは消失しません。 |
* data=raid1 の Btrfs ボリュームの3つの 1TB ディスクを使って、満杯になるまでほぼ 1.5TB のデータを保存することができます。ディスクが1つなくなってもデータは消失しません。 |
||
− | Btrfs はディスクに分散してブロックペアを配置するのにラウンドロビン方式を使っています。Linux 3.0 から,ブロックペアを分散する際に大きなディスクを優先するように quasi-round-robin 方式が使われています。これによって複数のディスクからディスクセットが出来ているときに raid0 や raid1 でほとんど (もしくは全て) の領域を効率的に利用することが可能になっています。例えば、1台の 1TB のディスクと2台の 500GB のディスクからなるセットで data=raid1 を使用すると 1TB のディスクには全てのブロックのコピーが、500GB のそれぞれのディスクにはブロックが交互に (ラウンドロビンで) 配置されます。完全な利用効率が実現されます。1TB のディスクと 750GB のディスク、500GB のディスクからなるセットでも同じことが行われますが、ファイルシステムは 750GB のディスクの 250GB が利用できないことを報告します。いつでも全ての領域を活用できるようにするには (最後に上げた例でも)、data=single を使って下さい (data=single は raid コントローラによって定義される JBOD と同じです)。詳しくは [https://btrfs.wiki.kernel.org/index.php/FAQ#How_much_space_do_I_get_with_unequal_devices_in_RAID-1_mode.3F BTRFS FAQ] を参照 |
+ | Btrfs はディスクに分散してブロックペアを配置するのにラウンドロビン方式を使っています。Linux 3.0 から,ブロックペアを分散する際に大きなディスクを優先するように quasi-round-robin 方式が使われています。これによって複数のディスクからディスクセットが出来ているときに raid0 や raid1 でほとんど (もしくは全て) の領域を効率的に利用することが可能になっています。例えば、1台の 1TB のディスクと2台の 500GB のディスクからなるセットで data=raid1 を使用すると 1TB のディスクには全てのブロックのコピーが、500GB のそれぞれのディスクにはブロックが交互に (ラウンドロビンで) 配置されます。完全な利用効率が実現されます。1TB のディスクと 750GB のディスク、500GB のディスクからなるセットでも同じことが行われますが、ファイルシステムは 750GB のディスクの 250GB が利用できないことを報告します。いつでも全ての領域を活用できるようにするには (最後に上げた例でも)、data=single を使って下さい (data=single は raid コントローラによって定義される JBOD と同じです)。詳しくは [https://btrfs.wiki.kernel.org/index.php/FAQ#How_much_space_do_I_get_with_unequal_devices_in_RAID-1_mode.3F BTRFS FAQ] を参照。 |
+ | |||
+ | {{Warning|パリティ RAID (RAID 5/6) のコードにはデータを消失する可能性のある深刻なバグが存在します。詳しくは Btrfs Wiki の [https://btrfs.wiki.kernel.org/index.php/RAID56 RAID5/6] のページや [https://www.mail-archive.com/linux-btrfs@vger.kernel.org/msg55161.html linux-btrfs メーリングリスト] のバグレポートを読んでください。}} |
||
=== サブボリューム === |
=== サブボリューム === |
||
233行目: | 232行目: | ||
# btrfs subvolume list -p . |
# btrfs subvolume list -p . |
||
+ | |||
+ | ==== サブボリュームをマウントする ==== |
||
+ | |||
+ | サブボリュームは {{ic|1=subvol=''/path/to/subvolume''}} や {{ic|1=subvolid=''objectid''}} マウントフラグを使うことでファイルシステムのパーティションと同じようにマウントできます。例えば、{{ic|subvol_root}} という名前のサブボリュームが存在したら {{ic|/}} にマウントすることができます。ファイルシステムのトップレベルにサブボリュームを作成して適切なマウントポイントにマウントすることで、伝統的なファイルシステムのパーティションと同じように使うことができ、[[#スナップショット|スナップショット]]を使用してファイルシステムを前の状態に簡単に戻すことが可能です。 |
||
+ | |||
+ | {{Tip|1=トップレベルのサブボリューム (ID=5) を {{ic|/}} として使用しないことでサブボリュームのレイアウトの変更を簡単にできます。サブボリュームを作成して実際のデータを保存して {{ic|/}} にマウントします。}} |
||
+ | |||
+ | [[Snapper#推奨ファイルシステムレイアウト]], [https://btrfs.wiki.kernel.org/index.php/SysadminGuide#Managing_Snapshots Btrfs SysadminGuide#Managing Snapshots], [https://btrfs.wiki.kernel.org/index.php/SysadminGuide#Layout Btrfs SysadminGuide#Layout] などにサブボリュームを使用するファイルシステムレイアウトの例が存在します。 |
||
+ | |||
+ | ===== マウントオプション ===== |
||
+ | |||
+ | {{ic|1=subvol=}} でサブボリュームをマウントする際、複数のマウントオプションが利用できます。例えば、[[#圧縮|圧縮]]や[[#コピーオンライト (CoW)|コピーオンライト (CoW)]] に関するマウントオプションが使えます。 |
||
+ | |||
+ | 詳しくは [https://btrfs.wiki.kernel.org/index.php/Mount_options Btrfs Wiki Mount options] や [https://btrfs.wiki.kernel.org/index.php/Gotchas Btrfs Wiki Gotchas] を見てください。様々なマウントオプションを使うことで Btrfs の特性は大きく変わります。活発に開発されているファイルシステムであるため、リグレッションも考慮してください。[[#参照|参照]]セクションには複数のベンチマークへのリンクが存在します。 |
||
+ | |||
+ | {{Warning|特定のマウントオプションは安全を保証するための機能を無効化して、ファイルシステムが完全に破損する危険性を引き上げてしまいます。}} |
||
==== デフォルトのサブボリュームを設定する ==== |
==== デフォルトのサブボリュームを設定する ==== |
||
266行目: | 281行目: | ||
スナップショットは再帰的ではありません、つまりサブボリューム内にある全てのサブボリュームはスナップショットでは空のディレクトリになります。 |
スナップショットは再帰的ではありません、つまりサブボリューム内にある全てのサブボリュームはスナップショットでは空のディレクトリになります。 |
||
+ | |||
+ | ==== 送信/受信 ==== |
||
+ | |||
+ | サブボリュームは {{ic|send}} コマンドを使って標準出力やファイルに送信することができます。Btrfs の {{ic|receive}} コマンドにパイプで渡すことで非常に便利に使うことが可能です。例えば、{{ic|/root_backup}} という名前のスナップショットを {{ic|/backup}} に送信するには以下のコマンドを実行します: |
||
+ | |||
+ | # btrfs send /root_backup | btrfs receive /backup |
||
+ | |||
+ | 送信するスナップショットは読み取り専用である必要があります。上記のコマンドは外部デバイスにサブボリュームをコピーするのにも使えます (例えば上の {{ic|/backup}} を USB ディスクにマウント)。 |
||
+ | |||
+ | また、スナップショットの差分だけを送信することも可能です。例えば、上記のように {{ic|root_backup}} のコピーを送信したことがある場合、{{ic|root_backup_new}} という名前の読み取り専用のスナップショットを新しく作成してから、増加差分だけを {{ic|/backup}} に送信するには: |
||
+ | |||
+ | # btrfs send -p /root_backup /root_backup_new | btrfs receive /backup |
||
+ | |||
+ | これで {{ic|root_backup_new}} という名前の新しいサブボリュームが {{ic|/backup}} に作成されます。 |
||
+ | |||
+ | 差分バックアップをしたり自動的にバックアップを行うツールは [https://btrfs.wiki.kernel.org/index.php/Incremental_Backup Btrfs Wiki's Incremental Backup] を見てください。 |
||
=== デフラグメンテーション === |
=== デフラグメンテーション === |
||
315行目: | 346行目: | ||
=== Scrub === |
=== Scrub === |
||
+ | Btrfs の scrub はオンラインのファイルシステムチェックツールです。ファイルシステム上の全てのデータとメタデータを読み込んで、チェックサムと RAID ストレージの重複コピーを使用してデータに破損がないか確認して修復を行います。 |
||
− | [https://btrfs.wiki.kernel.org/index.php/Glossary Btrfs Wiki Glossary] を参照してください。 |
||
# btrfs scrub start / |
# btrfs scrub start / |
||
330行目: | 361行目: | ||
=== Balance === |
=== Balance === |
||
+ | balance はファイルシステム上の全てのデータをアロケータに再度流し込みます。デバイスが追加されたり削除された場合にファイルシステム上のデータを再配置するために実行します。balance はデバイスが故障した場合に、冗長な RAID レベルのコピーを再生成します。 |
||
− | [https://btrfs.wiki.kernel.org/index.php/FAQ#What_does_.22balance.22_do.3F 上流の FAQ ページ]を参照してください。 |
||
{{Pkg|btrfs-progs}}-3.12 から''バランシング''はバックグラウンドプロセスになりました - 詳しくは {{ic|man 8 btrfs-balance}} を見て下さい。 |
{{Pkg|btrfs-progs}}-3.12 から''バランシング''はバックグラウンドプロセスになりました - 詳しくは {{ic|man 8 btrfs-balance}} を見て下さい。 |
||
350行目: | 381行目: | ||
詳しくは[[ソリッドステートドライブ#TRIM]] を参照。 |
詳しくは[[ソリッドステートドライブ#TRIM]] を参照。 |
||
+ | |||
+ | == Tips and tricks == |
||
+ | |||
+ | === ファイルシステム破損のリカバリ === |
||
+ | |||
+ | ''btrfs-check'' はマウントされているファイルシステムでは使えません。ライブ USB から起動しないで ''btrfs-check'' を使えるようにするには、初期 RAM ディスクに以下のように追加してください: |
||
+ | |||
+ | {{hc|/etc/mkinitcpio.conf|output= |
||
+ | BINARIES="/usr/bin/btrfs" |
||
+ | }} |
||
+ | |||
+ | 設定したら [[mkinitcpio]] を使って initramfs を再生成してください。 |
||
+ | |||
+ | 起動に問題が発生したら、ユーティリティを使って修復することができます。 |
||
+ | |||
+ | {{Note|fsck でキャッシュを無効化する必要がある場合、起動後に一定時間フリーズするのは通常の動作です (btrfs-transaction がハングアップしているというメッセージがコンソールに表示されます)。しばらく経てばシステムは復帰します。}} |
||
+ | |||
+ | 詳しくは [https://btrfs.wiki.kernel.org/index.php/Btrfsck Btrfs Wiki] を参照。 |
||
+ | |||
+ | === GRUB でスナップショットを起動 === |
||
+ | |||
+ | {{ic|1=rootflags=subvol=}} 引数を使って[[GRUB#GNU/Linux のメニューエントリ|メニューエントリ]]を手動で作成することができます。{{ic|/etc/fstab}} の {{ic|1=subvol=}} マウントオプションでも起動したいスナップショットを正しく指定する必要があります。 |
||
+ | |||
+ | また、{{AUR|grub-btrfs}} や {{AUR|grub-btrfs-git}} を使うことで GRUB のメニューに Btrfs のスナップショットを自動的に (GRUB 設定ファイルを作成するときに) 作成することも可能です。 |
||
+ | |||
+ | === systemd-nspawn で Btrfs サブボリュームを使う === |
||
+ | |||
+ | [[Systemd-nspawn#Btrfs のサブボリュームをコンテナのルートとして使う]]や [[Systemd-nspawn#コンテナの一時的な Btrfs スナップショットを使う]]を見てください。 |
||
== トラブルシューティング == |
== トラブルシューティング == |
||
396行目: | 455行目: | ||
* 公式サイト |
* 公式サイト |
||
** [https://btrfs.wiki.kernel.org/ Btrfs Wiki] |
** [https://btrfs.wiki.kernel.org/ Btrfs Wiki] |
||
− | ** [https://btrfs.wiki.kernel.org/index.php/Glossary Btrfs Wiki Glossary] |
||
− | * 公式 FAQ |
||
− | ** [https://btrfs.wiki.kernel.org/index.php/FAQ Btrfs Wiki FAQ] |
||
− | ** [https://btrfs.wiki.kernel.org/index.php/Problem_FAQ Btrfs Wiki Problem FAQ] |
||
− | * Btrfs のプルリクエスト |
||
− | ** [http://lkml.indiana.edu/hypermail/linux/kernel/1401.3/03045.html 3.14] |
||
− | ** [http://lkml.indiana.edu/hypermail/linux/kernel/1311.1/03526.html 3.13] |
||
− | ** [http://lkml.indiana.edu/hypermail/linux/kernel/1309.1/02981.html 3.12] |
||
− | ** [http://lkml.indiana.edu/hypermail/linux/kernel/1305.1/01064.html 3.11] |
||
* パフォーマンス関連 |
* パフォーマンス関連 |
||
** [http://superuser.com/questions/432188/should-i-put-my-multi-device-btrfs-filesystem-on-disk-partitions-or-raw-devices Btrfs on raw disks?] |
** [http://superuser.com/questions/432188/should-i-put-my-multi-device-btrfs-filesystem-on-disk-partitions-or-raw-devices Btrfs on raw disks?] |
2016年9月22日 (木) 23:34時点における版
- Btrfs (B-tree File System: 読み方は "バター FS", "ベター FS", "B木 FS", "ビーティーアール FS" など) は Linux 向けの実験的なコピーオンライトのファイルシステムで GPL でライセンスされています。Oracle Corporation によって2007年から開発が開始されました。2014年8月にはディスク上のフォーマットが固まっています。
Btrfs Wiki より:
- Btrfs は Linux 用の全く新しいコピーオンライト (COW) のファイルシステムです。先進的な機能を実装することを目指しつつ、障害耐性を持ち簡単に管理できることに焦点が置かれています。Btrfs は Oracle, Red Hat, Fujitsu, Intel, SUSE, STRATO やその他多くの人々によって共同で開発されており GPL でライセンスされていて誰でも貢献できるように開かれています。
目次
インストール
Btrfs はデフォルトのカーネルに含まれており、ツール (btrfs-progs) は公式リポジトリから入手できます。GRUB, mkinitcpio, Syslinux には Btrfs のサポートがあるので追加の設定は必要ありません。
追加のパッケージ
- btrfs-progs には Btrfs ファイルシステムのエラーを修正できるツール btrfsck が含まれています。
- btrfs-progs-gitAUR はナイトリービルドです。
Btrfs の一般的な管理
新しいファイルシステムを作成する
Btrfs ファイルシステムは新規作成することも既存のファイルシステムから変換することも可能です。
パーティションをフォーマットするには次を実行してください:
# mkfs.btrfs -L mylabel /dev/partition
大きいブロックサイズをデータ・メタデータに使うには、下の例のように -n
スイッチを使って nodesize
の値を指定して下さい (例: 16KB ブロック):
# mkfs.btrfs -L mylabel -l 16k /dev/partition
複数のデバイスを入力して RAID を作成することもできます。サポートされている RAID レベルは RAID 0, RAID 1, RAID 10 などです。デフォルトではメタデータはミラーされデータはストライピングされます。より多くの情報が必要な場合、Using Btrfs with Multiple Devices を見てください。
# mkfs.btrfs [options] /dev/<part1> /dev/<part2>
Ext3/4 から変換する
インストール CD から起動して、次を実行することで変換できます:
# btrfs-convert /dev/partition
パーティションをマウントして、ファイルを確認して変換をテストしてください。/etc/fstab
を適切に変更する必要があります (type を btrfs
に fs_passno [the last field] を 0
にしてください、Btrfs は起動時にファイルシステムのチェックを行いません)。また、パーティションの UUID も変わるので注意してください。UUID を使っている場合は fstab をそれに合わせて更新してください。システムに chroot
して GRUB メニューリストを再生成してください (既存の Linux からインストールや GRUB を参照)。 root ファイルシステムを変換する場合は、chroot している間に mkinitcpio -p linux
を実行して initramfs を再生成しないとシステムが起動しなくなります。'unknown filesystem' で grub が止まってしまう場合は grub-install /dev/partition
で grub を再インストールして grub-mkconfig -o /boot/grub/grub.cfg
で設定を再生成してみてください。
保存したイメージを削除し、イメージがあるサブボリュームを削除して、最後に Balance を行いファイルシステムがスペースを回収するようにしてください。
# btrfs subvolume delete /ext2_saved
マウントオプション
Btrfs Wiki Mount options を参照してください。
ファイルシステムの作成中に行うことが出来る設定に加えて、Btrfs の様々なマウントオプションは性能特性を劇的に変えることができます。
活発に開発されているファイルシステムのため、変化やリグレッションが想定されます。ベンチマークは"参照"セクションのリンクを見て下さい。
btrfs パーティションを /etc/fstab
に追加する場合 btrfs
フックを mkinitcpio に追加する必要があります。
サンプル
- Linux 3.15
- SSD の Btrfs で出来る限りパフォーマンスを引き出したい場合。
noatime,discard,ssd,compress=lzo,space_cache
- HDD の Btrfs で出来る限り容量を削減したい場合。
noatime,autodefrag,compress-force=lzo,space_cache
使用済み・空き容量を表示する
/usr/bin/df
などの linux の一般的なユーザー空間ツールは Btrfs パーティションの空き容量について間違った報告をします。なぜならメタデータによって使用される予約済みのスペースを考慮しないからです。btrfs パーティションに問い合わせるときは /usr/bin/btrfs
を使うのが推奨されています。以下は df -h
を使った時と、btrfs filesystem df
を使った時の出力の例です:
$ df -h /
Filesystem Size Used Avail Use% Mounted on /dev/sda3 119G 3.0G 116G 3% /
$ btrfs filesystem df /
Data: total=3.01GB, used=2.73GB System: total=4.00MB, used=16.00KB Metadata: total=1.01GB, used=181.83MB
df -h
は 3.0GB 使用されているとしているのに対して btrfs filesystem df
はデータは 2.73GB だと報告しているのに気づいて下さい。これは Btrfs がスペースをプールに割り当てているためです。本当のディスク使用量は3つの 'used' を合計した値であり、df -h
による 3.0GB よりかは下回ります。
他にも大まかに使用容量を読み出すコマンドとして btrfs filesystem show
が使用できます:
# btrfs filesystem show /dev/sda3
空き容量の情報を取得する最新のコマンドは btrfs filesystem usage
です:
# btrfs filesystem usage
既知の問題
試行する前に知っておくべき制限事項が存在します。
暗号化
Btrfs にはビルトインの暗号化サポートはありません(将来実装される予定です)が、mkfs.btrfs
をする前にパーティションを暗号化することができます。dm-crypt を見て下さい。
既に btrfs ファイルシステムを作成してしまっている場合、EncFS や TrueCrypt などを使うことができます。ただし btrfs のいくつかの機能が使えなくなるかもしれません。
スワップファイル
Btrfs はスワップファイルをサポートしていません。これはスワップファイルに必要な機能が Btrfs に存在しないためです [1]。スワップファイルをサポートするパッチは既に存在するので [2]、将来のカーネルリリースで恐らくサポートされるようになるでしょう。代わりの方法として、ループデバイスにスワップファイルをマウントすることは可能ですがハイバネートには使えません。自動化するには公式リポジトリから systemd-swap パッケージをインストールしてください。
Linux-rt カーネル
バージョン 3.14.12_rt9 から、Btrfs ファイルシステムで linux-rt カーネルを起動することはできなくなっています。これは rt パッチセットの開発が遅れているのが原因です。
機能
様々な機能が備わっていて、それぞれ設定が可能です。
コミット間隔の設定
ファイルシステムにどのデータを書き込むかは BTRFS とシステム全体の設定によって決められます。BTRFS のデフォルトでは30秒のチェックポイントインターバルでファイルシステムに新しいデータが送られます。この間隔は後述のマウントオプションで調整可能です。
システム全体の設定もインターバルに影響を与えます。それには /proc/sys/vm/* 以下のファイルも含まれており、この wiki では扱っていません。Documentation/sysctl/vm.txt にこれらのファイルに関するカーネルドキュメントがあります。
コピーオンライト (CoW)
デフォルトでは、いついかなる時も、全てのファイルに対して btrfs は CoW を行います: 今までに存在していなかったファイルを書き込もうとした場合、データは空き領域に書き込まれて、ファイルシステムのメタデータブロックが CoW されます。"通常の"ファイルシステムでは、ファイルの一部を上書きした場合、置換先のデータに直接上書きがなされます。CoW ファイルシステムでは、新しいデータはディスクの空き容量に書き込まれて、それから、新しいデータを参照するようにファイルのメタデータが変更されます。元のデータはどこからも参照されなくなって始めて削除されます。
CoW にはアドバンテージがありますが、大きなファイルに小さなランダム書き込みを行うときのパフォーマンスについてはあまり良い影響を与えません。たとえ"コピー"を行わないときでもファイルを断片化させるからです。データベースファイルや仮想マシンイメージについては CoW を無効化することが推奨されます。
CoW を無効にする方法の一つは "nodatacow" オプションを使ってマウントすることです。しかしながら、これではファイルシステム全体で CoW を無効にすることになります。
ファイルやディレクトリ単体で CoW を無効化するには、次のコマンドを使って下さい:
$ chattr +C </dir/file>
以上のコマンドで CoW が無効化されるのはファイルの参照が一つしかない操作の場合に限られます。複数の参照がある場合 (例: cp --reflink=always
を使用したりファイルシステムのスナップショットが存在する場合)、CoW は依然として実行されます。
同じように、ファイルのコピー時に CoW を強制してスペースを節約するには次を使って下さい:
$ cp --reflink source dest
dest ファイルが変更されると、元から変更されたブロックだけがディスクに書き込まれます。cp を 'cp --reflink=auto' にするエイリアスを作ってもいいかもしれません。
マルチデバイスファイルシステムと RAID 機能
Using Btrfs with Multiple Devices の提案も見て下さい。
マルチデバイスファイルシステム
btrfs ファイルシステムを作成する際に、mkfs.btrfs したい分だけのパーティション・デバイスを指定することができます。ファイルシステムは指定された全てのデバイスにわたって作成されます。このように "pool" することによって、複数のパーティションやデバイスを一つの大きな btrfs ファイルシステムにできるのです。
また、既に存在している btrfs ファイルシステムからデバイスを追加・削除することも可能です(用心が必要ですが)。
(btrfs ボリュームとも呼ばれる) マルチデバイス btrfs ファイルシステムは btrfs device scan
を実行するまで認識されません。btrfs mkinitcpio フックがこれを行います。
RAID 機能
マルチデバイスファイルシステムを作成するとき、ファイルシステムに追加したデバイス全体で RAID0, RAID1, RAID10, RAID5, RAID6 を使うように指定することもできます。RAID レベルはデータとメタデータで別個に適用することができます。デフォルトでは、メタデータはシングルボリュームやマルチディスクの RAID1 で複製されます。
btrfs は raid0, raid1, raid10 のブロックペアで動作します:
raid0 - 2つのデバイスに分散されるブロックペア
raid1 - 2つのデバイスに書き込まれるブロックペア
マウント中に btrfs balance
コマンドを使って RAID レベルを変更することができます:
# btrfs balance start -mconvert=RAIDレベル -dconvert=RAIDレベル マウントポイント
ディスクが2つある場合、md-raid (mdadm) で定義する raid レベルと一致します。ディスクが3つ以上の場合は、md-raid とは全く異なるものになります。
例えば:
- md による raid1 の3つの 1TB ディスクを使って、1TB の空き容量で、2つのディスクを失ってもデータが消失しないようにすることが出来ます。
- data=raid1 の Btrfs ボリュームの3つの 1TB ディスクを使って、満杯になるまでほぼ 1.5TB のデータを保存することができます。ディスクが1つなくなってもデータは消失しません。
Btrfs はディスクに分散してブロックペアを配置するのにラウンドロビン方式を使っています。Linux 3.0 から,ブロックペアを分散する際に大きなディスクを優先するように quasi-round-robin 方式が使われています。これによって複数のディスクからディスクセットが出来ているときに raid0 や raid1 でほとんど (もしくは全て) の領域を効率的に利用することが可能になっています。例えば、1台の 1TB のディスクと2台の 500GB のディスクからなるセットで data=raid1 を使用すると 1TB のディスクには全てのブロックのコピーが、500GB のそれぞれのディスクにはブロックが交互に (ラウンドロビンで) 配置されます。完全な利用効率が実現されます。1TB のディスクと 750GB のディスク、500GB のディスクからなるセットでも同じことが行われますが、ファイルシステムは 750GB のディスクの 250GB が利用できないことを報告します。いつでも全ての領域を活用できるようにするには (最後に上げた例でも)、data=single を使って下さい (data=single は raid コントローラによって定義される JBOD と同じです)。詳しくは BTRFS FAQ を参照。
サブボリューム
btrfs の機能のひとつにサブボリュームがあります。サブボリュームは基本的にファイルとディレクトリを保持している名前の付いた b 木です。root ツリーのツリーの中に inode を持ち、root 以外の所有者やグループも設定できます。サブボリュームは任意でブロックを割り当てることもできます。ブロックとファイルエクステントの全ては参照カウントでありスナップショットを可能にしています。仮想マシンの動的な容量拡張に似て、必要な時に必要な分だけのデバイス上の容量を使います。また、サブボリュームを異なったマウントオプションを使ってマウントすることでセキュリティの柔軟性を持たせることもできます。
サブボリュームを作成する
サブボリュームを作成するには:
# btrfs subvolume create /path/to/subvolume
サブボリュームを一覧する
現在のサブボリュームのリストを表示するには:
# btrfs subvolume list -p .
サブボリュームをマウントする
サブボリュームは subvol=/path/to/subvolume
や subvolid=objectid
マウントフラグを使うことでファイルシステムのパーティションと同じようにマウントできます。例えば、subvol_root
という名前のサブボリュームが存在したら /
にマウントすることができます。ファイルシステムのトップレベルにサブボリュームを作成して適切なマウントポイントにマウントすることで、伝統的なファイルシステムのパーティションと同じように使うことができ、スナップショットを使用してファイルシステムを前の状態に簡単に戻すことが可能です。
Snapper#推奨ファイルシステムレイアウト, Btrfs SysadminGuide#Managing Snapshots, Btrfs SysadminGuide#Layout などにサブボリュームを使用するファイルシステムレイアウトの例が存在します。
マウントオプション
subvol=
でサブボリュームをマウントする際、複数のマウントオプションが利用できます。例えば、圧縮やコピーオンライト (CoW) に関するマウントオプションが使えます。
詳しくは Btrfs Wiki Mount options や Btrfs Wiki Gotchas を見てください。様々なマウントオプションを使うことで Btrfs の特性は大きく変わります。活発に開発されているファイルシステムであるため、リグレッションも考慮してください。参照セクションには複数のベンチマークへのリンクが存在します。
デフォルトのサブボリュームを設定する
subvol=
マウントオプションが指定されていない場合、デフォルトのサブボリュームがマウントされます。
# btrfs subvolume set-default subvolume-id /.
サンプル:
# btrfs subvolume list .
ID 258 gen 9512 top level 5 path root_subvolume ID 259 gen 9512 top level 258 path home ID 260 gen 9512 top level 258 path var ID 261 gen 9512 top level 258 path usr
# btrfs subvolume set-default 258 .
リセット:
# btrfs subvolume set-default 0 .
スナップショット
詳しくは Btrfs Wiki SysadminGuide#Snapshots を見て下さい。
スナップショットを作成するには:
# btrfs subvolume snapshot source [dest/]name
スナップショットは再帰的ではありません、つまりサブボリューム内にある全てのサブボリュームはスナップショットでは空のディレクトリになります。
送信/受信
サブボリュームは send
コマンドを使って標準出力やファイルに送信することができます。Btrfs の receive
コマンドにパイプで渡すことで非常に便利に使うことが可能です。例えば、/root_backup
という名前のスナップショットを /backup
に送信するには以下のコマンドを実行します:
# btrfs send /root_backup | btrfs receive /backup
送信するスナップショットは読み取り専用である必要があります。上記のコマンドは外部デバイスにサブボリュームをコピーするのにも使えます (例えば上の /backup
を USB ディスクにマウント)。
また、スナップショットの差分だけを送信することも可能です。例えば、上記のように root_backup
のコピーを送信したことがある場合、root_backup_new
という名前の読み取り専用のスナップショットを新しく作成してから、増加差分だけを /backup
に送信するには:
# btrfs send -p /root_backup /root_backup_new | btrfs receive /backup
これで root_backup_new
という名前の新しいサブボリュームが /backup
に作成されます。
差分バックアップをしたり自動的にバックアップを行うツールは Btrfs Wiki's Incremental Backup を見てください。
デフラグメンテーション
Btrfs はオンラインデフラグをサポートしています。root フォルダのメタデータをデフラグするには、次を実行してください:
# btrfs filesystem defragment /
上のコマンドはファイルシステム全体のデフラグを行いません。詳しくは、btrfs wiki のこのページを見て下さい。
ファイルシステム全体をデフラグするには、次を実行してください:
# btrfs filesystem defragment -r -v /
圧縮
Btrfs は透過圧縮をサポートしています、これはパーティション上の全てのファイルが自動的に圧縮されることを意味します。このことはファイルの容量を減らすだけでなく、特に lzo アルゴリズム を使っている場合は パフォーマンスを向上させる こともできます。
圧縮は compress=gzip
か compress=lzo
マウントオプションを使って有効にします。マウントオプションが追加された後に作成・変更されたファイルだけに圧縮が適用されます。ただし、btrfs filesystem defragment -calg
コマンドを使うことで既存のファイルに圧縮を適用することも簡単にできます (例えば ext3/4 から変換した後)。alg
は zlib
または lzo
のどちらかに置き換えてください。lzo
を使ってファイルシステム全体を再圧縮するには、次のコマンドを実行してください:
# btrfs filesystem defragment -r -v -clzo /
空の Btrfs パーティションに Arch をインストールする際に、ドライブの準備をした後 compress
オプションを設定してください。他のターミナルに切り替えて (Ctrl+Alt+number
)、次のコマンドを実行してください:
# mount -o remount,compress=lzo /mnt/target
インストールが完了した後に、/etc/fstab
の root ファイルシステムのマウントオプションに compress=lzo
を加えて下さい。
チェックポイントインターバル
Linux 3.12 から、チェックポイントインターバルをデフォルトの30秒から変えることができるようになっています。/etc/fstab
の btrfs パーティションに commit
マウントフラグを追加してください。
LABEL=arch64 / btrfs defaults,noatime,ssd,compress=lzo,commit=120 0 0
パーティショニング
Btrfs はデータストレージデバイス全体を占領して MBR や GPT パーティショニングスキームを置き換えることができます。サブボリュームを使ってパーティションを模すことが可能です。ディスクを一つしか使っていない場合、このアプローチにはいくつか制限があります:
- マウントポイントによって異なるファイルシステムを使うことはできません
- Btrfs はスワップファイルをサポートしていないのでスワップ領域を使うことができません。スワップパーティションも作れません。ハイバネーションイメージはスワップ領域に保存されるので、ハイバネーション/レジュームも使えません
- UEFI を使って起動できません
既存のパーティションテーブルを Btrfs で上書きするには、次のコマンドを実行してください:
# mkfs.btrfs /dev/sdX
/dev/sdaX
を指定するとパーティションスキーム全体を置き換える代わりに既存のパーティションがフォーマットされます。
MBR のデータストレージデバイスと同じ方法でブートローダーをインストールしてください。例えば GRUB なら:
# grub-install --recheck /dev/sdX
Scrub
Btrfs の scrub はオンラインのファイルシステムチェックツールです。ファイルシステム上の全てのデータとメタデータを読み込んで、チェックサムと RAID ストレージの重複コピーを使用してデータに破損がないか確認して修復を行います。
# btrfs scrub start / # btrfs scrub status /
systemd サービス
btrfs-progs パッケージには特定のマウントポイントをひと月毎にスクラブする btrfs-scrub@.timer
ユニットが付属しています。エンコードしたパスを指定してタイマーを有効化してください。例えば /
なら btrfs-scrub@-.timer
を、/home
なら btrfs-scrub@home.timer
を使います。
btrfs-scrub@.service
を起動することで手動でスクラブを実行することもできます (同じくエンコードしたパスを指定してください)。btrfs scrub
コマンドを手動で実行するのとは違って systemd サービスを使うことで journal にログが記録されます。
Balance
balance はファイルシステム上の全てのデータをアロケータに再度流し込みます。デバイスが追加されたり削除された場合にファイルシステム上のデータを再配置するために実行します。balance はデバイスが故障した場合に、冗長な RAID レベルのコピーを再生成します。
btrfs-progs-3.12 からバランシングはバックグラウンドプロセスになりました - 詳しくは man 8 btrfs-balance
を見て下さい。
# btrfs balance start / # btrfs balance status /
SSD TRIM
discard
オプションを使ってマウントした場合、Btrfs ファイルシステムは TRIM コマンドをサポートしている SSD ドライブの空きブロックを自動的に開放します。
SATA 3.1 よりも古い場合、TRIM コマンドは同期的で、コマンドが実行されている間は全ての I/O がブロックされます。ファイルシステムの同期などによって、プチフリーズが発生する可能性があります。このような場合、discard
を使用する代わりに定期的な trim を有効にすることができます:
# systemctl enable fstrim.timer
SATA バージョンを確認するには次を実行:
# smartctl --info /dev/sdX
詳しくはソリッドステートドライブ#TRIM を参照。
Tips and tricks
ファイルシステム破損のリカバリ
btrfs-check はマウントされているファイルシステムでは使えません。ライブ USB から起動しないで btrfs-check を使えるようにするには、初期 RAM ディスクに以下のように追加してください:
/etc/mkinitcpio.conf
BINARIES="/usr/bin/btrfs"
設定したら mkinitcpio を使って initramfs を再生成してください。
起動に問題が発生したら、ユーティリティを使って修復することができます。
詳しくは Btrfs Wiki を参照。
GRUB でスナップショットを起動
rootflags=subvol=
引数を使ってメニューエントリを手動で作成することができます。/etc/fstab
の subvol=
マウントオプションでも起動したいスナップショットを正しく指定する必要があります。
また、grub-btrfsAUR や grub-btrfs-gitAUR を使うことで GRUB のメニューに Btrfs のスナップショットを自動的に (GRUB 設定ファイルを作成するときに) 作成することも可能です。
systemd-nspawn で Btrfs サブボリュームを使う
Systemd-nspawn#Btrfs のサブボリュームをコンテナのルートとして使うや Systemd-nspawn#コンテナの一時的な Btrfs スナップショットを使うを見てください。
トラブルシューティング
一般的なトラブルシューティングについては Btrfs Problem FAQ を見て下さい。
GRUB
パーティションオフセット
GRUB は Btrfs パーティションを起動することができますが、そのモジュールは ext4 などよりも大きく、grub-install によって作成される core.img
が MBR と最初のパーティションの間に収まらない可能性があります。GPT を使うか、最初のパーティションの前に数 MB の空きスペースを作ることでこの問題を解決できます。
root が見つからない
RAID セットアップから起動した時にエラー error no such device: root
が表示される場合、/usr/share/grub/grub-mkconfig_lib
を編集して echo " search --no-floppy --fs-uuid --set=root ${hints} ${fs_uuid}"
からクォートを削除してください。grub の設定を再生成すればエラーを出さずに起動できるはずです。
BTRFS: open_ctree failed
2014年11月現在、mkinitcpio.conf
で btrfs
フックを使用してマルチデバイスの Btrfs を使っている場合に以下のエラーが発生するというバグが systemd か mkinitcpio のどちらかに存在します:
BTRFS: open_ctree failed mount: wrong fs type, bad option, bad superblock on /dev/sdb2, missing codepage or helper program, or other error In some cases useful info is found in syslog - try dmesg|tail or so. You are now being dropped into an emergency shell.
/etc/mkinitcpio.conf
の HOOKS
行から btrfs
を削除して代わりに MODULES
行に btrfs
を追加することで解決します。修正を施したら mkinitcpio -p linux
で initramfs を再生成して (必要ならプリセットを調整します) 再起動してください。
詳細は フォーラムスレッド や FS#42884 を見て下さい。
デバイスが存在しない raid アレイをマウントしようとしたときも同じエラーが表示されます。その場合は /etc/fstab
に degraded
マウントオプションを追加してください。ルートパーティションがアレイ上にある場合、カーネルパラメータに rootflags=degraded
を追加してください。
btrfs check
btrfs check コマンドを使うことでアンマウントされた Btrfs ファイルシステムをチェックしたり修復することが可能です。ただし、この修復ツールはまだ開発中であり、特定のファイルシステムエラーは修復することができません。
詳しくは Btrfsck を参照。
参照
- 公式サイト
- パフォーマンス関連
- その他
- Funtoo Wiki Btrfs Fun
- Avi Miller presenting Btrfs at SCALE 10x, January 2012.
- Summary of Chris Mason's talk from LFCS 2012
- Btrfs: stop providing a bmap operation to avoid swapfile corruptions 2009-01-21
- Doing Fast Incremental Backups With Btrfs Send and Receive