「Lrzip」の版間の差分

提供: ArchWiki
ナビゲーションに移動 検索に移動
(英語版と同期 (未訳部分そのまま))
36行目: 36行目:
 
== 詳細 ==
 
== 詳細 ==
   
  +
Lrzip は [[Wikipedia:rzip|rzip]] の拡張版で、ファーストパスの長距離冗長性削減を行います。lrzip の修正により、メモリサイズに応じてスケールするようになりました。データはその後、次のいずれかになります。
Lrzip uses an extended version of [[Wikipedia:rzip|rzip]], which does a first pass long distance redundancy reduction. The lrzip modifications make it scale according to memory size. The data is then either:
 
   
  +
# LZMA (デフォルト) で圧縮される。これは bzip2 の約2倍の速度で優れた圧縮を行う。
# Compressed by LZMA (default), which gives excellent compression at approximately twice the speed of bzip2 compression
 
  +
# この他にも、様々な理由で選ばれた圧縮機によって圧縮されます。
# Compressed by a number of other compressors chosen for different reasons, in order of likelihood of usefulness:
 
  +
## ZPAQ: LZMA よりも 20% も小さい究極の圧縮率を誇るが、圧縮と伸張の両方がとても遅い。
## ZPAQ: Extreme compression up to 20% smaller than LZMA, but ultra slow at compression AND decompression.
 
  +
## LZO: 非常に高速な圧縮・伸長。ほとんどのマシンではディスクへの書き込みよりも速く圧縮されるため、大きなファイルを単にコピーするのと同じ速度 (あるいはそれ以上の速度) で圧縮することができます。
## LZO: Extremely fast compression and decompression, which on most machines compresses faster than disk writing making it as fast (or even faster) than simply copying a large file.
 
  +
## GZIP: LZO とほぼ同じ速度だが、より優れた圧縮を行う。
## GZIP: Almost as fast as LZO, but with better compression.
 
  +
## BZIP2: ある種のデファクト Linux 標準ですが、LZMA と gzip の中間的な存在で、どちらともいえません。
## BZIP2: A defacto linux standard of sorts, but is the middle ground between LZMA and gzip and neither here nor there.
 
  +
# 非圧縮のままにしておいて rzip を用意する。この形式は、結果となるファイルに対して行われる圧縮を、サイズと速度の両方において、大幅に改善します (rzip 準備の性質上、同様の圧縮可能なデータブロックをマージして、より小さなファイルを作成するため。) 改善することで、圧縮をわずかに損なうことなく非常に遅い圧縮を高速化するか、単純な圧縮アルゴリズムの圧縮を大幅に増加させるかのどちらかになります。
# Leaving it uncompressed and rzip prepared. This form improves substantially any compression performed on the resulting file in both size and speed (due to the nature of rzip preparation merging similar compressible blocks of data and creating a smaller file). By "improving" it will either speed up the very slow compressors with minor detriment to compression, or greatly increase the compression of simple compression algorithms.
 
   
  +
主なデメリットは
The major disadvantages are:
 
  +
# メインの ''lrzip'' アプリケーションは単一のファイルに対してのみ動作するので、 完全なアーカイバを偽るには ''lrztar'' ラッパーが必要である。
# The main ''lrzip'' application only works on single files, so it requires the ''lrztar'' wrapper to fake a complete archiver.
 
  +
# 最高のパフォーマンスを得るためには多くのメモリを必要とし (圧縮するデータのサイズと同程度のメモリ。ただし、以下のスライディングmmapを参照)、256MB以下では(圧縮に) 本当に使えません。解凍にはより少ないメモリしか必要とせず、より小さいメモリしか持たないマシンでも動作する。オペレーティングシステムが満足するように、これらの低ラムマシンではスワップを有効にする必要がある場合があります。
# It requires a lot of memory to get the best performance out of (as much memory as the size of the data to compress; but see the sliding mmap below), and is not really usable (for compression) with less than 256MB. Decompression requires less ram and works on smaller ram machines. Sometimes swap may need to be enabled on these lower ram machines for the operating system to be happy.
 
  +
# STDIN/STDOUT は圧縮と伸張の両方でうまく動作するが、 この方法で圧縮された大きなファイルは、結局は効率よく圧縮されない。
# STDIN/STDOUT works fine on both compression and decompression, but larger files compressed in this manner will end up being less efficiently compressed.
 
   
  +
lrzip のユニークな特徴は、システムで利用可能な RAM を常に最大限に活用しようとすることです。これはデフォルトで行われ、メモリを使い果たすことなく可能な限り大きなサイズのウィンドウを選択します。また、ユニークな "スライディング mmap" 機能により、 ファイルが大きい場合は RAM サイズより大きな圧縮ウィンドウを使用することも可能です。これは ({{ic|-U}} オプションで) 通常通り1つの大きな mmap バッファを実装し、ファイルのどの部分が現在検査されているかを追跡するために小さな移動バッファを実装し、はるかに大きな単一の mmap バッファをエミュレートすることによって実現されます。残念ながら、このモードは何倍も遅くなることがあります。
The unique feature of lrzip is that it tries to make the most of the available ram in your system at all times for maximum benefit. It does this by default, choosing the largest sized window possible without running out of memory. It also has a unique "sliding mmap" feature which makes it possible to even use a compression window larger than your ramsize, if the file is that large. It does this (with the {{ic|-U}} option) by implementing one large mmap buffer as per normal, and a smaller moving buffer to track which part of the file is currently being examined, emulating a much larger single mmapped buffer. Unfortunately, this mode can be many times slower.
 
   
 
== 参照 ==
 
== 参照 ==

2022年3月5日 (土) 18:22時点における版

Long Range ZIP (別名 Lzma RZIP) は巨大なファイルに最適化された圧縮プログラムです。冗長性を排除する rzip と通常の圧縮 (LZMA, LZO, gzip, bzip2, ZPAQ) を組み合わせることにより、ファイルが巨大になればなるほど、高い圧縮パフォーマンスを得ることができます。特に 100MB 以上のファイルで高い効果があります。サイズを小さくするか圧縮速度を速くするかどちらかを選ぶことが可能です。

インストール

公式リポジトリlrzipインストールしてください。

使用方法

圧縮

ディレクトリを (再帰的に) 圧縮するには lrztar が必要です。最初にディレクトリが tar でまとめられてから圧縮されます。targzipxz を使って圧縮するのと同じです (tar zcf ... または tar Jcz ...)。なお、rzip と同様に、事前の圧縮処理の後に圧縮アルゴリズムが適用され、例えば一般的な LZMA 圧縮アーカイブとは異なります。

foo という名前のディレクトリから LZMA で圧縮されたアーカイブ foo.tar.lrz を作成するには:

$ lrztar foo

bar という名前のディレクトリから LZMA 圧縮アーカイブ bar.lrz を作成するには:

$ lrzip bar

圧縮率を高めたい場合、-z スイッチを追加することで ZPAQ が有効になりますが LZMA よりも長い時間がかかります:

$ lrztar -z foo

圧縮・展開の時間を高速にしたい場合、-l スイッチで LZO を使うことができます:

$ lrzip -l bar

展開

圧縮されたディレクトリを展開するには:

$ lrzuntar foo.tar.lrz

bar.lrzbar に展開するには:

$ lrunzip bar.lrz

詳細

Lrzip は rzip の拡張版で、ファーストパスの長距離冗長性削減を行います。lrzip の修正により、メモリサイズに応じてスケールするようになりました。データはその後、次のいずれかになります。

  1. LZMA (デフォルト) で圧縮される。これは bzip2 の約2倍の速度で優れた圧縮を行う。
  2. この他にも、様々な理由で選ばれた圧縮機によって圧縮されます。
    1. ZPAQ: LZMA よりも 20% も小さい究極の圧縮率を誇るが、圧縮と伸張の両方がとても遅い。
    2. LZO: 非常に高速な圧縮・伸長。ほとんどのマシンではディスクへの書き込みよりも速く圧縮されるため、大きなファイルを単にコピーするのと同じ速度 (あるいはそれ以上の速度) で圧縮することができます。
    3. GZIP: LZO とほぼ同じ速度だが、より優れた圧縮を行う。
    4. BZIP2: ある種のデファクト Linux 標準ですが、LZMA と gzip の中間的な存在で、どちらともいえません。
  3. 非圧縮のままにしておいて rzip を用意する。この形式は、結果となるファイルに対して行われる圧縮を、サイズと速度の両方において、大幅に改善します (rzip 準備の性質上、同様の圧縮可能なデータブロックをマージして、より小さなファイルを作成するため。) 改善することで、圧縮をわずかに損なうことなく非常に遅い圧縮を高速化するか、単純な圧縮アルゴリズムの圧縮を大幅に増加させるかのどちらかになります。

主なデメリットは

  1. メインの lrzip アプリケーションは単一のファイルに対してのみ動作するので、 完全なアーカイバを偽るには lrztar ラッパーが必要である。
  2. 最高のパフォーマンスを得るためには多くのメモリを必要とし (圧縮するデータのサイズと同程度のメモリ。ただし、以下のスライディングmmapを参照)、256MB以下では(圧縮に) 本当に使えません。解凍にはより少ないメモリしか必要とせず、より小さいメモリしか持たないマシンでも動作する。オペレーティングシステムが満足するように、これらの低ラムマシンではスワップを有効にする必要がある場合があります。
  3. STDIN/STDOUT は圧縮と伸張の両方でうまく動作するが、 この方法で圧縮された大きなファイルは、結局は効率よく圧縮されない。

lrzip のユニークな特徴は、システムで利用可能な RAM を常に最大限に活用しようとすることです。これはデフォルトで行われ、メモリを使い果たすことなく可能な限り大きなサイズのウィンドウを選択します。また、ユニークな "スライディング mmap" 機能により、 ファイルが大きい場合は RAM サイズより大きな圧縮ウィンドウを使用することも可能です。これは (-U オプションで) 通常通り1つの大きな mmap バッファを実装し、ファイルのどの部分が現在検査されているかを追跡するために小さな移動バッファを実装し、はるかに大きな単一の mmap バッファをエミュレートすることによって実現されます。残念ながら、このモードは何倍も遅くなることがあります。

参照