zlib圧縮ライブラリ (Gauche ユーザリファレンス)

Next: slib - SLIBインタフェース, Previous: rfc.uuid - UUID, Up: ライブラリモジュール - ユーティリティ [Contents][Index]

12.57 `rfc.zlib` - zlib圧縮ライブラリ ¶

Module: rfc.zlib ¶

このモジュールは、Zlib圧縮ライブラリに対するバインディングを提供します。 Zlibのほとんどの機能がこのモジュールを通して利用可能です。

Zlibは、ZLIB圧縮データフォーマット(RFC1950)、DEFLATE圧縮データフォーマット(RFC1951)、GZIPファイルフォーマット(RFC1952)の読み書きをサポートするライブラリです。また、CRC32とAdler32チェックサムの計算のための関数も提供します。

圧縮・展開機能はポートを通して提供されます。圧縮をチューンするパラメータの詳細については、Zlibのドキュメントも合わせて参照してください。

Condition types ¶

Zlib処理中のエラーを示すために、以下のコンディションタイプが定義されています。

Condition Type: <zlib-error> ¶: {rfc.zlib} <error>のサブクラスで、以下のコンディションタイプのスーパークラスです。このクラスはzlib特有のエラーをまとめて捕捉するための抽象クラスとして設けられています。 rfc.zlibが投げるZlib固有のエラーは常に以下の特定のクラスのインスタンス、もしくはそのインスタンスを含む複合コンディションです。

Condition Type: <zlib-need-dict-error> ¶

Condition Type: <zlib-stream-error> ¶

Condition Type: <zlib-data-error> ¶

Condition Type: <zlib-memory-error> ¶

Condition Type: <zlib-version-error> ¶

{rfc.zlib} <zlib-error>のサブクラスです。それぞれ、Zlibの Z_NEED_DICT_ERROR、 Z_STREAM_ERROR、 Z_DATA_ERROR、 Z_MEMORY_ERROR、 Z_VERSION_ERROR に対応します。

データの読み出し時にエラーが発生した場合、 <zlib-error>のサブクラスと <io-read-error>の合成コンディションが投げられます。入力が伴わない場合、例えば圧縮ストリームの初期化エラーのときには、合成されていない<zlib-error>のサブクラスが投げられます。ただの引数の型のエラーのように、Zlibの関数が呼び出されない場合は、ただの<error>が投げられるかもしれません。

Compression/decompression ports ¶

Class: <deflating-port> ¶

Class: <inflating-port> ¶

{rfc.zlib} 圧縮と展開の機能はポートを通じて提供されます。 deflating portは出力されたデータを圧縮する出力ポートです。 inflating portは圧縮されたデータソースからデータを展開しつつ読み込む入力ポートです。

inflating portが読み出す圧縮データが壊れていた場合、読み出し時に <io-read-error>と<zlib-data-error>の合成コンディションが投げられます。

Function: open-deflating-port drain :key compression-level buffer-size window-bits memory-level strategy dictionary owner? ¶

{rfc.zlib} 新たな<deflating-port>のインスタンス、すなわち書き込まれたデータを圧縮し出力ポートdrainに書き出す出力ポートを作成して、そのポートを返します。Zlibの関数deflateInit2()と deflateSetDictionary()とを合わせた手続きです。

compression-levelには1から9の整数を指定することができ、大きい数が高い圧縮率を意味します。引数が省略された場合は、デフォルトの圧縮レベルと見なされます。これは通常6です。

compression-levelをわかりやすく指定するために以下の定数が定義されています。

Constant: Z_NO_COMPRESSION ¶
Constant: Z_BEST_SPEED ¶
Constant: Z_BEST_COMPRESSION ¶
Constant: Z_DEFAULT_COMPRESSION ¶: {rfc.zlib}

buffer-sizeは、ポートのバッファサイズを指定します。デフォルトは4096バイトです。

window-bitsはウィンドウサイズを指定します。通常この値は8から15までの整数で、圧縮に使われるウィンドウサイズの 2を底とするlogをとった値です。大きい数であるだけ圧縮率が高くなりますが、そのぶんメモリの使用量が増加します。デフォルトは15です。

window-bitsよって、2つばかり特別なモードを指定することができます。 window-bitsに-8から-15の整数を指定された場合は、 ZLIBヘッダとトレイラのない生のdeflateデータを作成します。この場合Adler32チェックサムも計算されません。実際のウィンドウサイズはwindow-bitsの絶対値によって計算されます。

window-bitsが24から31の間である場合、ポートはgzipエンコーディングを使うようになります。すなわち、 zlibラッパの代わりに、シンプルなgzipヘッダとトレイラが圧縮データの前後に書き出されます。 gzipヘッダはファイル名やその他のデータ、コメントを持たず、変更時刻は0、ヘッダCRCはなし、OS名は不明を意味する255になります。gzipストリームが書き出されるときは、zstream-adler32で取得できるチェックサムはAdler32 ではなくCRC32になります。実際のウィンドウサイズは window-bits-16 で決定されます。

memory-levelは、圧縮の内部状態のためにどれだけのメモリを割り当てるかを指定するパラメータです。1ではメモリの使用量は最小ですが、遅くなり圧縮率が低下します。9では高速な処理のためにメモリが最も多く使われます。デフォルトは8です。

strategyで圧縮アルゴリズムをチューンできます。以下の定数がstrategyに有効な値として定義されています。

Constant: Z_DEFAULT_STRATEGY ¶: {rfc.zlib} 通常のデータに適する、デフォルトのアルゴリズムを使います。

Constant: Z_FILTERED ¶: {rfc.zlib} フィルタにより生成されたデータに適したアルゴリズムを使います。このようなデータは小さな値とランダムな分散を持つことが多いため、このアルゴリズムではハフマンエンコーディングをより優先し、文字列一致の使用をやや抑えます。

Constant: Z_HUFFMAN_ONLY ¶: {rfc.zlib} ハフマンエンコーディングのみを使います (文字列一致を使いません)。

Constant: Z_RLE ¶: {rfc.zlib} マッチ距離を1に制限します (ランレングスエンコーディングを強制することになります)。 Z_HUFFMAN_ONLYと同じくらい高速で、かつpngイメージデータに対して良い圧縮率が得られます。

Constant: Z_FIXED ¶: {rfc.zlib} 動的ハフマンエンコーディングを禁止します。特殊なアプリケーションで、単純なデコーダを使いたい場合に便利です。

strategyの選択は圧縮率と速度にのみ影響を与えます。どの値を選んでも圧縮されたデータは正しく展開できます。

dictionaryには圧縮に使う辞書を文字列で与えます。辞書を与える場合、圧縮と展開で全く同じものを使う必要があります。辞書の詳細についてはzlibのドキュメントを参照してください。

デフォルトでは、deflating portはそれ自身がクローズされても drainをクローズしません。drainの後始末を気にしたくない場合はowner?引数に真の値を与えてください。その場合、deflating portがクローズされすべてのデータが書き出されたのちに drainは自動的にクローズされます。

注意: deflating portは必ず明示的にクローズしてください。そうしなければ圧縮データの終わりの部分(バッファされているデータおよびトレイラ)が drainに書き出されないかもしれません。ポートを明示的にクローズせずにガベージ・コレクタに任せた場合、出力ポートのクローズ手続きはファイナラザから呼び出されることになります。複数のごみに対してファイナライザの呼ばれる順番は不定なので、 deflating portより先にdrainのファイナライザが呼ばれてそのポートがクローズされてしまうことがあります。こうなると、圧縮データの終わりの部分の出力がエラーになってしまいます。

Function: open-inflating-port source :key buffer-size window-bits dictionary owner? ¶

{rfc.zlib} 圧縮データを読み出せる入力ポートsourceを取り、新たな<inflating-port>のインスタンス、すなわち展開されたデータを読み出すことのできる入力ポートを作成し、そのポートを返します。これはZlibの関数inflateInit2()、inflateSetDictionary() を合わせた手続きです。

buffer-size、owner?の意味は open-deflating-portと同じです。

window-bitsの意味もほぼ同じですが、 32が足された値が与えられた場合にはzlibとgzipのヘッダ自動判定が有効になります。

すなわち、zlibを読む場合は8から15、gzipを読む場合は24から31、自動判定を使う場合は 40から47の値を指定することになります。

このwindow bitsは、入力が圧縮された時に使われたwindow bits以上でなければならず、小さいと<zlib-data-error>コンディションが投げられます。入力の圧縮時のパラメータを知らない場合(通常そうだと思います)、最大の値を指定するのが良いでしょう。つまり、 zlibなら15、gzipなら31、自動判定を使うなら47です。

dictionaryは圧縮時の辞書と同じものを指定しなければなりません。辞書を使って圧縮されたデータを展開する際に、dictionary引数を指定しなかったり、異なる辞書を与えた場合は <io-read-error>と<zlib-need-dict-error>の合成コンディションが投げられます。

Operations on inflating/deflating ports ¶

Function: zstream-total-in xflating-port ¶

Function: zstream-total-out xflating-port ¶

Function: zstream-adler32 xflating-port ¶

Function: zstream-data-type xflating-port ¶

{rfc.zlib} xflating-portはinflating portかdeflating portでなければなりません。さもなくばエラーが通知されます。

z_stream構造体のtotal_in、total_out、 adlre32およびdata_typeフィールドの値を返します。

data_typeフィールドの値は以下の定数のうちのいずれかです。

Constant: Z_BINARY ¶
Constant: Z_TEXT ¶
Constant: Z_ASCII ¶
Constant: Z_UNKNOWN ¶: {rfc.zlib}

Function: zstream-params-set! deflating-port :key compression-level strategy ¶: {rfc.zlib} 圧縮率とストラテジを動的に変更するための手続きです。

Function: zstream-dictionary-adler32 deflating-port ¶: {rfc.zlib} deflating portの作成時に辞書を指定すると、辞書のAdler32チェックサムが計算されます。この手続きはそのチェックサムを返します。 open-deflating-portに辞書を与えなかったなら、#fが返ります。

Function: deflating-port-full-flush deflating-port ¶: {rfc.zlib} ポートのデータをフルフラッシュし、圧縮状態をリセットします。展開ルーチンはinflate-sync手続きを使って入力をこの地点までスキップすることができます。

Function: inflate-sync inflating-port ¶: {rfc.zlib} 圧縮データを、deflating-port-full-flushによってフルフラッシュしたポイントまで読み飛ばします。 <zlib-data-error>が投げられたときに使用するとよいでしょう。フルフラッシュポイントに達したときは読み飛ばしたバイトの数を、EOFまで達したときは#fを返します。

Miscellaneous API ¶

Function: zlib-version ¶: {rfc.zlib} Zlibのバージョンを文字列で返します。

Function: deflate-string string options … ¶: {rfc.zlib} 与えられた文字列を圧縮し、zlib圧縮されたデータを文字列で返します。すべてのオプション引数はそのままopen-deflating-portに渡されます。

Function: inflate-string string options … ¶: {rfc.zlib} Zlib圧縮されたデータを文字列で受け取り、展開されたデータを文字列で返します。すべてのオプション引数はそのままopen-deflating-portに渡されます。

Function: gzip-encode-string string options … ¶
Function: gzip-decode-string string options … ¶: {rfc.zlib} deflate-stringおよびinflate-stringと似ていますが、 GZIPフォーマットを使います。これは deflate-stringおよびinflate-stringの window-bitsに15以上の値指定するのと同じです。

Function: crc32 string :optional checksum ¶: {rfc.zlib} 文字列stringのCRC32チェックサムを計算して返します。checksum 引数が与えられた場合は、それをstringによるチェックサムで更新した値が返されます。

Function: adler32 string :optional checksum ¶

{rfc.zlib} 文字列stringのAdler32チェックサムを計算して返します。checksum 引数が与えられた場合は、それをstringによるチェックサムで更新した値が返されます。

Adler32はCRC32と比較して高速に計算することが可能なアルゴリズムですが、小さなデータのチェックサムの信頼性にいくらか問題があることがわかっています。詳しくはRFC3309を見てください。これが問題になる場合はCRC32を使用してください。

12.57 rfc.zlib - zlib圧縮ライブラリ ¶

Condition types ¶

Compression/decompression ports ¶

Operations on inflating/deflating ports ¶

Miscellaneous API ¶

12.57 `rfc.zlib` - zlib圧縮ライブラリ ¶