ディクショナリフレームワーク (Gauche ユーザリファレンス)

Next: gauche.fcntl - 低レベルファイル操作, Previous: gauche.connection - コネクションフレームワーク, Up: ライブラリモジュール - Gauche拡張モジュール [Contents][Index]

9.10 `gauche.dictionary` - ディクショナリフレームワーク ¶

Module: gauche.dictionary ¶: ディクショナリはキーから値への写像ができるオブジェクトを表わす抽象クラスです。このモジュールではディクショナリに対してよく使うジェネリック関数、および他のディクショナリクラスの上に構築される汎用的なディクショナリクラスを提供します。

Next: 汎用ディクショナリ, Previous: gauche.dictionary - ディクショナリフレームワーク, Up: gauche.dictionary - ディクショナリフレームワーク [Contents][Index]

9.10.1 ディクショナリのためのジェネリック関数 ¶

gauche.dictionaryモジュールは、ディクショナリプロトコルとして以下のジェネリックファンクションを提供します (call-with-iteratorとsize-ofはgauche.collection のものです)。

これらのジェネリックファンクションのうち、*がついているものは各ディクショナリの実装が特定化したメソッドを提供しなければなりません。 +がついているものは、ディクショナリの実装が特定化したメソッドを定義しなければ適切なデフォルト値が返されます。それ以外のジェネリックファンクションは、*がついているメソッドを使って実装されていますが、ディクショナリ実装は効率化のために特定化されたメソッドを定義しているかもしれません。

Predicates: dict-immutable?(+), dict-transparent?(+)
Accessors: dict-get(*), dict-exists?, size-of(*), dict-comparator(*)
Mutators: dict-put!(*), dict-delete!(*), dict-push!, dict-pop!, dict-update!, dict-clear! (変更不可なディクショナリの実装では、これらのメソッドは特定化されず、デフォルトメソッドはエラーを投げます)。
Walkers: call-with-iterator(*), dict-find, dict-any, dict-fold, dict-fold-right, dict-for-each, dict-map, dict-keys, dict-values, dict->alist

これらのジェネリック関数は、ディクショナリ(離散的で有限なキーの集合から値の集合への写像を表現するデータ構造)に対して共通するアルゴリズムを書くのに便利です。 (理論的には連続した、また無限なキーの集合を考えることもできますが、実装上は有限集合に限る方がずっと簡潔になります。)

組み込みクラスでは、<hash-table>と<tree-map>がディクショナリのインタフェースを実装しています。dbmモジュール群の提供する<dbm>クラスもそうです。

Predicates ¶

Generic fucntion: dict-immutable? (dict <dictionary>) ¶

{gauche.dictionary} dictが変更不可なら#tを、変更可能なら#fを返します。変更不可なディクショナリに対して変更を加えるメソッドを呼ぶとエラーが投げられます。

ディクショナリの実装がこのメソッドを特殊化しなければ、デフォルトメソッドは#tを返します。

Generic Function: dict-transparent? (dict <dictionary>) ¶

{gauche.dictionary} このメソッドが真の値を返した場合、プリティプリンタがディクショナリを表示する時にその内容も一緒に表示されます。例えば組み込みのハッシュテーブルはtransparentです。

gosh$ (alist->hash-table (map-with-index cons "abcdefghijkl") eqv-comparator)
#<hash-table eqv[12]( (1 . #\b) (8 . #\i) (9 . #\j) (2 . #\c) (3 . #\d)
  (10 . #\k) (11 . #\l) (4 . #\e) (5 . #\f) (0 . #\a) (6 . #\g) (7 . #\h))>

全てのディクショナリがこうではありません。例えばデータベースに基づいたディクショナリでは、インスタンスを表示する度にクエリを走らせたくはないかもしれません。

ディクショナリの実装がこのメソッドを特殊化しなければ、デフォルトメソッドは#fを返します。

Accessors ¶

Generic function: dict-get (dict <dictionary>) key :optional default ¶: {gauche.dictionary} keyに関連付けられた値を返します。もしkeyを持つエントリがディクショナリに無い場合、defaultが与えられていればそれを返し、そうでなければエラーが通知されます。

Generic function: dict-exists? (dict <dictionary>) key ¶: {gauche.dictionary} ディクショナリがkeyをキーに持つエントリを保持していれば#tを、そうでなければ#fを返します。

Generic function: dict-comparator (dict <dictionary>) ¶

{gauche.dictionary} キーを比較するのに使われるcomparatorを返します。

註: このメソッドは#fを返すことがあります。ディクショナリが、キー同士を直接比較しない場合があるからです (例: <trie>はキーの各要素ごとに比較するので、キーまるごとの比較器というのは使いません。data.trie - Trie参照)。呼び出し側は#fが返る可能性を常に念頭に置いてください。

Mutators ¶

Generic function: dict-put! (dict <dictionary>) key value ¶: {gauche.dictionary} keyからvalueへの関連づけをディクショナリに追加します。

Generic function: (setter dict-get) (dict <dictionary>) key value ¶: {gauche.dictionary} dict-put!と同じ動作です。

Generic function: dict-delete! (dict <dictionary>) key ¶: {gauche.dictionary} ディクショナリからkeyをキーに持つエントリを除去します。 keyを持つエントリが無ければ何もしません。

Generic function: dict-clear! (dict <dictionary>) ¶: {gauche.dictionary} ディクショナリを空にします。通常、全キーをループしてひとつづつ消していくよりもずっと高速です。

Generic function: dict-push! (dict <dictionary>) key value ¶: {gauche.dictionary} (dict-put! dict key (cons value (dict-get dict key '()))) と同じ動作をするメソッドです。具体的な実装によってはもっと効率が良いかもしれません (keyを2度検索しなくても良い、など)。

Generic function: dict-pop! (dict <dictionary>) key :optional fallback ¶: {gauche.dictionary} (dict-get dict key)がペアpであれば、そのエントリの値が(cdr p)で置き換えられ、(car p)の値が戻り値となります。keyに該当するエントリが無かったり、ペアで無かった場合はディクショナリは変更されず、fallbackがあればそれが戻り値となり、無ければエラーが報告されます。

Generic function: dict-update! (dict <dictionary>) key proc :optional fallback ¶

{gauche.dictionary} 次のコードのような動作をしますが、具体的な実装はkeyを一度しかルックアップしないなどより効率良くなっている場合があります。

(rlet1 x (proc (dict-get dict key fallback))
  (dict-put! dict key x))

Walkers ¶

Generic function: dict-fold (dict <dictionary>) proc seed ¶

{gauche.dictionary} dictの各要素に対してprocを呼びシード値を次に渡します。 procは引数を3つとります。エントリーのキー、エントリーの値、それにシード値です。最初のシード値はseedです。procからの返り値は次のprocの呼び出しでシード値として使われます。最後のproc の呼び出しの結果がdict-foldの返り値として返されます。

dictが<ordered-dictionary>であれば、procは以下のような結合で呼ばれます。ここで、キーはK0(最小)からKn(最大)までで、それに対応する値がV0からVnまでであるとします。

(proc Kn Vn (proc Kn-1 Vn-1 ... (proc K0 V0 seed)))

Generic function: dict-fold-right (dict <ordered-dictionary>) proc seed ¶

{gauche.dictionary} dict-foldと同じですが、procを適用する結合の順が以下のように逆になります。

(proc K0 V0 (proc K1 V1 ... (proc Kn Vn seed)))

このジェネリック関数は<ordered-dictionary>上にのみ定義されています。

Generic function: dict-for-each (dict <dictionary>) proc ¶: {gauche.dictionary} ディクショナリdictの各エントリーのキーと値に対してprocを呼びます。順序付きディクショナリに対してはprocがキーの昇順に呼ばれることが保証されています。

Generic function: dict-map (dict <dictionary>) proc ¶: {gauche.dictionary} ディクショナリdictの各エントリーのキーと値に対してprocを呼び、結果をリストにまとめて返します。順序付きディクショナリに対しては結果が最初のキーの順にならびます(が、procがキーの昇順に呼ばれることを保証するものではありません)。

Generic function: dict-keys (dict <dictionary>) ¶
Generic function: dict-values (dict <dictionary>) ¶: {gauche.dictionary} それぞれdict内にあるすべてのキーのリスト、すべての値のリストを返します。順序付きディクショナリについてはリストの要素はキーの昇順にならんでいます。

Generic function: dict->alist (dict <dictionary>) ¶: {gauche.dictionary} ディクショナリ中の各キーと値の対のリストを返します。対の順番は未定義です。

9.10.1.1 Defining dictionary protocol ¶

Macro: define-dict-interface dict-class method proc method2 proc2 … ¶

{gauche.dictionary} ディクショナリ的な性質を持つデータ型はそれぞれ独自の操作手続きを持っていて、しかもその多くはジェネリックなディクショナリAPIに直接対応しています。そうなると、ディクショナリインタフェースを実装するコードはひたすらdefine-methodで以下のような似たようなコードを並べてゆくことになりがちです。

(define-method dict-put! ((dict <my-dict>) key value)
  (my-dict-put! key value))

define-dict-interfaceはこれらのメソッドを一気に定義する簡単な方法です。各method引数は対応するdict-methodメソッドに対応し、 procがそのメソッドの操作を提供するデータ型特有の手続きです。例えば<tree-map>のディクショナリインタフェース定義は以下の通りです。これを見れば要領はわかるでしょう。全てのディクショナリインタフェースをこのマクロで定義する必要はありません。

(define-dict-interface <tree-map>
  :get        tree-map-get
  :put!       tree-map-put!
  :delete!    tree-map-delete!
  :clear!     tree-map-clear!
  :comparator tree-map-comparator
  :exists?    tree-map-exists?
  :fold       tree-map-fold
  :fold-right tree-map-fold-right
  :for-each   tree-map-for-each
  :map        tree-map-map
  :keys       tree-map-keys
  :values     tree-map-values
  :pop!       tree-map-pop!
  :push!      tree-map-push!
  :update!    tree-map-update!
  :->alist    tree-map->alist
  :transparent? (^_ #t))

Previous: ディクショナリのためのジェネリック関数, Up: gauche.dictionary - ディクショナリフレームワーク [Contents][Index]

9.10.2 汎用ディクショナリ ¶

Bimap ¶

Class: <bimap> ¶

{gauche.dictionary} 2つの値のセットを持ち、一方の値をもう一方の値にマップする双方向マップ(bimap)を提供します。

内部的には、bimapは二つのディクショナリ、leftマップとrightマップを持っています。bimapがxとyの関係を保持しているとすれば、 leftマップはxをキーとして対応するyを返し、 rightマップはyをキーとして対応するxを返します。

<bimap>は今のところ、厳密な1対1対応のみを扱います。マップを変更する手続き(bimap-*-put!, bimap-*-delete!等) は両方のマップを変更し、1対1対応が保たれるようにします。 (将来的に、1対nやn対mの対応もサポートするかもしれません)。

bimapは単なるディクショナリとして、 dict-get等のディクショナリインタフェースを使って操作することもできます。その場合はleftマップが見えます。すなわちdict-mapに渡されるキーは leftマップへのキーとなります。

Function: make-bimap left-map right-map :key on-conflict ¶

{gauche.dictionary} 二つのディクショナリ、left-mapとright-mapから新たなbimapを作って返します。用途に応じた適切なディクショナリを選ぶのは呼出側の責任です。例えば文字列と数値の関係を保持したいなら、一つの方法は以下のとおりです。

(make-bimap (make-hash-table 'string=?)  ; string -> number
            (make-hash-table 'eqv?))     ; number -> string

キーワード引数on-conflictは、追加されたエントリが既存のエントリと衝突する場合の振る舞いを指定します。以下の値が有効です。

:supersede: デフォルトの振る舞いです。重複するエントリは、1対1対応を維持するために取り除かれます。例えば文字列と数値のbimapが、("foo", 1)および("bar", 2)という組み合わせを保持していたとします。ここで("bar", 1)を追加しようとすると、最初の2つのエントリは黙って削除され、("bar", 1)だけがbimapに残ります。このオプションを与えた場合、変更手続きは常に#tを返します。
:error: 重複エントリが発生する場合はエラーが投げられます。
#f: 重複エントリが発生し得る場合は、何も変更を行わず、変更手続きは#fを返します。

Function: bimap-left bimap ¶
Function: bimap-right bimap ¶: {gauche.dictionary} bimapのleftマップとrightマップをそれぞれ返します。返されたディクショナリを呼出側で変更してはなりません。

Function: bimap-left-get bimap key :optional default ¶
Function: bimap-right-get bimap key :optional default ¶: {gauche.dictionary} それじれ、bimapのleftマップまたはrightマップからkeyをルックアップして対応する値を返します。keyを持つエントリが無い場合、 defaultが与えられていればその値を返し、そうでなければエラーを投げます。

Function: bimap-left-exists? bimap key ¶
Function: bimap-right-exists? bimap key ¶: {gauche.dictionary} それぞれ、keyがbimapのleftマップまたはrightマップに存在すれば #tを、そうでなければ#fを返します。

Function: bimap-put! bimap x y :key on-conflict ¶

{gauche.dictionary} 関係(x, y)をbimapに格納します。この呼び出しの後では、(bimap-left-get x)がyを、 (bimap-right-get y)がxを返すようになります。

bimapの中に既に関係 (x, _) もしくは関係 (_, y) が含まれていた場合、その衝突の解決はon-conflict引数によって指定できます。可能な値はmake-bimapの項を参照してください。on-conflict引数が与えられなければbimap作成時のon-conflictの値が使われます。

Function: bimap-left-delete! bimap key ¶
Function: bimap-right-delete! bimap key ¶: {gauche.dictionary} それぞれ、leftマップもしくはrightマップでkeyを持つエントリをbimapから削除します。エントリが削除されたら、もう逆方向のマップでも対応するエントリが削除され、一貫性が保たれます。与えられたキーに対応するエントリが無ければ何もしません。

スタックマップ ¶

Class: <stacked-map> ¶

{gauche.dictionary} スタックマップは、複数のマップ(ディクショナリ)を積み重ねてひとつのマップのように見せます。上にあるマップがより下のマップを「シャドウ」します。例えばネストしたスコープを思い浮かべてください。

ディクショナリとしては、次のように振る舞います。

dict-getは与えれたキーを一番上のマップから順に探し、エントリが見つかれば直ちにその値を返します。
dict-put!は常に最上位のマップにエントリを追加します。より下のマップに同じキーを持つエントリがあった場合、それはシャドウされることになります。最上位以外のマップのエントリを変更したい場合は、下のstacked-map-entry-update!を使ってください。
dict-delete!は、全てのマップから指定のキーを持つエントリを削除します。これはディクショナリとしての一貫性のためです。最初に見つかったエントリだけを削除した場合、より下層のマップに同じキーがあれば、消したはずのキーが消えてないということになってしまいます。最初に見つかったエントリだけを消したい場合は stacked-map-entry-delete!を使ってください。
dict-foldは、全てのディクショナリを最上位から順に辿ります。ただし、複数のマップに同じキーがあった場合、最初のエントリ以外は無視します。

Function: make-stacked-map dic dic2 … ¶
Function: make-stacked-map key-comparator dic dic2 … ¶: {gauche.dictionary} 与えられたディクショナリdic dic2 …からなる新たなスタックマップを作って返します。最初に指定されたディクショナリが一番上のディクショナリとなります。 dict-foldで使われるキーの比較にはkey-comparatorが使われます。 key-comparatorが省略された場合には、dicの比較器が使われます。 dict-comparatorをスタックマップに適用するとこのキー比較器が返されます。

Method: stacked-map-stack (smap <stacked-map>) (dic <dictionary>) ¶: {gauche.dictionary} スタックマップsmapの上にdicを追加した新たなスタックマップを作って返します。キー比較器はsmapから引き継がれます。

Method: stacked-map-push! (smap <stacked-map>) (dic <dictionary>) ¶: {gauche.dictionary} スタックマップsmapの保持するディクショナリスタックの一番上にdicを追加します。

Method: stacked-map-pop! (smap <stacked-map>) ¶: {gauche.dictionary} スタックマップsmapの一番上のディクショナリを取り除きます。 smapのディクショナリリストが空の場合はエラーが投げられます。

Method: stacked-map-depth (smap <stacked-map>) ¶: {gauche.dictionary} smapの持つディクショナリの数を返します。

Method: stacked-map-entry-update! (smap <stacked-map>) key proc :optional fallback ¶

{gauche.dictionary} 与えられたキーkeyを持つ最初のディクショナリdに対して (dict-update! d key proc fallback)を呼び出します。

これはsmapにdict-update!を適用するのとは異なります。 keyが一番上のディクショナリにはなく、しかし他のディクショナリにあった場合、 dict-update!はprocを呼び出した後、その結果を一番上のディクショナリに挿入し、他のエントリはそのままにします。

Method: stacked-map-entry-delete! (smap <stacked-map>) key ¶

{gauche.dictionary} keyを持つ最初のエントリを削除します。もし他のディクショナリにkeyを持つエントリがあった場合、以降はそれが見えることになります。

これはsmapにdict-delete!を適用するのとは異なります。 dict-delete!はkeyを持つ全てのエントリを削除します。従ってdict-delete!の後にdict-exists?でキーを問い合わせると必ず#fが返ります。

• ディクショナリのためのジェネリック関数:
• 汎用ディクショナリ:

9.10 gauche.dictionary - ディクショナリフレームワーク ¶