手続き脳によるHaskell -- AVL木ソート(AVL tree sort)

　AVL木(AVL Tree)は赤黒木より厳密に平衡性を維持しようとしますので、一般には赤黒木より遅いと言われています。しかし、Haskell でツリーソートを実装する限りにおいては、AVL木を使ったツリーソートの方が高速です。

　ここでは、Haskell でAVL木を使ったツリーソートを実装してみましょう。もちろん、AVL木を使ったツリーソートも安定ソートです。Haskell による AVL木を使ったツリーソートの実装は以下のようになります。 C++ による実装をお望みの方はこちらのページへどうぞ。

　AVL木は、左右の部分木の高さの差が１以内に保たれた平衡木です。もしバランスが崩れて左右の高さの差が２になったら木を回転という操作で変形して再び高さの差が１以内になるように修正します。具体的には以下のようになります。

　回転後も２分探索木の各ノードの大小関係がうまく保たれていることが分かると思います。これを実現するために上記のコードの insertBy 関数に回転操作を実装してあります。以下では insert(挿入操作) の動作を説明します。

【挿入操作】

　AVL木に新たにノード挿入するには、まず２分探索木の要領で挿入します。キーを検索し、既にキーが存在すればそのノードを上書きします。存在しない場合、木の最下層まで行き着くので、そこに新しいノードを挿入しますが、 AVL木の場合は、挿入後、木のバランスが崩れていれば回転を使って木を修正する必要があります。

　木の各ノードには左右の部分木の状態を示す値が割り当てられており、左部分木が高い状態を L、右部分木が高い状態を R、左右の部分木の高さが等しい状態を E と表します。この情報をもとにパターンマッチを行い、木の形と {L,E,R} の状態の修正を行います。

　新しいノードを挿入したらまず、変更の必要性を示すフラグである Change フラグを True にして、木の根(root)の方向にさかのぼります。そして、パターンマッチでパターン毎の修正を行います。修正後、注目している部分木の高さが１つ高くなると、さらに上位の木で修正が必要になるので Change フラグを True にしてさかのぼります。高さが変わらない場合は修正の必要はないので、 Change フラグを False にしてさかのぼります。一度 Change フラグを False にしたらそれ以上は修正を行いません。そのまま木の根(root)までさかのぼり終了します。

　それでは、具体的にパターンマッチの詳細を説明しましょう。現在注目しているノードに u という名前を付けます。まずは「左部分木から Change フラグが True でさかのぼって来た場合」の処理です。u の状態によって処理を分けます。

　左右の部分木の高さが等しかったところに、左からさかのぼって来るのですから、左部分木の高さが１つ高くなります。また、u を根とする部分木の高さも１つ高くなります。 u を根とする部分木の高さが１つ高くなるということは、上位の木でさらに修正が必要になるということです。 u の状態を L に、Change フラグを True にしてさかのぼります。

　右部分木が高かったところに、左からさかのぼって来るのですから、左右の部分木の高さが等しくなります。また、u を根とする部分木の高さは変わりませんので、さらに上位の木では修正は必要ないということです。 u の状態を E に、Change フラグを False にしてさかのぼります。

　左部分木が高かったところに、左からさかのぼって来た場合の処理です。パターンマッチのために、 u の左の子のことを v、v の右の子のことを w と呼ぶことにします。まず大まかに u,v の状態の組で分類します。u は L ですので、 (u=L,v=L),(u=L,v=R),(u=L,v=E) の３通りが考えられます。しかし、図を書いて考えると分かりますが、挿入の場合、 (u=L,v=E) のパターンはあり得ませんので除外されます。 v が R の場合、u,v だけでは情報が足りませんので w を追加する必要があります。従って v が R の場合、 (u=L,v=R,w=L),(u=L,v=R,w=R),(u=L,v=R,w=E) の３通りを考える必要があります。つまり全体では、 (u=L,v=L),(u=L,v=R,w=L),(u=L,v=R,w=R),(u=L,v=R,w=E) の４つのケースが考えられます。

[CASE 1: (u=L,v=L)]

　次の図のような関係が成り立つ場合に木を回転して、左図を右図のように変形します。

AVL木の修正：パターンLLi

　'+' 付きのノードが挿入されたノードです。木 t の高さを |t| と表すと、|t2| = |t3| = h, |t1| = h + 1 という条件が成り立ちます。ここでは、 t1,t2,t3 が高さ 1 あるいは 2 の木として図示されていますが、先の条件を満たせば、高さ h は任意です(h ≧ 0 とする)。ノードの状態 {L,E,R} も変形後に合わせて変更します。バランスが復活し、v を根とする部分木の高さが元に戻ったので、 Change フラグを False にしてさかのぼります。

[CASE 2: (u=L,v=R,w=L)]

　次の図のような関係が成り立つ場合に木を回転して、左図を右図のように変形します。

AVL木の修正：パターンLRLi

　|t3| = h, |t1| = |t2| = |t4| = h + 1 が成り立ちます。ノードの状態 {L,E,R} を変形後に合わせて変更します。バランスが復活し、w を根とする部分木の高さが元に戻ったので、 Change フラグを False にしてさかのぼります。

[CASE 3: (u=L,v=R,w=R)]

　次の図のような関係が成り立つ場合に木を回転して、左図を右図のように変形します。

AVL木の修正：パターンLRRi

　|t2| = h, |t1| = |t3| = |t4| = h + 1 が成り立ちます。ノードの状態 {L,E,R} を変形後に合わせて変更します。バランスが復活し、w を根とする部分木の高さが元に戻ったので、 Change フラグを False にしてさかのぼります。

[CASE 4: (u=L,v=R,w=E)]

　次の図のような関係が成り立つ場合に木を回転して、左図を右図のように変形します。

AVL木の修正：パターンLREi

　t1 = t2 = t3 = t4 = Empty が成り立ちます。ノードの状態 {L,E,R} を変形後に合わせて変更します。バランスが復活し、w を根とする部分木の高さが元に戻ったので、 Change フラグを False にしてさかのぼります。

　次は挿入操作の 「右部分木から Change フラグが True でさかのぼって来た場合」 の説明をしたいところですが、それは左右対称なパターンマッチになっていますので省略します。

【AVL木を使ったマップの実装】

　さて、AVL木と言えばソートに使うというより、マップを実装するデータ構造として有名です。せっかくAVL木を使ったのですから、 delete(削除操作) の処理も含んだマップの実装も見てみましょう。以下のようになります。Java による実装をお望みの方はこのリンクからどうぞ。

【削除操作】

　まず、AVL木の削除を説明する前に、２分探索木の削除について簡単に説明します。２分探索木でノードの削除を行うには、削除したいノードが左端のノードの場合は、単にそのノードを削除し、そのノードに右部分木があったのならそれを昇格させます。また、削除したいノードが左部分木を持つ場合は、左部分木の最大値のノードで削除したいノードを置き換え、最大値だったノードを削除します。このとき、削除したノードに左部分木があったのならそれを昇格させます。以下に、２分探索木の削除の一例を具体的に示します。

　図は、赤で示した 4 を削除する例を示しています。 4 には左部分木があります。そして、 4 の左部分木の最大値は 3 ですので、 4 を 3 で置き換え、元の 3 を削除します。削除後も２分探索木の大小関係がうまく保たれていることが分かると思います。

　これに加えAVL木の場合は、削除後、木のバランスが崩れていれば回転を使って木を修正する必要があります。ノードを削除したらまず、変更の必要性を示すフラグである Change フラグを True にして、木の根(root)の方向にさかのぼります。そして、パターンマッチでパターン毎の修正を行います。修正後、注目している部分木の高さが１つ低くなると、さらに上位の木で修正が必要になるので Change フラグを True にしてさかのぼります。高さが変わらない場合は修正の必要はないので、 Change フラグを False にしてさかのぼります。一度 Change フラグを False にしたらそれ以上は修正を行いません。そのまま木の根(root)までさかのぼり終了します。

　それでは、具体的にパターンマッチの詳細を説明しましょう。現在注目しているノードに u という名前を付けます。まずは「右部分木から Change フラグが True でさかのぼって来た場合」の処理です。u の状態によって処理を分けます。

　左右の部分木の高さが等しかったところで、削除により右部分木の高さが１つ低くなります。しかし、u を根とする部分木の高さは変わりませんので、上位の木で修正は必要ありません。 u の状態を L に、Change フラグを False にしてさかのぼります。

　右部分木が高かったところで、右部分木の高さが１つ低くなるのですから、左右の部分木の高さが等しくなります。そして、u を根とする部分木の高さも１つ低くなりますので、上位の木でさらに修正が必要になります。 u の状態を E に、Change フラグを True にしてさかのぼります。

　左部分木が高かったところに、右からさかのぼって来た場合の処理です。パターンマッチのために、 u の左の子のことを v、v の右の子のことを w と呼ぶことにします。まず大まかに u,v の状態の組で分類します。u は L ですので、 (u=L,v=L),(u=L,v=R),(u=L,v=E) の３通りが考えられます。 v が R の場合、u,v だけでは情報が足りませんので w を追加する必要があります。従って v が R の場合、 (u=L,v=R,w=L),(u=L,v=R,w=R),(u=L,v=R,w=E) の３通りを考える必要があります。つまり全体では、 (u=L,v=L),(u=L,v=R,w=L),(u=L,v=R,w=R),(u=L,v=R,w=E),(u=L,v=E) の５つのケースが考えられます。