情報基礎A 「Cプログラミング」(ステップ9・ポインター・グラフの探索)
このページでは、ポインターの応用として、ダイクストラ法を使ったグラフ上の最短経路探索について考える。(ここはまだ書きかけ)
1.最短経路を探すアルゴリズム
点 s から、いくつかの点(ここではa, bとしよう)まで道が伸びている。 ここで、s からそれぞれの点までの道のりを $d_{sa}$, $d_{sb}$と表すことにしよう。 もし、$d_{sa} \lt d_{sb}$ なら、sからaの最短経路はsからaへの道である。 つまり、sから直接到達できるうちで道のりが最短の点 a への最短経路は $s \to a$ で「確定」である。
ところが、sからbに直接延びる道は、sからbへの最短経路とは限らない。 なぜなら、sを出発後、aを経由してからbに至る経路のほうが短い(すなわち $d_{sb} \gt d_{sa} + d_{ab}$)かもしれないからだ。
これと全く同じ考え方は、複数の点がある場合についても成り立つ。 sからの最短距離が既知の点の集合 $S$ があったとしよう。 それらの「既知」の点 $x$ $(\in S)$ に繋がっている点のうち、$S$には含まれない点 $w$ に注目する。 そして、出発点 $s$ から $x$ を経由して $w$ に至る道のり、すなわち $d_{sx} + d_{xw}$ が最も短くなるような $x, w$ の組を探し出し、それぞれ $x^*$, $w^*$ と表すことにしよう。
ここで、$d_{sx^*} + d_{x^* w^*}$ は $s$ から $w^*$ までの最短の道のりであることは明らかで、 $s \to \cdots \to x^* \to w^*$ 以外の $w^*$ に至る経路は $w^*$ への「廻り道」になる。 また、$w^*$は、$S$ に属する点を除けば、$x^*$からみて一番近い点である。
そうすると、この $w^*$ は、$s$からの最短距離が既知であるような点となったのだから、$S$ のメンバーに加えることができる (変数の「代入」に倣って $S \leftarrow S \cup \{ w^*\}$ と書くことにする)。
こうして、更新された $S$ に対して、再び、$s$からの道のりが最短となるような $S$ の隣接点を見つけ、$S$ に加える、という操作を繰り返せば、いずれ、全ての点について最短の道のりが(そして経路も)判明するはずだ。
上記の考え方に特段難しいところはないが、問題はむしろ、そんなに都合よく(簡単に)最短経路を与えるような $x^*, w^*$ が見つかるか、にある。 というのは、$S$ に 100 点が登録されていたとして、そこから道が繋がっていて $S$ には未登録な点が 100 ずつあったとすると、$100 \times 100$ 通りの組み合わせを試し、 その中から距離が最小のものを見つけ出さなくてはならない。 そういった作業を「既知」の点を加える度に行うのは、大変な工数である。
ここでひとつの妙案がある。以下で述べるように、$w^*$ を探す都度、途中経過を「道端」に残しておくと、格段に効率を上げることができる:
【隣接点へのメモ書き】
仮に, $x^*, w^*$ の組が見つかっているとしよう。 $w^*$ が $S$ に加わったとすると、$w^*$ から直接辿ることのできる点が、次のラウンドのチェックの対象として新たに加わることになる。 そこで、それを見越して、$w^*$ と繋がっている点のうち、$S$ には含まれない点に、そこまでの道のりを「メモ書き」しておくのだ。
$w^*$ に繋がっている点 $v$ $(\not\in S)$ までの道のりは $d_{sw^*} + d_{w^*v}$ となるが、 $v$ は $S$ に属する他の点とも繋がっている可能性があり、そちらを経由したほうが最短で辿り着ける可能性がある。 そこで、このメモ書きの際に、もし、$d_{sw^*} + d_{w^*v}$ よりも小さな値がすでに書き込まれていたらメモ書きするのは止めにする。 何もメモ書きが無い、あるいは、$d_{sw^*} + d_{w^*v}$ よりも大きな値が書き込まれていれば、その値を点 v にメモしておく。
【「確定点」の更新】
$w^*$ の隣接点へのメモ書きが終わったら、$w^*$ を新しく $S$ に加える。
【注目点を更新して反復】
次のラウンドの $w^*$ を見つけるには、$S$ には属さない点の中で、一番小さな数がメモ書きされたものを探せばよい。 そして新たに見つかった $w^*$ について、上記の手順を( $w^*$ が見つからなくなるまで)繰り返す。
【手続きの開始(出発)点】
すると、「一番最初の $w^*$」 が必要になるが、当然、それは出発点 s である。 s から s までの最短距離は 0 であるから、s に 0 をメモ書きしておいてから、上記の手続きを始めればよい。
図:メモ書きの手順
メモ書きされた値が一番小さいの点 $w^*$ を見つける(図では56kmの点)。
そこから繋がっている(ただし$S$には含まれない)点までの道のりをメモ書きする(赤字)。
すでにメモ書きされている点については、 値を比較し、小さいほうの値を残す。
隣接する点のメモ書きが終わったら、$w^*$ を $S$ に加える。
上記のように途中結果をうまく活用すれば、『$x^*, w^*$を探索する作業』、は、『最小の値がメモ書きされている点を選ぶ』作業に置き換えることができ、 後者のほうが、圧倒的に要する工数が少なくできる。 この方法はダイクストラ法(Dijkstra's algorithm)と呼ばれるもので、 グラフ上の最短経路を探すアルゴリズムの定番である。 教科書 4.3節(p.121)にさらに詳しい説明が、 このアルゴリズムの「正しさ」の証明付きで掲載されているので参照のこと。
2.ダイクストラ法のコーディング
教科書に掲載されている道路網(図4.9)について、仙台から鹿児島までの経路を 上記のアルゴリズムで求めるCプログラムの例を以下に示す。 ここで、グラフ(ネットワーク)の表現には ポインターの応用 で示した方法を用いた。 一見複雑なコードのように見えるが、最短距離(経路)の探索の処理はmain()関数の中だけで行なわれており、 その他はグラフの作成と処理のための補助的な関数ばかりである。
構造体 vertex
のメンバーのうち、
done
はその点が確定済みかどうか(0は未確定)を、
distance
はメモ書きされた距離(負の場合はまだメモ書きされていないこと)を、
route
はひとつ「手前」の点(へのポインター)、を、それぞれ表現するために使われている。
#include <stdio.h> #include <stdlib.h> #include <string.h> #include <float.h> struct vertex { char *name ; int max_adj ; struct vertex **link ; float *weight ; float distance ; int done ; struct vertex *route ; } ; struct vertex * create_vertex(char *name) { struct vertex *v ; v = (struct vertex *) malloc(sizeof(struct vertex)) ; v->name = (char *) malloc(sizeof(strlen(name))+1) ; strcpy(v->name,name) ; v->max_adj = 2 ; v->link = (struct vertex **) malloc(sizeof(struct vertex *)*(v->max_adj + 1)) ; v->link[0] = NULL ; v->weight = (float *) malloc(sizeof(float)*(v->max_adj + 1)) ; v->done = 0 ; v->distance = -1.0 ; v->route = NULL ; return v ; } void append_vertex(struct vertex *v, struct vertex *a, float weight) { int n=0 ; while (v->link[n] != NULL) { if (v->link[n] == a) return ; n=n+1; } if (n >= v->max_adj) { v->max_adj = v->max_adj*2 ; v->link = (struct vertex **) realloc(v->link, sizeof(struct vertex *)*(v->max_adj+1)) ; v->weight = (float *) realloc(v->weight, sizeof(float)*(v->max_adj+1)) ; } v->link[n] = a ; v->link[n+1] = NULL ; v->weight[n] = weight ; } void connect_vertex(struct vertex *v1, struct vertex *v2, float weight) { append_vertex(v1,v2,weight) ; append_vertex(v2,v1,weight) ; } void print_link(struct vertex *v) { int n=0 ; printf("%s ",v->name) ; while (v->link[n] != NULL) { printf("-> %s ",(v->link[n])->name) ; n=n+1; } printf("\n") ; } #define N 40 struct vertex *city[N] ; void init_graph() { city[0] = create_vertex("Sendai") ; city[1] = create_vertex("Fukushima") ; city[2] = create_vertex("Niigata") ; city[3] = create_vertex("Nagaoka") ; city[4] = create_vertex("Jouetsu") ; city[5] = create_vertex("Kanazawa") ; city[6] = create_vertex("Nagano") ; city[7] = create_vertex("Takasaki") ; city[8] = create_vertex("Utsunomiya") ; city[9] = create_vertex("Mito") ; city[10] = create_vertex("Tsuruga") ; city[11] = create_vertex("Shiojiri") ; city[12] = create_vertex("Koufu") ; city[13] = create_vertex("Hachiouji") ; city[14] = create_vertex("Ohmiya") ; city[15] = create_vertex("Tokyo") ; city[16] = create_vertex("Chiba") ; city[17] = create_vertex("Maibara") ; city[18] = create_vertex("Nagoya") ; city[19] = create_vertex("Shizuyka") ; city[20] = create_vertex("Yokohama") ; city[21] = create_vertex("Maizuru") ; city[22] = create_vertex("Kyoto") ; city[23] = create_vertex("Tsu") ; city[24] = create_vertex("Tottori") ; city[25] = create_vertex("Osaka") ; city[26] = create_vertex("Nara") ; city[27] = create_vertex("Wakayama") ; city[28] = create_vertex("Matsue") ; city[29] = create_vertex("Hiroshima") ; city[30] = create_vertex("Okayama") ; city[31] = create_vertex("Matsuyama") ; city[32] = create_vertex("Takamatsu") ; city[33] = create_vertex("Kouchi") ; city[34] = create_vertex("Shimonoseki") ; city[35] = create_vertex("Fukuoka") ; city[36] = create_vertex("Hhita") ; city[37] = create_vertex("Nagasaki") ; city[38] = create_vertex("Kumamoto") ; city[39] = create_vertex("Kagoshima") ; connect_vertex(city[0],city[1],81) ; connect_vertex(city[0],city[2],220) ; connect_vertex(city[1],city[3],240) ; connect_vertex(city[1],city[8],172) ; connect_vertex(city[1],city[9],202) ; connect_vertex(city[2],city[3],62) ; connect_vertex(city[2],city[4],132) ; connect_vertex(city[3],city[4],80) ; connect_vertex(city[3],city[7],171) ; connect_vertex(city[4],city[5],185) ; connect_vertex(city[4],city[6],89) ; connect_vertex(city[5],city[6],230) ; connect_vertex(city[5],city[10],136) ; connect_vertex(city[6],city[7],120) ; connect_vertex(city[6],city[11],85) ; connect_vertex(city[7],city[8],103) ; connect_vertex(city[7],city[13],104) ; connect_vertex(city[7],city[14],109) ; connect_vertex(city[8],city[9],80) ; connect_vertex(city[8],city[14],95) ; connect_vertex(city[9],city[16],150) ; connect_vertex(city[10],city[17],54) ; connect_vertex(city[10],city[21],78) ; connect_vertex(city[10],city[22],98) ; connect_vertex(city[11],city[12],85) ; connect_vertex(city[11],city[18],205) ; connect_vertex(city[12],city[13],118) ; connect_vertex(city[12],city[19],115) ; connect_vertex(city[13],city[15],48) ; connect_vertex(city[13],city[20],58) ; connect_vertex(city[14],city[15],34) ; connect_vertex(city[15],city[16],41) ; connect_vertex(city[15],city[20],34) ; connect_vertex(city[17],city[18],70) ; connect_vertex(city[17],city[22],83) ; connect_vertex(city[18],city[19],182) ; connect_vertex(city[18],city[23],81) ; connect_vertex(city[19],city[20],165) ; connect_vertex(city[21],city[22],110) ; connect_vertex(city[21],city[24],170) ; connect_vertex(city[22],city[25],51) ; connect_vertex(city[22],city[26],40) ; connect_vertex(city[23],city[27],183) ; connect_vertex(city[24],city[25],188) ; connect_vertex(city[24],city[28],120) ; connect_vertex(city[24],city[30],140) ; connect_vertex(city[25],city[26],35) ; connect_vertex(city[25],city[27],80) ; connect_vertex(city[25],city[30],175) ; connect_vertex(city[26],city[27],99) ; connect_vertex(city[28],city[29],170) ; connect_vertex(city[28],city[34],312) ; connect_vertex(city[29],city[30],161) ; connect_vertex(city[29],city[31],85) ; connect_vertex(city[29],city[34],200) ; connect_vertex(city[30],city[32],45) ; connect_vertex(city[31],city[32],160) ; connect_vertex(city[31],city[33],130) ; connect_vertex(city[32],city[33],130) ; connect_vertex(city[34],city[35],100) ; connect_vertex(city[35],city[36],160) ; connect_vertex(city[35],city[37],152) ; connect_vertex(city[35],city[38],113) ; connect_vertex(city[36],city[39],350) ; connect_vertex(city[38],city[39],175) ; } void print_route_from(struct vertex *v) { while (v!=NULL) { printf("%s %f\n",v->name,v->distance) ; v = v->route ; } } main() { int i,w,k ; float dmin ; struct vertex *v ; init_graph() ; /* start from Sendai */ city[0]->distance = 0 ; while (1) { dmin=FLT_MAX ; w=-1 ; for (i=0; i<N; i=i+1) { if (city[i]->done || city[i]->distance < 0) continue ; if (city[i]->distance < dmin) { w = i ; dmin = city[i]->distance ; } } if (w<0) break ; /* if no more vertex to check then exit */ k=0 ; while ((v=(city[w]->link)[k]) != NULL) { if (!v->done) { if (v->distance < 0) { v->distance = city[w]->distance + (city[w]->weight)[k] ; v->route = city[w] ; } else { if (v->distance > city[w]->distance + (city[w]->weight)[k]) { v->distance = city[w]->distance + (city[w]->weight)[k] ; v->route = city[w] ; } } } k=k+1 ; } city[w]->done = 1 ; } /* Trace back from Kagoshima */ print_route_from(city[39]) ; }
練習:コードの改良
上で示したコードの例では、反復の都度、全ての頂点について $S$ のメンバーかどうかやメモ書きされた道のりを調べている。 調べるべき点($S$には含まれず、メモが残されている点)の「管理簿」を別に用意して、その中の点だけをチェックする方式に改めてみなさい。