經典算法研究系列:一、A*搜索算法
作者:July、二零一一年一月
----------------------------------
博主說明:
1、本經典算法研究系列,此系列文章寫的不夠好之處,還望見諒。
2、本經典算法研究系列,系我參考資料,一篇一篇原創所作,轉載必須注明作者本人July及出處。
3、本經典算法研究系列,精益求精,不斷優化,永久更新,永久勘誤。
歡迎,各位,與我一同學習探討,交流研究。
有誤之處,不吝指正。
-------------------------------------------
引言
1968年,的一篇論文,“P. E. Hart, N. J. Nilsson, and B. Raphael. A formal basis for the heuristic determination of minimum cost paths in graphs. IEEE Trans. Syst. Sci. and Cybernetics, SSC-4(2):100-107, 1968”。從此,一種精巧、高效的算法------A*算法橫空出世了,並在相關領域得到了廣泛的應用。
啟發式搜索算法
要理解A*搜尋算法,還得從啟發式搜索算法開始談起。
所謂啟發式搜索,就在於當前搜索結點往下選擇下一步結點時,可以通過一個啟發函數來進行選擇,選擇代價最少的結點作為下一步搜索結點而跳轉其上(遇到有一個以上代價最少的結點,不妨選距離當前搜索點最近一次展開的搜索點進行下一步搜索)。
DFS和BFS在展開子結點時均屬於盲目型搜索,也就是說,它不會選擇哪個結點在下一次搜索中更優而去跳轉到該結點進行下一步的搜索。在運氣不好的情形中,均需要試探完整個解集空間, 顯然,只能適用於問題規模不大的搜索問題中。
而與DFS,BFS不同的是,一個經過仔細設計的啟發函數,往往在很快的時間內就可得到一個搜索問題的最優解,對於NP問題,亦可在多項式時間內得到一個較優解。是的,關鍵就是如何設計這個啟發函數。
A*搜尋算法
A*搜尋算法,俗稱A星算法,作為啟發式搜索算法中的一種,這是一種在圖形平面上,有多個節點的路徑,求出最低通過成本的算法。常用於游戲中的NPC的移動計算,或線上游戲的BOT的移動計算上。該算法像Dijkstra算法一樣,可以找到一條最短路徑;也像BFS一樣,進行啟發式的搜索。
A*算法最為核心的部分,就在於它的一個估值函數的設計上:
f(n)=g(n)+h(n)
其中f(n)是每個可能試探點的估值,它有兩部分組成:
一部分,為g(n),它表示從起始搜索點到當前點的代價(通常用某結點在搜索樹中的深度來表示)。
另一部分,即h(n),它表示啟發式搜索中最為重要的一部分,即當前結點到目標結點的估值,
h(n)設計的好壞,直接影響著具有此種啟發式函數的啟發式算法的是否能稱為A*算法。
一種具有f(n)=g(n)+h(n)策略的啟發式算法能成為A*算法的充分條件是:
1、搜索樹上存在著從起始點到終了點的最優路徑。
2、問題域是有限的。
3、所有結點的子結點的搜索代價值>0。
4、h(n)=<h*(n) (h*(n)為實際問題的代價值)。
當此四個條件都滿足時,一個具有f(n)=g(n)+h(n)策略的啟發式算法能成為A*算法,並一定能找到最優解。
對於一個搜索問題,顯然,條件1,2,3都是很容易滿足的,而條件4: h(n)<=h*(n)是需要精心設計的,由於h*(n)顯然是無法知道的,所以,一個滿足條件4的啟發策略h(n)就來的難能可貴了。
不過,對於圖的最優路徑搜索和八數碼問題,有些相關策略h(n)不僅很好理解,而且已經在理論上證明是滿足條件4的,從而為這個算法的推廣起到了決定性的作用。
且h(n)距離h*(n)的呈度不能過大,否則h(n)就沒有過強的區分能力,算法效率並不會很高。對一個好的h(n)的評價是:h(n)在h*(n)的下界之下,並且盡量接近h*(n)。
A*搜尋算法的實現
先舉一個小小的例子:即求V0->V5的路徑,V0->V5的過程中,可以經由V1,V2,V3,V4各點達到目的點V5。下面的問題,即是求此起始頂點V0->途徑任意頂點V1、V2、V3、V4->目標頂點V5的最短路徑。
//是的,圖片是引用rickone 的。
通過上圖,我們可以看出::A*算法最為核心的過程,就在每次選擇下一個當前搜索點時,是從所有已探知的但未搜索過點中(可能是不同層,亦可不在同一條支路上),選取f值最小的結點進行展開。
而所有“已探知的但未搜索過點”可以通過一個按f值升序的隊列(即優先隊列)進行排列。
這樣,在整體的搜索過程中,只要按照類似廣度優先的算法框架,從優先隊列中彈出隊首元素(f值),對其可能子結點計算g、h和f值,直到優先隊列為空(無解)或找到終止點為止。
A*算法與廣度、深度優先和Dijkstra 算法的聯系就在於:當g(n)=0時,該算法類似於DFS,當h(n)=0時,該算法類似於BFS。且同時,如果h(n)為0,只需求出g(n),即求出起點到任意頂點n的最短路徑,則轉化為單源最短路徑問題,即Dijkstra算法。這一點,可以通過上面的A*搜索樹的具體過程中將h(n)設為0或將g(n)設為0而得到。
A*算法流程:
首先將起始結點S放入OPEN表,CLOSE表置空,算法開始時:
1、如果OPEN表不為空,從表頭取一個結點n,如果為空算法失敗。
2、n是目標解嗎?是,找到一個解(繼續尋找,或終止算法)。
3、將n的所有後繼結點展開,就是從n可以直接關聯的結點(子結點),如果不在CLOSE表中,就將它們放入OPEN表,並把S放入CLOSE表,同時計算每一個後繼結點的估價值f(n),將OPEN表按f(x)排序,最小的放在表頭,重復算法,回到1。
//OPEN-->CLOSE,起點-->任意頂點g(n)-->目標頂點h(n)
closedset := the empty set //已經被估算的節點集合
openset := set containing the initial node //將要被估算的節點集合
g_score[start] := 0 //g(n)
h_score[start] := heuristic_estimate_of_distance(start, goal) //h(n)
f_score[start] := h_score[start]
while openset is not empty //若OPEN表不為空
x := the node in openset having the lowest f_score[] value //x為OPEN表中最小的
if x = goal //如果x是一個解
return reconstruct_path(came_from,goal) //
remove x from openset
add x to closedset //x放入
CLSOE表
for each y in neighbor_nodes(x)
if y in closedset
continue
tentative_g_score := g_score[x] + dist_between(x,y)
if y not in openset
add y to openset
tentative_is_b