数据结构与算法——图最短路径

1 引言

  最短路径问题一直是图论研究的热点问题。例如在实际生活中的路径规划、地图导航等领域有重要的应用。关于求解图的最短路径方法也层出不穷,本篇文章将详细讲解图的最短路径经典算法。

2 重要概念

  图的路径:图G =中,从任一顶点开始,由边或弧的邻接至关系构成的有限长顶点序列称为路径。
  注意:有向图的路径必须沿弧的方向构成顶点序列;构成路径的顶点可能重复出现(即允许反复绕圈)。 
  路径长度:路径中边或弧的数目。
  简单路径:除第一个和最后一个顶点外,路径中无其它重复出现的顶点,称为简单路径。
  回路或环:路径中的第一个顶点和最后一个顶点相同时,称为回路或环。
  图的最短路径:如果从有向图中某一顶点(称为源点)到达另一顶点(称为终点)的路径可能不止一条,如何找到一条路径使得沿此路径上各边上的权值总和达到最小。

3 深度或广度优先搜索算法

3.1 算法概述

  从起点开始访问所有深度遍历路径或广度优先路径,则到达终点节点的路径有多条,取其中路径权值最短的一条则为最短路径。

3.2 算法流程

  (1)选择单源的起点作为遍历的起始点。
  
  (2)采用深度优先搜索或者广度优先搜索的方式遍历图,在遍历同时记录可以到达终点的路径。
  
  (3)在所有路径中选择距离最短的路径。

3.3 实例图解

例如:图3.3.1所示的有向图中,选取A为源点,D为终点,采用遍历的方式获取最短路径。

数据结构与算法——图最短路径
图3.3.1

(1)选择A为遍历起始点,D为终点。

(2)采用遍历的方式获取A到D路径。通过遍历方式得到的路径共有5条。

(3)从中选择距离最短的路径为A->B->D,长度为9。

3.4 算法分析

  采用遍历的方式获取单源最短路径,是一种暴力破解的方式。算法的性能与遍历过程性能相关。采用深度优先搜索遍历时时间复杂度为O(n+e)。

4 迪杰斯特拉(Dijkstra)算法

4.1 算法概述

  Dijkstra(迪杰斯特拉)算法是典型的单源最短路径算法,用于计算某个顶点到其他所有顶点的最短路径。Dijkstra(迪杰斯特拉)算法要求图中不存在负权边,即保证图中每条边的权重值为正。算法的基本思想是:从源点出发,每次选择离源点最近的一个顶点前进,然后以该顶点为中心进行扩展,最终得到源点到其余所有点的最短路径。

4.2 算法流程

  (1)将所有的顶点分为两部分:已知最短路程的顶点集合P和未知最短路径的顶点集合Q。最开始,已知最短路径的顶点集合P中只有源点s一个顶点。我们这里用一个book[i]数组来记录哪些点在集合P中。例如对于某个顶点i,如果book[i] = 1则表示这个顶点在集合P中,如果book[i] = 0则表示这个顶点在集合Q中。
  (2)设置源点s到自己的最短路径为0即dist = 0。若存在源点有能直接到达的顶点i,则把dist[i]设为e[s][i]。同时把所有其它(即源点不能直接到达的)顶点的最短路径为设为∞。
  (3)在Q中选择一个离源点s最近的顶点u(即dist[u]最小)加入到P中。并考察所有以点u为起点的边,对每一条边进行松弛操作。
  (4)重复第3步,如果集合Q为空,算法结束。最终dist数组中的值就是源点到所有顶点的最短路径。

4.3 实例图解

例如:图4.3.1所示的有向图,以顶点1为源点,运用Dijkstra算法,获得最短路径。

数据结构与算法——图最短路径
图4.3.1

(1)初始状态下,集合P中只有顶点1, book[1]=1。book数组以及dist数组如图:

(2)从dist数组中可以看出,距离顶点1最近的顶点为2,不存在可以中转的顶点使得顶点1到顶点2的距离更短,且顶点2不在集合P中。因此,选择顶点2加入集合P中,令book[2]=1。顶点2加入后,需要考虑经过顶点2进行中转,使得顶点1到达其余顶点的距离发生改变。顶点2的出边有<2,3>和<2,4>。则需重新计算dist[3]和dist[4]。dist[3] = dis[2]+e[2][3] = 10 < 12,令dist[3]松弛为12。dist[4] = dis[2]+e[2][4] = 4 < INF,令dist[4]松弛为4。更新后的book数组和dist数组如下:

(3)从剩余顶点3、4、5、6中选择dist中最近顶点为顶点4(因为顶点2已经在集合P中不能再次选择)。将顶点4加入集合P中,令book[4]=1。按照相同的方式更新dist数组。顶点4的所有出边<4,3>(dist[3] = dis[4]+e[4][3]),<4,5>(dist[5] = dis[4]+e[4][5])和<4,6>(dist[6] = dis[4]+e[4][6])用同样的方法进行松弛。松弛完毕之后book数组和dist数组为:

(4)继续在剩余的顶点3、顶点5顶点和6中,选出离顶点1最近的顶点。选择3号顶点。此时,dis[3]的值已对3号顶点的所有出边(3->5)(dist[5] = dis[3]+e[3][5])进行松弛。松弛完毕之后dist数组为:

(5)继续在剩余的顶点5和顶点6,选出离顶点1最近的顶点,选择5号顶点。对5号顶点的所有出边(5->4)(dist[4] = dis[5]+e[5][4])进行松弛。松弛完毕之后dist数组为:

(6)最后选择顶点6加入集合P,令book[6]=1。由于6号顶点没有出边,因此不用进行松弛处理。最终得到的dist数组如下:

4.4 算法分析

  复杂度:迪杰斯特拉(Dijkstra)算法适用于权值为非负的图的单源最短路径,使用最小堆时间复杂度是O(VLogV),用斐波那契堆的复杂度O(E+VlgV)。
  为什么不能有负权边:Dijkstra算法当中将节点分为已求得最短路径的集合(记为P)和未确定最短路径的个集合(记为Q),归入P集合的节点的最短路径及其长度不再变更,如果边上的权值允许为负值,那么有可能出现当与P内某点(记为a)以负边相连的点(记为b)确定其最短路径时,它的最短路径长度加上这条负边的权值结果小于a原先确定的最短路径长度(意思是原先从a0—a已经确定一个最短路径,而此时的边权值为负,则此步骤中的边权计算结果必定小于已经确定了的路径长度),但是a在Dijkstra算法下是无法更新的,由此便可能得不到正确的结果。

5 Bellman-Ford算法

5.1 算法概述

  Bellman-Ford算法是从Dijkstra算法算法引申出来的,它可以解决带有负权边的最短路径问题。值得注意的是,Dijkstra算法和下面的Floyd算法是基于邻接矩阵的,而Bellman-Ford算法是基于邻接表,从边的角度考量的。用一句话概括就是:对所有的边进行n-1次松弛操作。如果图中存在最短路径(即不存在负权回路),那么最短路径所包含的边最多为n-1条,也就是不可能包含回路。因为如果存在正回路,该路径就不是最短的,而如果存在负回路,就压根就不存在所谓的最短路径。

5.2 算法流程

  (1)从源点到任意一点u的最短路径的长度,初始化数组dist[u]为0,其余dist[i]为无穷大。
  (2)以下操作循环执行至多n-1次,n为顶点数:
  对于每一条边edge(u,v),如果dist[u] + weight(u,v) < dist[v],则令dist[v] = dist[u] + weight(u,v)。若上述操作没有对dist进行更新,说明最短路径已经查找完毕,或者部分点不可达,跳出循环。否则执行下次循环;
  (3)检测图中是否存在负环路,即权值之和小于0的环路。对于每一条边edge(u,v),如果存在dist[u] + weight(u,v) < dist[v]的边,则图中存在负环路,即是说该图无法求出单源最短路径。否则数组dist[n]中记录的就是源点s到各顶点的最短路径长度。

5.3 实例图解

以图5.3.1所示的有向图为例,以顶点1为源点,采用Bellman-Ford算法计算最短路径。

数据结构与算法——图最短路径
图5.3.1

(1)选取顶点1为源点,令dist[1]=1,dist[2]-dist[6]=INF。

(2)图中共有9条边,分别为<1,2>,<1,3>,<2,3>,<2,4>,<3,5>,<4,3>,<4,5>,<4,6>,<5,6>。对于每一条边执行松弛操作。此过程至多执行5次。

(3)第一次松弛操作:

对于边<1,2>,dist[2]=dist[1]+weight[1,2]=1 <INF。则dist[2]=1;

对于边<1,3>,dist[3]=dist[1]+weight[1,3]=12<INF。则dist[3]=12;

对于边<2,3>,dist[3]=dist[2]+weight[2,3]=10<12。则dist[3]=10;

对于边<2,4>,dist[4]=dist[2]+weight[2,4]=4<INF。则dist[4]=4;

对于边<3,5>,dist[5]=dist[3]+weight[3,5]=15<INF。则dist[5]=15;

对于边<4,3>,dist[3]=dist[4]+weight[4,3]=8<10。则dist[3]=8;

对于边<4,5>,dist[5]=dist[4]+weight[4,5]=17>15。则dist[5]=15;

对于边<4,6>,dist[6]=dist[4]+weight[4,6]=19<INF。则dist[6]=19;

对于边<5,6>,dist[6]=dist[5]+weight[5,6]=19<INF。则dist[6]=19;

得到的dist数组为:

数据结构与算法——图最短路径
img

(4)第二次松弛操作:

对于边<1,2>,dist[2]=dist[1]+weight[1,2]=1=1。则dist[2]=1;

对于边<1,3>,dist[3]=dist[1]+weight[1,3]=12=12。则dist[3]=12;

对于边<2,3>,dist[3]=dist[2]+weight[2,3]=10>8。则dist[3]=8;

对于边<2,4>,dist[4]=dist[2]+weight[2,4]=4=4。则dist[4]=4;

对于边<3,5>,dist[5]=dist[3]+weight[3,5]=13<15。则dist[5]=13;

对于边<4,3>,dist[3]=dist[4]+weight[4,3]=8<10。则dist[3]=8;

对于边<4,5>,dist[5]=dist[4]+weight[4,5]=17>13。则dist[5]=13;

对于边<4,6>,dist[6]=dist[4]+weight[4,6]=19=19。则dist[6]=19;

对于边<5,6>,dist[6]=dist[5]+weight[5,6]=17<19。则dist[6]=17;

得到的dist数组为:

数据结构与算法——图最短路径
img


(5)第三次松弛操作:


对于边<1,2>,dist[2]=dist[1]+weight[1,2]=1=1。则dist[2]=1;

对于边<1,3>,dist[3]=dist[1]+weight[1,3]=12=12。则dist[3]=12;

对于边<2,3>,dist[3]=dist[2]+weight[2,3]=10>8。则dist[3]=8;

对于边<2,4>,dist[4]=dist[2]+weight[2,4]=4=4。则dist[4]=4;

对于边<3,5>,dist[5]=dist[3]+weight[3,5]=13<15。则dist[5]=13;

对于边<4,3>,dist[3]=dist[4]+weight[4,3]=8<10。则dist[3]=8;

对于边<4,5>,dist[5]=dist[4]+weight[4,5]=17>13。则dist[5]=13;

对于边<4,6>,dist[6]=dist[4]+weight[4,6]=19=19。则dist[6]=19;

对于边<5,6>,dist[6]=dist[5]+weight[5,6]=17<19。则dist[6]=17;

得到的dist数组为:

数据结构与算法——图最短路径
img


(6)第三次松弛操作没有对dist进行更新,说明最短路径已经查找完毕。最终结果为:

数据结构与算法——图最短路径
img

5.4 算法分析

  Bellman-Ford算法初始化过程时间复杂度为O(V),对边进行了V-1趟操作,每趟操作的运行时间为O(E)。整体的时间复杂度为O(V*E)

6 SPFA算法

6.1 算法概述

  SPFA(Shortest Path Faster Algorithm)算法是求单源最短路径的一种算法,它是Bellman-ford的队列优化。

6.2 算法流程

  (1)初始化:选取顶点u为源点,令dist[u]=0,其余赋值为INF。并将源点入队列。
  (2)读取队列头的顶点,并将头顶点u出队列,将与u邻接的所有顶点v进行松弛,若v没有在队列中,则将邻接顶点v入队列。如果已经在队列中,则不再入队。
  (3)队列为空时,单源最短路径查找完毕。

6.3 实例图解

例如:图6.3.1所示有向图,以顶点1为源点,采用SPFA算法求解最短路径。

数据结构与算法——图最短路径
图6.3.1

(1)执行初始化操作,并将顶点1入队列。

(2)顶点1出队列,邻接顶点有2、3。进行松弛操作:

dist[2] = dist[1]+weight[1,2] = 1;

dist[3] = dist[1]+weight[1,3] = 12;

更新dist数组,并将顶点2、3入队列。

(3)顶点2出队列,邻接顶点有3、4,进行松弛操作:

dist[3] = dist[2]+weight[2,3] = 10;

dist[4] = dist[2]+weight[2,3] = 4;

更新dist数组,并将顶点4入队列(顶点3已在队列中)。

(4)顶点3出队列,邻接顶点有5。进行松弛操作:

dist[5] = dist[3]+weight[3,5] = 17;

更新dist数组,并将顶点5入队列。

(5)顶点4出队列,邻接顶点有3、5、6。进行松弛操作:

dist[3] = dist[4]+weight[4,3] = 8;

dist[5] = dist[4]+weight[4,5] = 17;

dist[6] = dist[4]+weight[4,6] = 19;

更新dist数组,并将顶点3、6入队列。

(6)顶点5出队列,邻接顶点有6。进行松弛操作:

dist[6] = dist[5]+weight[5,6] = 19 = 19;

无需更新dist中数组值,同时无元素入队列。

(7)顶点3出队列,邻接顶点有5。进行松弛操作:

dist[5] = dist[3]+weight[3,5] = 13;

更新dist数组,并将顶点5入队列。

(8)顶点6出队列,无邻接顶点,无需松弛操作。无元素入队列。

(9)顶点5出队列,邻接顶点有6。进行松弛操作:dist[6] = dist[5]+weight[5,6] = 17;更新dist中数组值,顶点6入队列。

(10)顶点6出队列,无邻接顶点,无需松弛操作。无元素入队列。此时队列为空,求解过程结束。得到最终结果为:

6.4 算法分析

  SPFA算法是Bellman-Ford算法的一种优化。Bellman-Ford算法的复杂度是O(ev),由于Bellman-Ford算法依次对每一条边进行松弛操作,重复n-1次后得到最短路径。SPFA算法中,如果一个顶点上没有被松弛过,那么下次就不会从这个点开始松弛。只将松弛过的点加入队列,减少了每个点的更新次数。

7 弗洛伊德(Floyd)算法

7.1 算法概述

  Floyd算法是一个经典的动态规划算法。其主要思想为:从任意顶点u到任意顶点v的最短路径不外乎2种可能,一是直接从u到v,二是从u经过若干个顶点k到v。所以,我们假设dist(u,v)为顶点u到顶点v的最短路径的距离,对于每一个顶点k,我们检查dist(u,k) + dist(k,v) < dist(u,v)是否成立,如果成立,证明从u到k再到v的路径比u直接到v的路径短,我们便设置dist(u,v) = dist(u,k) + dist(k,v),这样一来,当我们遍历完所有顶点k,dist(u,v)中记录的便是u到v的最短路径的距离。

7.2 算法流程

  (1)从任意一条单边路径开始。所有两点之间的距离是边的权,如果两点之间没有边相连,则权为无穷大。    
  (2)对于每一对顶点u和v,看看是否存在一个顶点w使得从u到w再到v比己知的路径更短。如果是更新它。

7.3 实例图解

  例如:图7.3.1所示的有向图采用Floyd算法求解最短路径。选取顶点1为源点,顶点3为终点。

数据结构与算法——图最短路径
img


  (1)选取单边路径为<1,3>,由于顶点1与顶点3距离为12。
  (2)遍历剩余顶点2、4、5、6,寻找是否有可以选做中间站的顶点,使得顶点1到顶点3路径小于12。
  (3)遍历完毕后,找到中间顶点2。选择顶点2位中间顶点,使得因此顶点1到顶点3最短路径为10。此时需要走的路径为(1,2),(2,3)。
  (4)(1,2)边路径已经为最短路径,不存在中转顶点。遍历剩余顶点寻找(2,3)之间的中转顶点,发现通过顶点4可以使得1->3路径更短,路径长度为7。以此类推,逐逐步寻找最短路径。
  例如:图7.3.1所示的有向图采用Floyd算法求解最短路径。选取顶点2为源点,顶点5为终点。
  (1)顶点2与顶点5不邻接,因此距离为INF
  (2)顶点2与顶点5可以通过顶点3中转,经过中转后距离为14。此时路径为2->3->5。
  (3)顶点2到顶点3又可以通过顶点4中转,经过转后顶点2至顶点5距离为12。此时路径为2->4->3->5。


7.4 算法分析

  弗洛伊德(Floyd)算法的核心代码如下:

for(int i = 1; i <= ni++)//枚举所有顶点,i代表顶点u

{

    for(int j = 1; j <= n; j++)//枚举所有顶点,j代表顶点v

    {

        for(int k = 1; k <= n; k++)//查找是否有中间顶点w使得从uw再到v比己知的路径更短

        {

            if(dist[j][k] >
 dist[j][i] + dist[i][k])

            {

                dist[j][k] = dist[j][i] + dist[i][k];

            }

        }

    }

}

  可以看出Floyd算法是一种暴力破解的方式获取最短路径。Floyd算法的时间复杂度为O(n^3),空间复杂度为O(n^2)。Floyd算法可以获得任意顶点对之间的最短路径。

8 结语

  最短路径问题是图论研究中的一个经典算法问题。因此针对图最短路径问题先后提出了许多算法。各类算法的应用场景不尽相同。Dijkstra算法和Bellman-Ford算法用于解决单源最短路径,而Floyd算法可以解决多源最短路径。
  Dijkstra算法适用稠密图(邻接矩阵),因为稠密图问题与顶点关系密切。Bellman-Ford算法算法适用稀疏图(邻接表),因为稀疏图问题与边关系密切。 Floyd算法在稠密图(邻接矩阵)和稀疏图(邻接表)中都可以使用。


推荐阅读

拜托,面试官别问我「布隆」了

数据结构与算法: 三十张图弄懂「图的两种遍历方式」

昨天,终于拿到了腾讯 offer

几道和「二叉树」有关的算法面试题

几道和散列(哈希)表有关的面试题

一道看完答案你会觉得很沙雕的「动态规划算法题」

几道和「堆栈、队列」有关的面试算法题

链表算法面试问题?看我就够了!


数据结构与算法——图最短路径

欢迎关注数据结构与算法——图最短路径