数据结构与算法--关键路径

关键路径与无环加权有向图的最长路径

现在考虑一个这样的问题：你今天事情比较多，要洗衣服、做作业还要烧水洗澡，之后出去找朋友玩。假设洗衣服要20分钟，烧水要30分钟，做作业的话你把朋友做好的带回来抄，只需要10分钟。你想能早些去找朋友，但在那之前又必须将那些事做完，你要怎么安排呢？很容易想到，这三者同时进行：打好水开始烧水，衣服扔进洗衣机，回书桌抄作业...20分钟后作业写完了，衣服也洗好了，水还有10分钟水才烧开，利用这时间把洗好的衣服晾晒好，差不多水也烧开了，好了最后去洗澡。简直一气呵成，这是我们能花费的最少时间了，在这个例子中刚好等于所有任务中持续时间最长的那个。（你做完了作业才想起来去烧水，花费不止半小时吧）

由此引申出一个更为广泛的问题，给定一组需要完成的任务和每个任务所需的时间，以及一组关于任务完成的先后次序的优先级限制。在满足限制条件的前提下应该如何在若干相同的处理器上（数量不限，可并行处理多个任务）安排任务并在最短的时间内完成所有的任务？

此问题的提出主要是为了解决并行任务调度，使得完成所有任务的总时间最短。待处理的任务总数可能成百上千，因此需要一个算法帮我们快速规划一个调度方案：按照怎样的顺序执行这些任务，哪些任务可以同时处理，如何使得耗费的总时间最短？正好存在一种叫做“关键路径”的方法可以证明这个问题与无环加权有向图的最长路径问题等价。

关键路径：把路径上各个任务所持续的时间之和称为路径长度，从起点到终点的所有路径中，具有最长路径长度的路径称为关键路径，关键路径中的各个任务称为关键任务。上面的例子中，烧水就是个关键任务。

首先，按照关键路径的顺序执行任务，一定能保证所有的任务都能完成，且此时花费的总时间最短。有些活动顺序进行，有些活动并行进行。从起点到各个顶点，以至从起点到终点的有向路径可能不止一条，这些路径的长度也不尽相同。这若干条从起点到终点的路径可以看做一个生产过程的几条不同的生产线，必须每条生产线都完工，整个生产过程才算结束，也就是不论如何你都得等那条花费时间最长的流水线做完，整个生产才可能完工。现在由于可以同时处理多个任务，在花费时间最长的流水线工作过程中，其他流水线一定会提前完工（最多也就是同时），因此花费时间最长的流水线做完后，整个工程也随之竣工了。假设花费时间最长的那条流水线所用的时间是M，这就是说，不管怎么安排，都需要至少M的时间才能竣工，而这已经是最短时间了。

再举个例子，你和朋友们约好去某个地方聚餐。有些朋友到的比较早，有些朋友到得比较晚，但是不管怎么样，我们都要等到最后一个朋友到目的地，这样大家才算是聚齐了。

说了半天，求并行任务调度中的关键路径，实际上就是求从起点到终点的最长路径。

通过求解最长路径得到关键路径

通过上面的讨论，现在只需求最长路径，就能得到关键路径。我们知道任务调度必须要求图是无环的，因此可以使用求无环加权有向图的最短路径的方法求最长路径。

具体方法是：复制原图得到一个副本，将副本的所有边的权重取相反数，求副本的最短路径实际上就是原图的最长路径。

或者一个更为简单的方法：修改边的放松方法。改为distTo[v] + edge.weight() > distTo[w]（求最短路径的不等号是<），即：有比原来到w更长的路径就更新。同时初始化的时候，distTo[i]从原来的正无穷改成负无穷。

求无环加权有向图的最短路径，可以按照拓补排序依次放松顶点。详细地见我上一遍文章，只需改前述两个地方，就能求得最长路径。

package Chap7;

import java.util.LinkedList;

/**
 * 求无环有向图的最长路径
 */
public class AcycliLP {
    private DiEdge[] edgeTo;
    private double[] distTo;

    public AcycliLP(EdgeWeightedDiGraph<?> graph, int s) {
        edgeTo = new DiEdge[graph.vertexNum()];
        distTo = new double[graph.vertexNum()];

        for (int i = 0; i < graph.vertexNum(); i++) {
            // 1. 改成了负无穷
            distTo[i] = Double.NEGATIVE_INFINITY;
        }

        distTo[s] = 0.0;
        // 以上是初始化
        TopoSort topo = new TopoSort(graph);

        if (!topo.isDAG()) {
            throw new RuntimeException("该图存在有向环，本算法无法处理！");
        }

        for (int v : topo.order()) {
            relax(graph, v);
        }
    }

    private void relax(EdgeWeightedDiGraph<?> graph, int v) {
        for (DiEdge edge : graph.adj(v)) {
            int w = edge.to();
            // 2、若路径更长就更新
            if (distTo[v] + edge.weight() > distTo[w]) {
                distTo[w] = distTo[v] + edge.weight();
                edgeTo[w] = edge;
            }
        }
    }

    public double distTo(int v) {
        return distTo[v];
    }

    public boolean hasPathTo(int v) {
        return distTo[v] != Double.NEGATIVE_INFINITY;
    }

    public Iterable<DiEdge> pathTo(int v) {
        if (hasPathTo(v)) {
            LinkedList<DiEdge> path = new LinkedList<>();
            for (DiEdge edge = edgeTo[v]; edge != null; edge = edgeTo[edge.from()]) {
                path.push(edge);
            }
            return path;
        }
        return null;
    }
}

好，可以求得关键路径了。现在来看一个任务调度的例子，如何利用上面的实现来安排任务。

现在要先将其转换为图。由于有些工程不好看出哪个任务是最先开工的，哪个是收尾的任务（比如上图）。在不同的任务表中，每个任务都可能成为起点或终点。为了可以应付各种任务表，不妨设置虚拟的起点和终点。因为每个任务都可能最先开工，所以设置一个虚拟起点可以指向图中所有顶点，且权值都为0；因为每个顶点都可能作为收尾任务，因此所有顶点指向一个虚拟的终点，权值是这些顶点代表的任务所持续的时间。这样我们也不用在乎任务表中哪个任务最先开工、最后收尾的关系够不够明确了，设置了虚拟起点和终点后，只要求得从起点到终点的最长路径，中间走过的路径的就是各个任务执行的顺序。

加入虚拟顶点后，上面的任务表其实就是下图。

各条从s到t的路径中（想象成各条生产线），找出最长的那条（费时最长的那条生产线），这条0 -> 9 -> 6 -> 8 -> 2就是关键路径，按照这个顺序执行任务就能使得完成整个工程总时间最短。

我们用代码测试一下。

package Chap7;

public class CPM {
    private AcycliLP lp;
    private int s; // 虚拟的起点
    private int t; // 虚拟的终点
    private int jobsNum; // 任务个数

    public CPM(double[] jobDuration, int[][] successorAfter) {
        jobsNum = jobDuration.length;
        // 设置两个虚拟顶点，代表起点和终点
        EdgeWeightedDiGraph<?> graph = new EdgeWeightedDiGraph<>(jobsNum + 2);

        s = jobDuration.length; // 起点
        t = s + 1; // 终点

        for (int i = 0; i < jobsNum; i++) {
            // 每个顶点都可能成为最先开工的，所以虚拟起点指向所有顶点，且费时都为0
            graph.addDiEdge(new DiEdge(s, i, 0.0));
            // 每个顶点都可能成为工程收尾的活动，所有顶点都指向该虚拟终点，费时自然是每个活动所持续的时间
            graph.addDiEdge(new DiEdge(i, t, jobDuration[i]));
            // 任务i必须在任务j之前完成， 即加入i -> j的有向边
            for (int j = 0; j < successorAfter[i].length; j++) {
                int successor = successorAfter[i][j];
                graph.addDiEdge(new DiEdge(i, successor, jobDuration[i]));
            }
            // 找到到每个活动的最长路径
            lp = new AcycliLP(graph, s);
        }

    }

    public void printJobExecuteOrder() {
        System.out.println("各任务开始时间表：");
        for (int i = 0; i < jobsNum; i++) {
            System.out.println(i + ": " + lp.distTo(i));
        }
        System.out.println("\n按照以下顺序执行任务，开始时间相同的任务同时执行。");
        for (DiEdge edge : lp.pathTo(t)) {
            // 遇到起点不打印箭头
            if (edge.from() == s) {
                System.out.print(edge.to());
            }
            // 最后一个任务在前一个顶点的就打印过了，遇到最后一条边换行就行
            else if (edge.to() == t) {
                System.out.println();
            } else {
                System.out.print(" -> " + edge.to());
            }
        }

        System.out.println("总共需要" + lp.distTo(t));
    }

    public static void main(String[] args) {
        // 每个任务的持续时间
        double[] duration = {41.0, 51.0, 50.0, 36.0, 38.0, 45.0, 21.0, 32.0, 32.0, 29.0};
        // 必须在这些任务之前完成，如successorAfter[0]表示任务0的后继任务1、7、9，也就是说0必须在1、7、9之前做完
        // {} 表示该任务不要求在哪个任务执行前就得完成，说明它可能是作为收尾的任务
        int[][] successorAfter = {{1, 7, 9}, {2}, {}, {}, {}, {}, {3, 8}, {3, 8}, {2}, {4, 6}};
        CPM cpm = new CPM(duration, successorAfter);
        cpm.printJobExecuteOrder();
    }

}

根据任务表，给图增加边。

虚拟起点到所有顶点的边，且权值为0；
所有顶点到虚拟终点的边，且权值为顶点任务持续时间。
某任务v必须在一些任务之前完成的边，且权值为任务v的持续时长。比如0必须在1、7、9之前，则增加0 -> 1，0 -> 7，0 -> 9边，且权值都为任务0的持续时长。

接下来通过AcycliLP类求得关键路径，distTo[i]就表示i任务的开始时间，distTo[t]表示做完整个工程需要的最短时间；pathTo[i]表示执行到任务i的关键路径，自然pathTo[t]就是整个工程的关键路径。

上面的代码会打印如下结果：

各任务开始时间表：
0: 0.0
1: 41.0
2: 123.0
3: 91.0
4: 70.0
5: 0.0
6: 70.0
7: 41.0
8: 91.0
9: 41.0

按照以下顺序执行任务，开始时间相同的任务同时执行。
0 -> 9 -> 6 -> 8 -> 2
总共需要173.0

可以清楚地看到每个任务应该在什么时刻开始动工，只要按照0 -> 9 -> 6 -> 8 -> 2这样顺序执行就好。而且，有些任务开始时间一样，表示我们应该同时执行它们以节省时间。所以最后的方案是：0、5最先并同时执行，只要0做完了，就开始同时执行1、7、9，只要9做完了立刻同时执行4、6，一旦6做完了同时执行3、8，8只要完工紧接着做2，最后等待2也终于做完，整个工程竣工！需要的最短时间为173.0。

关键路径中的任务都是做完后就立刻执行下一个的（比如0执行完立刻执行9，9完工立刻执行6...），不用等待和它一起开工的其他任务也做完，因为这些任务在花费最长时间的这条关键路径上，它们肯定能在这期间做完的；而且关键路径上到每个关键任务的路径已经是最长了，在执行某个关键任务时，必须在它之前执行的那些任务必定已经完成，因此各个关键任务之间是不会有空闲和等待时间的。如下图是上面任务表的执行流程

0 -> 9 -> 6 -> 8 -> 2一气呵成，中间毫无停顿。而且其他任务在这条生产线执行过程中均已完成！

by @sunhaiyu

2017.9.29

最后编辑于：2017.12.10 20:48:44

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,723评论 6赞 481
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,485评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 152,998评论 0赞 344
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,323评论 1赞 279
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,355评论 5赞 374
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,079评论 1赞 285
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,389评论 3赞 400
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,019评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,519评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,971评论 2赞 325
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,100评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,738评论 4赞 324
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,293评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,289评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,517评论 1赞 262
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,547评论 2赞 354
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,834评论 2赞 345

数据结构与算法--关键路径

数据结构与算法--关键路径

关键路径与无环加权有向图的最长路径

通过求解最长路径得到关键路径

推荐阅读更多精彩内容