天天看点

《编程之美》1.6 饮料供货1 书中的算法分析2 算法分析3 总结

1 书中的算法分析

在微软亚洲研究院上班,大家早上来的第一件事是干啥呢?查看邮件?No,是去水房拿饮料:酸奶,豆浆,绿茶、王老吉、咖啡、可口可乐……(当然,还是有很多同事把拿饮料当做第二件事)。

管理水房的阿姨们每天都会准备很多的饮料给大家,为了提高服务质量,她们会统计大家对每种饮料的满意度。一段时间后,阿姨们已经有了大批的数据。某天早上,当实习生小飞第一个冲进水房并一次拿了五瓶酸奶、四瓶王老吉、三瓶鲜橙多时,阿姨们逮住了他,要他帮忙。

从阿姨们统计的数据中,小飞可以知道大家对每一种饮料的满意度。阿姨们还告诉小飞,STC(Smart Tea Corp.)负责给研究院供应饮料,每天总量为V。STC很神奇,他们提供的每种饮料之单个容量都是2的方幂,比如王老吉,都是23=8升的,可乐都是25=32升的。当然STC的存货也是有限的,这会是每种饮料购买量的上限。统计数据中用饮料名字、容量、数量、满意度描述每一种饮料。

那么,小飞如何完成这个任务,求出保证最大满意度的购买量呢?

分析与解法

【解法一】

我们先把这个问题“数学化”一下吧。

假设STC共提供n种饮料,用(Si、Vi、Ci、Hi、Bi)(对应的是饮料名字、容量、可能的最大数量、满意度、实际购买量)来表示第i种饮料(i = 0, 1,…, n-1),其中可能的最大数量指如果仅买某种饮料的最大可能数量,比如对于第i中饮料Ci=V/Vi。

基于如上公式:

饮料总容量为

《编程之美》1.6 饮料供货1 书中的算法分析2 算法分析3 总结

总满意度为

《编程之美》1.6 饮料供货1 书中的算法分析2 算法分析3 总结

那么题目的要求就是,在满足条件

《编程之美》1.6 饮料供货1 书中的算法分析2 算法分析3 总结

的基础上,求解

《编程之美》1.6 饮料供货1 书中的算法分析2 算法分析3 总结

对于求最优化的问题,我们来看看动态规划能否解决。用Opt(V', i)表示从第i, i+1, i+2, …, n-1种饮料中,算出总量为V'的方案中满意度之和的最大值。

因此,Opt(V, 0)就是我们要求的值。

那么,我们可以列出如下的推导公式:Opt (V', i) = max { k* Hi + Opt(V' - Vi * k, i+1)}(k = 0, 1, …, Ci,i =0, 1, …, n-1)。

即:最优化的结果 = 选择第k种饮料×满意度+减去第k种饮料×容量的最优化结果根据这样的推导公式,我们列出如下的初始边界条件:

Opt(0, n)= 0,即容量为0的情况下,最优化结果为0。

Opt(x, n)= -INF(x != 0)(–INF为负无穷大),即在容量不为0的情况下,把最优化结果设为负无穷大,并把它作为初值。

那么,根据以上的推导公式,就不难列出动态规划求解代码,如下所示:

代码清单1-9

int Cal(intV, int type)
{
    opt[0][T] = 0;// 边界条件
    for(int i = 1; i <=V; i++)// 边界条件
    {
       opt[i][T] = -INF;
    }
    for(int j = T - 1; j>= 0; j--)
    {
       for(int i = 1; i <= V; i++)
        {
           opt[i][j] = -INF;
           for(int k = 0; k <= C[j];k++)      // 遍历第j种饮料选取数量k
           {
               if(i < k * V[j])
               {
                   break;
               }
               int x = opt[i - k * V[j]][j + 1];
               if(x != -INF)
               {
                   x += H[j] * k;
                   if(x > opt[i][j])
                   {
                       opt[i][j] = x;
                   }
               }
           }
        }
    }
    return opt[V][0];
}
           

在上面的算法中,空间复杂度为O(V*N),时间复杂度约为O(V*N*Max(Ci))。

因为我们只需要得到最大的满意度,则计算opt[i][j]的时候不需要opt[i][j+2],只需要opt[k][j+1](0<=k<=V),所以空间复杂度可以降为O(v)。

【解法二】

应用上面的 动态规划法可以得到结果,那么是否有可能进一步地提高效率呢?我们知道动态规划算法的一个变形是备忘录法,备忘录法也是用一个表格来保存已解决的子问题的 答案,并通过记忆化搜索来避免计算一些不可能到达的状态。具体的实现方法是为每个子问题建立一个记录项。初始化时,该纪录项存入一个特殊的值,表示该子问 题尚未求解。在求解的过程中,对每个待求解的子问题,首先查看其相应的纪录项。若记录项中存储的是初始化时存入的特殊值,则表示该子问题是第一次遇到,此 时计算出该子问题的解,并保存在其相应的记录项中。若记录项中存储的已不是初始化时存入的初始值,则表示该子问题已经被计算过,其相应的记录项中存储的是 该子问题的解答。此时只需要从记录项中取出该子问题的解答即可。

因此,我们可以应用备忘录法来进一步提高算法的效率。

代码清单1-10

int opt[V + 1][T + 1];      // 子问题的记录项表,假设从i到T种饮料中,
                                 // 找出容量总和为V’的一个方案,快乐指数最多能够达到
                                       // opt(V',i,T-1),存储于opt[V’][i],
                                      // 初始化时opt中存储值为-1,表示该子问题尚未求解。
int Cal(intV, int type)
{
    if(type == T)
    {
        if(V== 0)
           return 0;
        else
           return -INF;
    }
    if(V < 0)
       return -INF;
    else if(V == 0)
       return 0;
    else if(opt[V][type] !=-1)
       return opt[V][type];    // 该子问题已求解,则直接返回子问题的解;
                               // 子问题尚未求解,则求解该子问题
    int ret = -INF;
    for(int i = 0; i <=C[type]; i++)
    {
       int temp = Cal(V– i * C[type], type + 1);
       if(temp != -INF)
       {
           temp += H[type] * i;
           if(temp > ret)
           ret = temp;
       }
    }
    return opt[V][type] =ret;
}
           

【解法三】

请注意这个题目的限制条件,看看它能否给我们一些特殊的提示。

我们把信息重新整理一下,按饮料的容量(单位为L)排序:

Volume TotalCount Happiness
20 TC0_0 H0_0
20 TC0_n0 H0_n0
21 TC1_0 H1_0
 …
2M TCM_0 HM_0
 …  …

假设最大容量为2 000L。一开始,如果V%(21)非零,那么,我们肯定需要购买20L容量的饮料,至少一瓶。在这里可以使用贪心规则,购买快乐指数最高的一瓶。除去这个,我们只要再购买总量(V-20) L的饮料就可以了。这时,如果我们要购买21L容量的饮料怎么办呢?除了21L容量里面快乐指数最高的,我们还应该考虑,两个容量为20L的饮料组合的情 况。其实我们可以把剩下的容量为20L的饮料之快乐指数从大到小排列,并用最大的两个快乐指数组合出一个新的“容量为2L”的饮料。不断地这样使用贪心原 则,即得解。这是不是就简单了很多呢?

2 算法分析

2.1 动态规划算法

没有悬念,优化问题就用动态规划、贪心算法、分支限界轮番上阵就好了。设Opt(V’,i)表示从i到n-1种饮料中,Ci为第i种饮料可能的最大数量,算出总量为V’的方案中满意度之和的最大值。那么递归式就应该是:

Opt(V’,i)=max{ k * Hi+Opt(V’-Vi * k,i+1)}(k=0,1,2…,Ci,i=0,1,2…,n-1)

这里我觉得需要说明给出的饮料组合最终可以组合出V。

2.2 贪心算法

书中的贪心解法似曾相识,把信息按照饮料的容量排序(其中设我们有n0种容量为20的饮料):

Volume TotalCount Happiness
20 TC0_0 H0_0
20 TC0_n0 H0_n0
21 TC1_0 H1_0
 …
2M TCM_0 HM_0
 …  …

然后按照下面的顺序进行贪心选择:

(1) 饮料总量为1,从容量为20的饮料中选出快乐指数最大的。

(2) 饮料总量为2,从容量为21的饮料中选出快乐指数最大的(设为H1),与容量为20的饮料中快乐指数最大的(设为H0),比较H1和2* H0,取出其中最大者为当前最佳选择

(3) 继续进行下去,直到求出Opt(V,0)

粗看一下,有些似曾相识。我们在买书问题的时候也曾面临将买书计划拆分,然后查表进行贪心选择。然而买书问题每次选择至多选M本书,而且每次选择只影响下一次选择,所以只需要把2M进行有限的拆分即可。

而本题则不尽相同,对于某种容量V’(以V’=11为例)来说,有两个问题:

1. 首先,我们需要察看所有拆分的可能性,找出其中最大者作为本次贪心选择的结果。其中,由于“每种饮料的单位容量都是2的方幂”,所以拆分结果仅考虑用小于V’的2的方幂来进行组合,即(计算式1)11=8+2+1,4+4+2+1,4+2+2+2+1,….,1+1+…+1。可以看到,对于V’我们至少可以“拆”出V’种组合(或许更多),即便我们把每次的计算结果用表格保存起来,我们的查找次数也至少是Ω(1+2+…+V’=V’2),空间复杂度也很高,并没有如数中说“简单很多”。而且,如果取消“每种饮料的单位容量都是2的方幂”的限制,拆分的结果就会变成(计算式2)11=10+1,9+2,…,5+5,5+5+1,5+4+2,…..,导致查找次数进一步增加。

2.  其次,让我们回到贪心选择的定义上来。由于贪心选择性,贪心算法的过程是每次选择都选取当前看来最好的结果,使得当达到最终状态时的结果刚好是最优解。而我们再看V’=11的例子,假设最优解是4+4+2+1,则我们曾经计算过的8就不是最优解的一部分,这就和贪心算法的精神不符,所以这个方法其实还是动态规划。

3 总结

动态规划解法很好,贪心算法有待商榷。其实这是正常的,因为通常情况下使用贪心算法的难点在于证明贪心选择性的存在,鉴于这本书的定位,我们不能苛责更多。但是这个问题和上一个问题(买书折扣问题)的贪心算法我觉得都过于草率。如果想让这本书成为经典,“微软面试”的噱头是远远不够的,精益求精的态度至关重要,有时候真的没必要把Deadline设置的那么紧迫,偶尔跳票追求质量也是理所应当,看看人家暴雪的“星际争霸2”跳票这么多年就知道了…….