天天看点

uva 10529 Dumb Bones 区间期望dp ★★

题意:

现在要铺设多米诺骨牌,放置一次左倒的概率是PL,右倒的概率是PR,他们的和不超过0.5。现在用最优的铺设方法,问铺好n(n<=1000)张牌放置次数的期望。

解法:

感觉自己概率期望dp根本没入门啊…

对于区间dp这方面很显然要枚举最后一次放牌的位置。由此就划分成了两个互不干涉的区间。

然后参考了大牛的博客:

这题关键状态转移是这样推导出来的。

1.现在只需放置一张牌,问放置次数的期望是多少。

2.对于区间中最后一张牌需要放k次。那么左倒多少次?右倒多少次?

代码:

#include<cstdio>
#include<string>
#include<cstring>
#include<iostream>
#include<cmath>
#include<algorithm>
#include<iomanip>
using namespace std;

#define all(x) (x).begin(), (x).end()
#define for0(a, n) for (int (a) = 0; (a) < (n); (a)++)
#define for1(a, n) for (int (a) = 1; (a) <= (n); (a)++)
#define mes(a,x,s)  memset(a,x,(s)*sizeof a[0])
#define mem(a,x)  memset(a,x,sizeof a)
#define ysk(x)  (1<<(x))
typedef long long ll;
typedef pair<int, int> pii;
const int INF =;
const int maxn=    ;
int n;
double PL,PR;
double dp[maxn+];
const double eps=;
int dcmp(double x)
{
    if(fabs(x)<eps)  return ;
    else return x<?-:;
}
double DP(int x)
{
    if(dcmp(dp[x])>= )  return dp[x];
    if(x==)  return dp[x]=;
    if(x==)  return dp[x]=/(-PL-PR);
    dp[x]=INF;
    for(int i=;i<=x;i++)
    {
        int le=i-,ri=x-i;
        dp[x]=min(dp[x],(-PR)/(-PL-PR)*DP(le)+(-PL)/(-PL-PR)*DP(ri)+/(-PL-PR));
    }
    return dp[x];
}
int main()
{
   std::ios::sync_with_stdio(false);
   while(cin>>n&&n)
   {
       cin>>PL>>PR;
       for0(i,n+) dp[i]=-;
       cout<<fixed<<setprecision()<<DP(n)<<endl;
   }
   return ;
}



           

公式:

E[1]=11−PL−PR

左偏次数=PL1−PL−PR

右偏次数=PR1−PL−PR

E=E[左]+E[右]+11−PL−PR+PL1−PL−PRE[左]+PR1−PL−PRE[右]

= 11−PL−PR+1−PR1−PL−PRE[左]+1−PL1−PL−PRE[右]