天天看點

uva 10529 Dumb Bones 區間期望dp ★★

題意:

現在要鋪設多米諾骨牌,放置一次左倒的機率是PL,右倒的機率是PR,他們的和不超過0.5。現在用最優的鋪設方法,問鋪好n(n<=1000)張牌放置次數的期望。

解法:

感覺自己機率期望dp根本沒入門啊…

對于區間dp這方面很顯然要枚舉最後一次放牌的位置。由此就劃分成了兩個互不幹涉的區間。

然後參考了大牛的部落格:

這題關鍵狀态轉移是這樣推導出來的。

1.現在隻需放置一張牌,問放置次數的期望是多少。

2.對于區間中最後一張牌需要放k次。那麼左倒多少次?右倒多少次?

代碼:

#include<cstdio>
#include<string>
#include<cstring>
#include<iostream>
#include<cmath>
#include<algorithm>
#include<iomanip>
using namespace std;

#define all(x) (x).begin(), (x).end()
#define for0(a, n) for (int (a) = 0; (a) < (n); (a)++)
#define for1(a, n) for (int (a) = 1; (a) <= (n); (a)++)
#define mes(a,x,s)  memset(a,x,(s)*sizeof a[0])
#define mem(a,x)  memset(a,x,sizeof a)
#define ysk(x)  (1<<(x))
typedef long long ll;
typedef pair<int, int> pii;
const int INF =;
const int maxn=    ;
int n;
double PL,PR;
double dp[maxn+];
const double eps=;
int dcmp(double x)
{
    if(fabs(x)<eps)  return ;
    else return x<?-:;
}
double DP(int x)
{
    if(dcmp(dp[x])>= )  return dp[x];
    if(x==)  return dp[x]=;
    if(x==)  return dp[x]=/(-PL-PR);
    dp[x]=INF;
    for(int i=;i<=x;i++)
    {
        int le=i-,ri=x-i;
        dp[x]=min(dp[x],(-PR)/(-PL-PR)*DP(le)+(-PL)/(-PL-PR)*DP(ri)+/(-PL-PR));
    }
    return dp[x];
}
int main()
{
   std::ios::sync_with_stdio(false);
   while(cin>>n&&n)
   {
       cin>>PL>>PR;
       for0(i,n+) dp[i]=-;
       cout<<fixed<<setprecision()<<DP(n)<<endl;
   }
   return ;
}



           

公式:

E[1]=11−PL−PR

左偏次數=PL1−PL−PR

右偏次數=PR1−PL−PR

E=E[左]+E[右]+11−PL−PR+PL1−PL−PRE[左]+PR1−PL−PRE[右]

= 11−PL−PR+1−PR1−PL−PRE[左]+1−PL1−PL−PRE[右]