題意:
現在要鋪設多米諾骨牌,放置一次左倒的機率是PL,右倒的機率是PR,他們的和不超過0.5。現在用最優的鋪設方法,問鋪好n(n<=1000)張牌放置次數的期望。
解法:
感覺自己機率期望dp根本沒入門啊…
對于區間dp這方面很顯然要枚舉最後一次放牌的位置。由此就劃分成了兩個互不幹涉的區間。
然後參考了大牛的部落格:
這題關鍵狀态轉移是這樣推導出來的。
1.現在隻需放置一張牌,問放置次數的期望是多少。
2.對于區間中最後一張牌需要放k次。那麼左倒多少次?右倒多少次?
代碼:
#include<cstdio>
#include<string>
#include<cstring>
#include<iostream>
#include<cmath>
#include<algorithm>
#include<iomanip>
using namespace std;
#define all(x) (x).begin(), (x).end()
#define for0(a, n) for (int (a) = 0; (a) < (n); (a)++)
#define for1(a, n) for (int (a) = 1; (a) <= (n); (a)++)
#define mes(a,x,s) memset(a,x,(s)*sizeof a[0])
#define mem(a,x) memset(a,x,sizeof a)
#define ysk(x) (1<<(x))
typedef long long ll;
typedef pair<int, int> pii;
const int INF =;
const int maxn= ;
int n;
double PL,PR;
double dp[maxn+];
const double eps=;
int dcmp(double x)
{
if(fabs(x)<eps) return ;
else return x<?-:;
}
double DP(int x)
{
if(dcmp(dp[x])>= ) return dp[x];
if(x==) return dp[x]=;
if(x==) return dp[x]=/(-PL-PR);
dp[x]=INF;
for(int i=;i<=x;i++)
{
int le=i-,ri=x-i;
dp[x]=min(dp[x],(-PR)/(-PL-PR)*DP(le)+(-PL)/(-PL-PR)*DP(ri)+/(-PL-PR));
}
return dp[x];
}
int main()
{
std::ios::sync_with_stdio(false);
while(cin>>n&&n)
{
cin>>PL>>PR;
for0(i,n+) dp[i]=-;
cout<<fixed<<setprecision()<<DP(n)<<endl;
}
return ;
}
公式:
E[1]=11−PL−PR
左偏次數=PL1−PL−PR
右偏次數=PR1−PL−PR
E=E[左]+E[右]+11−PL−PR+PL1−PL−PRE[左]+PR1−PL−PRE[右]
= 11−PL−PR+1−PR1−PL−PRE[左]+1−PL1−PL−PRE[右]