公共子序列與公共子串問題

1、公共子序列問題

網上有很多關于公共子序列問題，說的大同小異，看了很多不明白，很多都是晦澀難懂，這裡分享一個連接配接，個人覺得講述的比較明白，易懂。

<a href="http://blog.csdn.net/v_july_v/article/details/6695482" target="_blank">http://blog.csdn.net/v_july_v/article/details/6695482</a>

我這裡也簡單的把自己的了解說一下，求公共子序列問題是一個非常常見的問題，最差的方法就是暴力比對，暴力比對算法第一步求去短字元串的所有序列組合，然後從長到短一個一個的去比對時候有公共序列相同，即使使用了這樣的剪枝，該算法效率任然很低。

比較受人青睐的算法當然莫過于動态規劃了，動态規劃的核心是找到轉移方程。把複雜的問題通過轉移方程轉移到子問題。

動态規劃算法

事實上，最長公共子序列問題也有最優子結構性質。

記:

Xi=﹤x1，⋯，xi﹥即X序列的前i個字元 (1≤i≤m)（字首） Yj=﹤y1，⋯，yj﹥即Y序列的前j個字元 (1≤j≤n)（字首）

假定Z=﹤z1，⋯，zk﹥∈LCS(X , Y)。

若xm=yn（最後一個字元相同），則不難用反證法證明：該字元必是X與Y的任一最長公共子序列Z（設長度為k）的最後一個字元，即有zk = xm = yn 且顯然有Zk-1∈LCS(Xm-1 , Yn-1)即Z的字首Zk-1是Xm-1與Yn-1的最長公共子序列。此時，問題化歸成求Xm-1與Yn-1的LCS（LCS(X , Y)的長度等于LCS(Xm-1 , Yn-1)的長度加1）。

若xm≠yn，則亦不難用反證法證明：要麼Z∈LCS(Xm-1, Y)，要麼Z∈LCS(X , Yn-1)。由于zk≠xm與zk≠yn其中至少有一個必成立，若zk≠xm則有Z∈LCS(Xm-1 , Y)，類似的，若zk≠yn 則有Z∈LCS(X , Yn-1)。此時，問題化歸成求Xm-1與Y的LCS及X與Yn-1的LCS。LCS(X , Y)的長度為：max{LCS(Xm-1 , Y)的長度, LCS(X , Yn-1)的長度}。

由于上述當xm≠yn的情況中，求LCS(Xm-1 , Y)的長度與LCS(X , Yn-1)的長度，這兩個問題不是互相獨立的：兩者都需要求LCS(Xm-1，Yn-1)的長度。另外兩個序列的LCS中包含了兩個序列的字首的LCS，故問題具有最優子結構性質考慮用動态規劃法。

也就是說，解決這個LCS問題，你要求三個方面的東西：1、LCS（Xm-1，Yn-1）+1；2、LCS（Xm-1，Y），LCS（X，Yn-1）；3、max{LCS（Xm-1，Y），LCS（X，Yn-1）}。

是以解決這個問題的動态轉移方程即：

if xm==yn LCS(Xm,Yn)= LCS（Xm-1，Yn-1）+1;

if xm!=yn LCS(Xm,Yn)= max{LCS（Xm-1，Yn),LCS（Xm，Yn-1)};

代碼如下：

<a></a>

運作結果

2、最大公共子串

首先區分下公共字串和公共子序列的差別，公共子序列是在整個字元串中隻要按照順序可以不用連續的，但是公共子串是指必須連續的字元串，舉個例子

公共子序列是 BCBA

公共字串是 AB

求公共字串比公共子序列稍微簡單了一些，如果上邊所述，公共子串也可以用暴力比對方法，求出較短的字元串的所有子串，然後可以從長到短利用kmp字元串比對算法求出公共子串，同時還添加了剪枝，但是字樣的暴力比對效率始終是比較差的，最好的方法還是使用動态規劃。

根據上邊公共子序列動态規劃的方法分析，其實我們可以發現公共子串和公共子序列非常類似

隻是在狀态轉移方程是稍有不同，

事實上，最長公共子串問題也有最優子結構性質。

若xm=yn（最後一個字元相同），則不難用反證法證明：該字元必是X與Y的任一最長公共子串Z（設長度為k）的最後一個字元，即有zk = xm = yn 且顯然有Zk-1∈LCS(Xm-1 , Yn-1)即Z的字首Zk-1是Xm-1與Yn-1的最長公共子串。此時，問題化歸成求Xm-1與Yn-1的LCS（LCS(X , Y)的長度等于LCS(Xm-1 , Yn-1)的長度加1）。

重要的是這裡的不同：

若xm≠yn，由于zk≠xm與zk≠yn 那麼說明之前相同的字元串也不能連接配接起來，此時的LCS(X,Y) 的長度回歸到0重新找最長的公共子串。

是以：關于最長公共子串的動态轉移方程為：

if xm!=yn LCS(Xm,Yn)= 0;

結果：

本文轉自NewPanderKing51CTO部落格，原文連結：http://www.cnblogs.com/newpanderking/p/3946159.html ，如需轉載請自行聯系原作者

公共子序列與公共子串問題

繼續閱讀

Codeforces 1417 D. Make Them Equal(思維+構造)

查找算法之二分查找查找算法之二分查找

查找算法學習之二分查找（Python版本）——BinarySearch

CQ V1.0分詞bates(基于雙數組tire樹)—應該是目前最快的中文分詞算法

Command Network(POJ 3164)---定根最小樹形圖模闆題題目描述輸入格式輸出格式輸入樣例輸出樣例分析源程式

開源低帶寬語音編解碼器

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

C++ 第十五周報告1--《冒泡法排序》

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

hdu7108哈希