天天看點

用R語言實作霍夫曼編碼

可讀性極低,而且其實也沒必要用R語言寫,圖個樂罷了 

p=c(0.4,0.2,0.2,0.1,0.1)###輸入形如c(0.4,0.2,0.2,0.1,0.1)的機率向量,即每個待編碼消息的發生機率
p1=p###将機率向量另存,最後計算編碼效率要用
mazijuzhen=matrix(,nrow=length(p),ncol=length(p)-1)###碼字矩陣:第i行對應向量p的第i個分量所對應的那個待編碼消息的編碼後的碼字
group=matrix(c(1:length(p),rep(NA,length(p)*(length(p)-1))),nrow=length(p),ncol=length(p))###初始分組:每一行代表一組,每個行向量的所有分量代表此組的所有元素,初始時,有多少個待編碼消息就分多少個組,每組隻有一個待編碼消息,以整數i代表向量p的第i個分量所對應的那個待編碼消息
i=1###開始編碼
for(i in 1:(length(p)-1))
{
  orderp=order(p,decreasing = FALSE)###orderp的分量依次是:p的最小分量的下标,p的第二小分量的下标。。。
  mazijuzhen[group[orderp[1],],i]=0###給機率最小的兩個消息組編上0和1
  mazijuzhen[group[orderp[2],],i]=1
  group[min(c(orderp[1],orderp[2])),]=c(na.omit(group[min(c(orderp[1],orderp[2])),]),na.omit(group[max(c(orderp[1],orderp[2])),]),rep(NA,length(p)-length(c(na.omit(group[min(c(orderp[1],orderp[2])),]),na.omit(group[max(c(orderp[1],orderp[2])),])))))###把此次疊代的兩個消息組中組編号較大的分到組編号較小的組裡去。
  group[max(c(orderp[1],orderp[2])),]=NA###删除組編号較大的組
  p[min(c(orderp[1],orderp[2]))]=p[orderp[1]]+p[orderp[2]]###計算本次疊代得到的新的消息組的發生機率
  p[max(c(orderp[1],orderp[2]))]=NA###由于組編号較大的組被删除,是以相應删除它所對應的機率
  print("目前疊代次數")###本次疊代的結果總結
  print(i)
  print("機率向量")
  print(p)
  print("分組矩陣")
  print(group)
  print("碼字矩陣")
  print(mazijuzhen)
}
i=1###由霍夫曼編碼的特性,将所有編碼倒轉得到最終編碼
for (i in 1:length(p)) 
{
  mazijuzhen[i,]=rev(mazijuzhen[i,]) 
}
i=1###建構碼長向量
machang=c()
for (i in 1:length(p))
{
  
  machang=c(machang,length(na.omit(mazijuzhen[i,])))
}
xiaolv=-p1%*%log(p1,2)/mean(machang)###計算編碼效率
print("最終的碼字矩陣和編碼效率")
mazijuzhen
xiaolv
           

繼續閱讀