行程編碼壓縮算法

2023-07-30 18:29:03

1. 算法說明

RLE（Run Length Encoding行程編碼）算法是一個簡單高效的無損資料壓縮算法，其基本思路是把資料看成一個線性序列，而這些資料序列組織方式分成兩種情況：一種是連續的重複資料塊，另一種是連續的不重複資料塊。對于連續的重複資料快采用的壓縮政策是用一個位元組（我們稱之為資料重數屬性）表示資料塊重複的次數，然後在這個資料重數屬性位元組後面存儲對應的資料位元組本身，例如某一個檔案中有如下的資料序列AAAAA，在未壓縮之前占用5個位元組，而如果使用了壓縮之後就變成了5A，隻占用兩個位元組，對于連續不重複的資料序列，表示方法和連續的重複資料塊序列的表示方法一樣，隻不過前面的資料重數屬性位元組的内容為1。一般的這裡的資料塊取一個位元組，這篇文章中資料塊都預設為一個位元組。具體來講，字元串的編碼規則如下：在字元串中，2～9個相同的字元組成的子字元串用2個字元來編碼表示。第1個字元是這一字元串的長度，為2～9。第2個字元是相同字元的值。如果一個字元串存在相同字元且多于9個的子串，就先對前9個字元進行編碼，然後對其餘相同字元組成的子串采用相同方法進行編碼。例如AAAAAABCCCC編碼為6A1B14C。在字元串中，如果存在某個子串，其中沒有一個字元連續重複出現，就表示為以字元1開始，後面跟着這一子串，再以字元結束。如果在字元串中存在隻有1個字元1出現的子串，則以兩個字元1作為輸出，例如12344編碼為11123124。

Input

輸入一個字元串。

Output

輸出RLE編碼後的字元串。

Sample Input

AAAAAABCCCC12344

Sample Output

6A1B14C11123124

2. 函數實作

#include <stdio.h>
#include <string.h>
int main()
{
    char str[] = {'\0'};
    char result[] = {'\0'};
    int number[] = {};
    scanf("%s", str);
    int i;
    char c = '\0';
    int flag =;
    int nums = ;
    int j=, k=;
    for (i=; i<strlen(str); i++)
    {
        if (str[i] == str[i+]) //前後兩者相同
        {
            if (nums==) //目前達到9
            {
                result[j++] = str[i];
                number[k++] = nums;
                nums = ;
            }
            nums ++;
        }
        else
        {
            result[j++] = str[i];
            number[k++] = nums;
            nums = ;
        }
    }

    for (i=; i<j; i++)
    {
        if (number[i]!=)
        {
            if (flag==)
            {
                printf("1");
                flag = ;
            }
            printf("%d%c", number[i], result[i]);
        }
        else
        {
            if (flag == )
            {
                printf("1");
                flag = ;
            }

            if (result[i]=='1')
            {
                printf("11");
            }
            else
            {
                printf("%c", result[i]);
            }

        }

    }

    return ;
}

行程編碼壓縮算法

1. 算法說明

2. 函數實作

繼續閱讀

查找算法之二分查找查找算法之二分查找

查找算法學習之二分查找（Python版本）——BinarySearch

CQ V1.0分詞bates(基于雙數組tire樹)—應該是目前最快的中文分詞算法

Command Network(POJ 3164)---定根最小樹形圖模闆題題目描述輸入格式輸出格式輸入樣例輸出樣例分析源程式

開源低帶寬語音編解碼器

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

C++ 第十五周報告1--《冒泡法排序》

筆試面試題目：滑動視窗(二)

Netty——自定義協定解決TCP粘包拆包問題什麼是TCP粘包拆包自定義協定解決拆包粘包問題

資料結構與算法（27）——排序（二）

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

hdu7108哈希