天天看点

行程编码压缩算法

1. 算法说明

RLE(Run Length Encoding行程编码)算法是一个简单高效的无损数据压缩算法,其基本思路是把数据看成一个线性序列,而这些数据序列组织方式分成两种情况:一种是连续的重复数据块,另一种是连续的不重复数据块。对于连续的重复数据快采用的压缩策略是用一个字节(我们称之为数据重数属性)表示数据块重复的次数,然后在这个数据重数属性字节后面存储对应的数据字节本身,例如某一个文件中有如下的数据序列AAAAA,在未压缩之前占用5个字节,而如果使用了压缩之后就变成了5A,只占用两个字节,对于连续不重复的数据序列,表示方法和连续的重复数据块序列的表示方法一样,只不过前面的数据重数属性字节的内容为1。一般的这里的数据块取一个字节,这篇文章中数据块都默认为一个字节。具体来讲,字符串的编码规则如下:在字符串中,2~9个相同的字符组成的子字符串用2个字符来编码表示。第1个字符是这一字符串的长度,为2~9。第2个字符是相同字符的值。如果一个字符串存在相同字符且多于9个的子串,就先对前9个字符进行编码,然后对其余相同字符组成的子串采用相同方法进行编码。例如AAAAAABCCCC编码为6A1B14C。在字符串中,如果存在某个子串,其中没有一个字符连续重复出现,就表示为以字符1开始,后面跟着这一子串,再以字符结束。如果在字符串中存在只有1个字符1出现的子串,则以两个字符1作为输出,例如12344编码为11123124。

Input

输入一个字符串。

Output

输出RLE编码后的字符串。

Sample Input

AAAAAABCCCC12344

Sample Output

6A1B14C11123124

2. 函数实现

#include <stdio.h>
#include <string.h>
int main()
{
    char str[] = {'\0'};
    char result[] = {'\0'};
    int number[] = {};
    scanf("%s", str);
    int i;
    char c = '\0';
    int flag =;
    int nums = ;
    int j=, k=;
    for (i=; i<strlen(str); i++)
    {
        if (str[i] == str[i+]) //前后两者相同
        {
            if (nums==) //当前达到9
            {
                result[j++] = str[i];
                number[k++] = nums;
                nums = ;
            }
            nums ++;
        }
        else
        {
            result[j++] = str[i];
            number[k++] = nums;
            nums = ;
        }
    }

    for (i=; i<j; i++)
    {
        if (number[i]!=)
        {
            if (flag==)
            {
                printf("1");
                flag = ;
            }
            printf("%d%c", number[i], result[i]);
        }
        else
        {
            if (flag == )
            {
                printf("1");
                flag = ;
            }

            if (result[i]=='1')
            {
                printf("11");
            }
            else
            {
                printf("%c", result[i]);
            }

        }

    }

    return ;
}
           

继续阅读