字符串hash算法

字符串hash是指将一个字符串s映射为一个，使得该整数可以尽可能唯一的代表也就是唯一标识。换言之，如果两个字符的hash值相同那么我们可以认为两者相同。

字符串hash算法，附图片理解字符串hash算法

如果，我们对字母a~z进行一些的处理(如上图),但是aba的hash值和baa的hash值是一样的，这样子不可以唯一区分。

我们就要想办法将这个hash值变为唯一区分的

字符串hash算法，附图片理解字符串hash算法

这个图前面序列之和*8等于后面序列之和。

重点来了：
	我们通过乘以某个数字不断增大。某一个段相同序列必定是相同一段的倍数。
	只要知道这个倍数就知道了这个序列是不是一样的。

字符串hash算法，附图片理解字符串hash算法

如果不记录倍数的话，只我们容易出现这种情况，这种翻车情况还是有。

字符串hash算法，附图片理解字符串hash算法

但是我们如果以指数相加，必须取余某一个数字，但是这个增加了翻车机率。

我们希望我们有的数，尽可能的出现差错的可能性小一点。
	其实很容易猜到如果选取2作为作为倍数进行去的话，很有可能出现相同hash值不同的列。
	资料说：一般来说P最好为素数，而且大一点好，基本上都是设置成为133左右的数字，模尽可能取大一点，翻车概率会小很多。

#include<iostream>
#include<algorithm>
using namespace std;
const long long int N = 1500000;
unsigned long long int pownum[N], hashnum[N];//前面一个是倍数,后面是折算值
//用unsigned可以自动取模。2^64-1
int base = 133;
unsigned long long get(int l, int r) {      //求一段区间的哈希值
	return hashnum[r] - hashnum[l - 1] * pownum[r - l + 1];
}

int main()
{
	char str[N];
	scanf("%s", str + 1);
	pownum[0] = 1;
	for (int i = 1; i < strlen(str); i++)
	{
		hashnum[i] = (str[i] - 'a' + 1) + hashnum[i-1] * base;
		pownum[i] = pownum[i-1] * base;
	}

}

字符串hash算法，附图片理解字符串hash算法

字符串hash算法

继续阅读

查找算法之二分查找查找算法之二分查找

查找算法学习之二分查找（Python版本）——BinarySearch

CQ V1.0分词bates(基于双数组tire树)—应该是目前最快的中文分词算法

Command Network(POJ 3164)---定根最小树形图模板题题目描述输入格式输出格式输入样例输出样例分析源程序

查找文件中的字符串

开源低带宽语音编解码器

241 Different Ways to Add Parentheses（C代码版）

【趋高机器视觉】机器视觉技术原理解析及解决方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制规程及特点4． CSMA/CD协议5． CSMA/CD的优点6．结束语

极大似然法(ML)与最大期望法(EM)

C++ 第十五周报告1--《冒泡法排序》

笔试面试题目：滑动窗口(二)

数据结构与算法（27）——排序（二）

Dijkstra--简易版（最短路径）

GitHub连夜封杀！这份阿里 10W 字内部 Java 字面试手册到底有多强？

hdu7108哈希