——————【 正则表达式 】——————
-
复习字符串操作
indexOf 查找字符 返回位置
charAt 查找位置 返回字符
substring 获取字符窜
split 分割字符串
-
正则表达式的概念和写法
正则 :也叫做规则,让计算机能够读懂人类的规则
正则都是操作字符串的。
正则的写法:
var re = /a/; //和数组字符串区分开来
var re = newRegExp('a');
【正则默认】 :
1.正则中是区分大小写的
不区分大小写在正则后加 表示i (ignore)
如var re = newRegExp('a','i');
2.正则匹配成功就会结束,不会继续匹配,
如果想全部查找就要加 标识g (global)
-
量词:代表出现的次数
量词 描述
n+ 匹配任何包含至少一个 n 的字符串。
n* 匹配任何包含零个或多个 n 的字符串。
n? 匹配任何包含零个或一个 n 的字符串。
n{X} 匹配包含 X 个 n 的序列的字符串。
n{X,Y} 匹配包含 X 至 Y 个 n 的序列的字符串。
n{X,} 匹配包含至少 X 个 n 的序列的字符串。
n$ 匹配任何结尾为 n 的字符串。
^n 匹配任何开头为 n 的字符串。
?=n 匹配任何其后紧接指定字符串 n 的字符串。
?!n 匹配任何其后没有紧接指定字符串 n 的字符串。
>{n,m}:至少出现n次,最多m次
>{n,} :至少n次
>* :任意次 相当于{0,}
? :零次或一次 相当于{0,1}
+ :一次或任意次相当于 {1,}
{n}: 正好n次
例子:判断是不是QQ号
//^ : 放在正则的最开始位置,就代表起始的意思,注意 /[^a] / 和
/^[a]/是不一样的,前者是排除的意思,后者是代表首位。
//$ : 正则的最后位置 , 就代表结束的意思
//首先想QQ号的规则
1 首位不能是0
2 必须是 5-12位的数字
var aInput = document.getElementsByTagName('input');
var re = /^[1-9]\d{4,11}$/;
//123456abc为了防止出现这样的情况,所以必须限制最后
//首位是0-9,接着是4-11位的数字类型。
aInput[1].onclick = function(){
if( re.test(aInput[0].value) ){
alert('是QQ号');
}else{
alert('不是QQ号');
}
};
例子:去掉前后空格(面试题经常出现)
var str = ' hello ';
alert( '('+trim(str)+')' );//为了看出区别所以加的括号。 (hello)
function trim(str){
var re = /^\s+|\s+$/g; // |代表或者 \s代表空格 +至少一个 前面有至少一个空格 或者后面有至少一个空格 且全局匹配
return str.replace(re,''); //把空格替换成空
}
-
贪婪模式与反贪婪模式
*、+和?限定符都是贪婪的,因为它们会尽可能多的匹配文字,只有在它们的后面加上一个?就可>以实现非贪婪或最小匹配。
var c="qqq icbkb coiwcnk tyu kjanc alnc"
var reg =/\w{4,7}/g
console.log(c.match(reg))// ["icbkb", "coiwcnk", "kjanc", "alnc"]
var reg =/\w{4,7}?/g
console.log(c.match(reg)) ["icbk", "coiw", "kjan", "alnc"]
-
正则表达式边界及前瞻
-
边界
整个字符串开头( ^ ) 结尾( $ )
单词的边界 (b), (B)
-
前瞻
正向前瞻 reg (? = assert)
反向前瞻 reg (?! = assert)
-
正则的对象属性
属性 描述global RegExp 对象是否具有标志 g。
ignoreCase RegExp 对象是否具有标志 i。
lastIndex 一个整数,标示开始下一次匹配的字符位置。
multiline RegExp 对象是否具有标志 m。
source 正则表达式的源文本。
-
正则表达式的使用
-
RegExp 对象方法
方法 描述
compile 编译正则表达式。
exec 检索字符串中指定的值。返回找到的值,并确定其位置。
test 检索字符串中指定的值。返回 true 或 false。
-
支持正则表达式的 String 对象的方法
方法 描述
search 检索与正则表达式相匹配的值。
match 找到一个或多个正则表达式的匹配。
replace 替换与正则表达式匹配的子串。
split 把字符串分割为字符串数组。
-
test() :在字符串中查找符合正则的内容,若查找到返回true,反之返回false.
用法正则.test(字符串)
例子:判断是否是数字
var str = '374829348791';
var re = /\D/; // \D代表非数字
if( re.test(str) ){ // 返回true,代表在字符串中找到了非数字。
alert('不全是数字');
}else{
alert('全是数字');
}
-
search() :在字符串搜索符合正则的内容,搜索到就返回出现的位置(从0开始,如果匹配的不只是一个字母,那只会返回第一个字母的位置), 如果搜索失败就返回 -1
用法:字符串.search(正则)
在字符串中查找复合正则的内容。忽略大小写:i——ignore(正则中默认是区分大小写的 如果不区分大小写的话,在正则的最后加标识 i )
例子:在字符串中找字母b,且不区分大小写
var str = 'abcdef';
var re = /B/i;
//var re = new RegExp('B','i'); 也可以这样写
alert( str.search(re) ); // 1
-
match() 在字符串中搜索复合规则的内容,搜索成功就返回内容,格式为数组,失败就返回null。
用法: 字符串.match(正则)
量词:+ 至少出现一次 匹配不确定的次数(匹配就是搜索查找的意思)
全局匹配:g——global(正则中默认,只要搜索到复合规则的内容就会结束搜索 )
例子:找出指定格式的所有数字,如下找到 123,54,33,879
var str = 'haj123sdk54hask33dkhalsd879';
var re = /\d+/g; // 每次匹配至少一个数字 且全局匹配
如果不是全局匹配,当找到数字123,它就会停止了。
就只会弹出123.加上全局匹配,就会从开始到结束一直去搜索符合规则的。
如果没有加号,匹配的结果就是1,2,3,5,4,3,3,879并不是我们想要的,有了加号,每次匹配的数字就是至少一个了。
alert( str.match(re) ); // [123,54,33,879]
-
replace() :查找符合正则的字符串,就替换成对应的字符串。返回替换后的内容。
用法: 字符串.replace(正则,新的字符串/回调函数)(在回调函数中,第一个参数指的是每次匹配成功的字符)
| : 或的意思 。
例子:敏感词过滤,比如 >我爱北京天安门,天安门上太阳升。------我爱*,上太阳升。即北京和天安门变成*号,
一开始我们可能会想到这样的方法:
var str = "我爱北京天安门,天安门上太阳升。";
var re = /北京|天安门/g; // 找到北京 或者天安门 全局匹配
var str2 = str.replace(re,'*');
alert(str2) //我爱**,*上太阳升
//这种只是把找到的变成了一个*,并不能几个字就对应几个*。
要想实现几个字对应几个*,我们可以用回调函数实现:
var str = "我爱北京天安门,天安门上太阳升。";
var re = /北京|天安门/g; // 找到北京 或者天安门 全局匹配
var str2 = str.replace(re,function(str){
alert(str); //用来测试:函数的第一个参数代表每次搜索到的符合正则的字符,所以第一次str指的是北京 第二次str是天安门 第三次str是天安门
var result = '';
for(var i=0;i<str.length;i++){
result += '*';
}
return result; //所以搜索到了几个字就返回几个*
});
alert(str2) //我爱*****,***上太阳升
//整个过程就是,找到北京,替换成了两个*,找到天安门替换成了3个*,找到天安门替换成3个*。
replace是一个很有用的方法,经常会用到。
-
():,小括号,叫做分组符。就相当于数学里面的括号。如下:
var str = '2013-6-7';
var re1 = /\d-+/g; // 全局匹配数字,横杠,横杠数量至少为1,匹配结果为: 3- 6-
var re1 = /(\d-)+/g; // 全局匹配数字,横杠,数字和横杠整体数量至少为1 3-6-
var re2 = /(\d+)(-)/g; // 全局匹配至少一个数字,匹配一个横杠 匹配结果:2013- 6-
-
[] : 表示某个集合中的任意一个,比如 [abc] 整体代表一个字符 匹配 a b c 中的任意一个,也可以是范围,[0-9] 范围必须从小到大 。
1 整体代表一个字符 :^写在[]里面的话,就代表排除的意思
例子:匹配HTML标签 比如<div class="b">hahahah </div> 找出标签<div class="b"></div>
var re = /<2+>/g; //匹配左括号
中间至少一个非右括号的内容(因为标签里面还有属性等一些东西),然后匹配右括号
var re = /<[wW]+>/g; //匹配左括号 中间至少一个字符或者非字符的内容,然后匹配右括号//
其实就是找到左括号,然后中间可以有至少一个内容,一直到找到右括号就代表是一个标签。
-
概念理解
正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这>>些特定字符>的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一>>种过滤逻辑。
给定一个正则表达式和另一个字符串,我们可以达到如下的目的:
- 给定的字符串是否符合正则表达式的过滤逻辑(称作“匹配”);
- 可以通过正则表达式,从字符串中获取我们想要的特定部分。
正则表达式的特点是:
- 灵活性、逻辑性和功能性非常强;
- 可以迅速地用极简单的方式达到字符串的复杂控制。
- a ↩
- > ↩