要求在域名c.bi.com/下,但是com/之后不能包含baj和jia关键字
满足:
http://c.bi.com/xi-2874/
http://c.bi.com/yaur/?W=cheg
http://c.bi.com/yagng/m3/?W.sr=1
http://c.bi.com/li/
http://c.bi.com/li/m94/
不满足:
http://c.bi.com/doyak2/m101823/baj/c201/
http://c.bi.com/mg1/jia/?W.mc_jz=jiia
http://c.bi.com/xa6l/jia/?so=-1&p=2
http://c.bi.com/mi-37/jia/?Wc_jz=jiia
http://c\.bi\.com/(?!.*((baj)|(jia))).*
预搜索,正则表达式应该都支持这个吧(我这是按java的写的,不过应该没包含java的特殊语法)
谢谢!我测试过好着?你比我写的更简洁:^http://c\.bi\.com/((?!baj|jia)[\w-]+/)+((?!baj|jia)[\w-?=.]+)?
@Zhouxm1988: 我只写了关键部分而已,?-什么的,我都用.直接匹配了
只能通过 http://c\.bi\.com/(\w+/)* 把全部链接找出,再用下面这个迭代判断一下
^http://c\.bi\.com/(?:(?!baj|jia)\w+/)*$
启用多行模式就可以了,没必要一个一个找出来再验证