问题1:帮忙解释一下这个正则表达式的意思,charset=(?<code>[a-zA-Z0-9\\-]+)
问题2:
如何写正则表达式,得到下面字符串的编码格式.
1.<meta charset="UTF-8"/> 识别不了
2. <meta http-equiv="Content-Type" content="text/html; charset=gb2312">
匹配以charset=
开头、其后紧跟字母数字组合的字符串,并将字母数字组合的字符串捕获到code
组中
匹配不了<meta charset="UTF-8"/>
是由于所写正则没考虑引号的情况,改进后的正则如下:
charset=['"]?(?<code>[a-zA-Z0-9\\-]+)['"]?
['"]?这个的意思是'或者" 出现一次或者不出现,是吗?
@cheerupWoo: 是的