网络编程 
首页 > 网络编程 > 浏览文章

正则表达式u修饰符(支持UTF-16编码)

(编辑:jimmy 日期: 2024/10/10 浏览:3 次 )

正则表达式u修饰符:

此修饰符标识能够正确处理大于\uFFFF的Unicode字符。
也就是说,会正确处理四个字节的UTF-16编码。
此修饰符是ES2015新增,更多正则表达式新特性可以参阅ES2015 正则表达式新增特性一章节。
更多正则表达式教程可以参阅正则表达式教程板块。

代码实例:

console.log(/^\uD842/u.test("\uD842\uDFB7"))

输出false,由于"\uD842\uDFB7"是一个四个字节的UTF-16编码,代表一个字符,所以如果正则表达式带有u修饰符,那么就能够识别它。

console.log(/^\uD842/.test("\uD842\uDFB7"))

输出true;不加u修饰符,那么就无法将四个字节的UTF-16编码识别为一个字符,所以就可以产生匹配。

/^.$/.test("\uD842\uDFB7")//false
/^.$/u.test("\uD842\uDFB7")//true

关于元字符点(.)的用法可以参阅正则表达式.号元字符一章节。

/^.$/.test("\uD842\uDFB7")//false
/^.$/u.test("\uD842\uDFB7")//true

添加u修饰符之后,点元字符就可以匹配码点大于0xFFFF的Unicode字符。

/ \u{61} /.test("a")//false
/ \u{61} / u.test("a")//true

使用u修饰符,正则表达式能够识别大括号{}表示的Unicode字符,否则无法识别,{61}也会被解读为量词,表示61个u字符。
关于大括号表示的Unicode字符可以参阅ES2015 字符串新增特性一章节。

上一篇:正则表达式\w元字符使用介绍
下一篇:ES2015 正则表达式新增特性
一句话新闻
高通与谷歌联手!首款骁龙PC优化Chrome浏览器发布
高通和谷歌日前宣布,推出首次面向搭载骁龙的Windows PC的优化版Chrome浏览器。
在对骁龙X Elite参考设计的初步测试中,全新的Chrome浏览器在Speedometer 2.1基准测试中实现了显著的性能提升。
预计在2024年年中之前,搭载骁龙X Elite计算平台的PC将面世。该浏览器的提前问世,有助于骁龙PC问世就获得满血表现。
谷歌高级副总裁Hiroshi Lockheimer表示,此次与高通的合作将有助于确保Chrome用户在当前ARM兼容的PC上获得最佳的浏览体验。