博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
正则表达式识别汉字
阅读量:6942 次
发布时间:2019-06-27

本文共 243 字,大约阅读时间需要 1 分钟。

最近要为某国大选做项目,得把项目中所有汉字翻译为西文。项目中java、js文件几千个,eclipse中\w是无法识别中文的。所以下面这两条正则就算救命的工具了。

匹配中文字符的正则表达式: [\u4e00-\u9fa5]: \u表示unicode,4e00~9fa5是unicode的中文编码段。

匹配双字节字符:[^\x00-\xff] :一个汉字占两个字节,这个就很明显了。

转载于:https://www.cnblogs.com/code-style/p/3517206.html

你可能感兴趣的文章
使用 log4j 2记录日志
查看>>
新词发现(一):基于统计
查看>>
从“为什么创业”到“怎么创业”(转)
查看>>
从零开始学习渗透Node.js应用程序
查看>>
Three-js 创建第一个3D场景
查看>>
mysql优化:连接数
查看>>
单例设计模式之安全的懒汉式
查看>>
iOS_20_微博OAuth授权_取得用户授权的accessToken
查看>>
离线用户的灰色头像处理
查看>>
php递归函数return会出现无法正确返回想要值的情况
查看>>
Android Studio之Activity切换动画(三)
查看>>
Bitcoin: A Peer-to-Peer Electronic Cash System(比特币论文翻译)
查看>>
Redis-Redi事务注意事项
查看>>
ffmpeg mediacodec 硬解初探
查看>>
Cocostudio 1.4 实现的DemoShop
查看>>
request.getParameter(“参数名”) 中文乱码解决方法
查看>>
Ambari-Blueprint介绍
查看>>
可编辑ztree节点的增删改功能图标控制---已解决
查看>>
Android-自己定义标题栏
查看>>
C# Winform利用POST传值方式模拟表单提交数据(Winform与网页交互)
查看>>