正则匹配固定汉字如何用正则表达式提取字符串中的汉字？

2021-03-14

2789

如何用正则表达式提取字符串中的汉字？Python re正则匹配中文其实很简单。您可以将中文Unicode字符串转换为UTF-8格式，然后可以随意调用Unicode中的中文编码为/u4e00-/u9fa

如何用正则表达式提取字符串中的汉字？

Python re正则匹配中文其实很简单。您可以将中文Unicode字符串转换为UTF-8格式，然后可以随意调用Unicode中的中文编码为/u4e00-/u9fa5。因此，正则表达式U“[-龥]”可以表示一个或多个汉字>>>>> import re>>> S=“Chinese:123456aa ha BBCC”。解码（“utf8”）>>> Su“-中文：123456aa哈哈BBCC”>>>打印s中文：123456aa哈哈BBCC>>>重新匹配（U“[（I-龥]”，s）<Usre.sre匹配对象位于0xb77742c0>>> pat=“Chinese”。解码（“utf8”）>>>检索（帕特，s）<usre.sreMatch object at 0x16a16df0>>>>> newpat=“这里是中文内容”。解码（“utf8”）>>>新闻=回复sub（pat，newpat，s）>>>打印新闻

如何用正则表达式提取字符串中的汉字？

相关推荐