中文 API 表达正则

xuanwu · 前天 11:26 · 622 次点击

初版草稿,欢迎意见建议 pip install chinese-regular-expression。详请见文档和测试用例。

任一("From", "Subject").表达()
=>
r"From|Subject"


序列("$").可无().某字("_", 大小写英文, 中文).某字("_", 大小写英文, 数字, 中文).若干().表达()
=>
r'\$?[_a-zA-Z\u4e00-\u9fa5][_a-zA-Z0-9\u4e00-\u9fa5]*'


序列("<emphasis>", 分段(序列(多个数字, 分段(序列(点号, 多个数字)).若干(3))), "</emphasis>").表达()
=>
r"<emphasis>([0-9]+(\.[0-9]+){3})</emphasis>"
举报· 622 次点击
登录 注册 站外分享
5 条回复  
oneisall8955 小成 前天 11:42
想起文言文编程语言😂
w568w 小成 前天 15:44
恭喜你重新发明了 Parser combinator: https://en.wikipedia.org/wiki/Parser_combinator
forty 小成 前天 19:26
你这中英混杂的看着真难受,就像讲话的中英夹杂过多也听了难受一样。 比文言文编程差远了。 文言文写的是: [正则之 From 或 Subject] 不比 [任一("From", "Subject").表达()] 舒服吗?
xuanwu 楼主 小成 昨天 02:46
@w568w 创作动机请见: https://zhuanlan.zhihu.com/p/323940002 欢迎分享类似实现。
xuanwu 楼主 小成 昨天 05:35
@forty 略复杂的比如另两个写出来不知如何? 个人暂时用 py 比较多,于是先做 py 的库。
返回顶部