常用正则表达式 1、所有html标签内容 查找所有html标签内容(<...>):<(\S*?)[^>]*>.*?|<.*? /> 这样可以一次替换掉所有html标签内容 2、某字符开头的html标签内容 查找以p开头的html标签内容(
):<(p\S*?)[^>]*>.*?|<.*? /> 3、开头不含某字符html标签内容 查找不以i开头标签内容():<([^i]\S*?)[^>]*>.*?|<.*? /> 这样可以把img(图片)以外的标签全部替换掉,使用得文档只保留无格式文本及图片 4、汉字、字母、数字及空格表达式 汉字正则表达式: [\u4e00-\u9fa5] 字母正则表达式: [a-zA-Z] 数字正则表达式: [0-9] 空格正则表达式: \s 5、删除特殊位置的空格 删除汉字间的空格:([\u4e00-\u9fa5])\s+([\u4e00-\u9fa5]) 替换为 $1$2 字母与汉字间的空格:([a-zA-Z])\s+([\u4e00-\u9fa5]) 替换为 $1$2 汉字与字母间的空格:([\u4e00-\u9fa5])\s+([a-zA-Z]) 替换为 $1$2 数字与汉字间的空格:([0-9])\s+([\u4e00-\u9fa5]) 替换为 $1$2 汉字与数字间的空格:([\u4e00-\u9fa5])\s+([0-9]) 替换为 $1$2 6、插入字符 汉字与数字间增加一个字符(如s):([\u4e00-\u9fa5])([0-9]) 替换为 $1\s$2FALSE