优惠活动 - 12周年庆本月新客福利
优惠活动 - 12周年庆本月新客福利
优惠活动 - 12周年庆本月新客福利

企业建网站常用正则表达式语法

日期 : 2026-04-28 21:22:23
一、正则表达式基础语法(通用)
正则表达式(Regex)是用于匹配字符串模式的工具,在企业网站开发中,主要用于表单验证(如手机号、邮箱、网址)、后台数据筛选、前端输入校验等场景。核心语法如下,适配大多数网站开发语言(PHP、JavaScript、Python等)。

1. 基础匹配符号

  • .:匹配任意单个字符(除换行符\n),例:h.t 可匹配 hat、hot、hxt 等。
  • ^:匹配字符串开头,例:^abc 仅匹配以 abc 开头的字符串(如 abc123,不匹配 xabc)。
  • $:匹配字符串结尾,例:abc$ 仅匹配以 abc 结尾的字符串(如 123abc,不匹配 abcxyz)。
  • *:匹配前面的字符0次或多次,例:ab* 可匹配 a、ab、abb、abbb 等。
  • +:匹配前面的字符1次或多次,例:ab+ 可匹配 ab、abb、abbb,不匹配 a。
  • ?:匹配前面的字符0次或1次,例:ab? 可匹配 a、ab,不匹配 abb。
  • {n}:匹配前面的字符恰好n次,例:a{3} 仅匹配 aaa。
  • {n,}:匹配前面的字符至少n次,例:a{2,} 可匹配 aa、aaa、aaaa 等。
  • {n,m}:匹配前面的字符n到m次,例:a{2,4} 可匹配 aa、aaa、aaaa。
  • []:匹配括号内任意一个字符,例:[abc] 可匹配 a、b、c;[0-9] 匹配任意数字;[a-zA-Z] 匹配任意大小写字母。
  • [^]:匹配括号内以外的任意字符,例:[^0-9] 匹配非数字字符。
  • \:转义字符,用于匹配特殊符号(如 .、*、+ 等),例:\. 仅匹配小数点,不匹配任意字符。

2. 常用预定义字符集

  • \d:等价于 [0-9],匹配任意数字。
  • \D:等价于 [^0-9],匹配非数字。
  • \w:等价于 [a-zA-Z0-9_],匹配字母、数字、下划线(企业网站中常用于用户名、密码校验)。
  • \W:等价于 [^a-zA-Z0-9_],匹配非字母、数字、下划线(用于过滤特殊符号)。
  • \s:匹配任意空白字符(空格、制表符、换行符等),例:\s+ 匹配多个连续空白。
  • \S:匹配非空白字符。

3. 分组与逻辑匹配

  • ( ):分组,将多个字符视为一个整体,例:(ab)+ 可匹配 ab、abab、ababab 等。
  • |:逻辑或,匹配其中一个表达式,例:abc|def 可匹配 abc 或 def。

二、企业建网站高频正则表达式(直接套用)


企业网站开发中,正则主要用于表单验证(用户注册、联系我们、留言板等)和URL/数据提取,以下是最常用场景的正则,附带说明和适配场景。

1. 表单验证类(核心场景)

(1)手机号验证(适配国内企业用户)

语法:^1[3-9]\d{9}$
说明:开头为1,第二位为3-9(覆盖国内所有手机号段),后面跟9位数字,总长度11位。适用于企业网站“联系电话”“注册手机号”输入校验。

(2)企业邮箱验证(支持企业域名、个人邮箱)

语法:^[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+$
说明:支持字母、数字、下划线、减号,适配企业邮箱(如 [email protected][email protected])和个人邮箱,可直接用于“邮箱订阅”“留言邮箱”校验。

(3)企业网址验证(支持http/https、www/非www)

语法:^https?://([a-zA-Z0-9_-]+\.)+[a-zA-Z0-9_-]+(/[a-zA-Z0-9_-]*)*$
说明:匹配 http 或 https 开头,支持企业官网域名(如 https://www.company.com、http://xxx.cn),可用于“友情链接”输入校验、后台网址录入。

(4)企业名称验证(支持中文、字母、数字、空格、标点)

语法:^[a-zA-Z0-9\u4e00-\u9fa5\s·()-]{2,50}$
说明:支持中文(企业中文名称)、字母(英文名称)、数字、空格、常见标点(·、()、-),长度2-50位,适用于“企业信息登记”“供应商录入”。

(5)密码验证(企业后台用户密码,安全等级中等)

语法:^(?=.*[a-zA-Z])(?=.*\d)[a-zA-Z0-9]{8,16}$
说明:8-16位,必须包含字母和数字,不允许特殊符号(适配企业后台简单密码需求);若需更高安全,可添加特殊符号:^(?=.*[a-zA-Z])(?=.*\d)(?=.*[!@#$%^&*])[a-zA-Z0-9!@#$%^&*]{8,16}$

(6)邮政编码验证(国内6位邮编)

语法:^[1-9]\d{5}$
说明:开头不为0,共6位数字,适用于企业“联系地址”表单中的邮编校验。

(7)固定电话验证(国内固定电话,支持分机号)

语法:^0\d{2,3}-\d{7,8}(-\d{1,4})?$
说明:开头为0,区号2-3位(如010、0571),号码7-8位,可带1-4位分机号(如010-12345678-123),适配企业固定电话录入。

2. 数据提取/过滤类(后台常用)

(1)提取网页中的所有链接(URL)

语法:https?://[^\s"]+
说明:提取网页中所有 http/https 开头的链接,可用于企业网站爬虫、友情链接批量提取。

(2)过滤HTML标签(后台接收前端富文本,过滤危险标签)

语法:<[^>]+>
说明:匹配所有HTML标签(如 <div>、<script>),可用于过滤用户留言、富文本输入中的危险标签,防止XSS攻击。

(3)提取企业营业执照号(统一社会信用代码,18位)


语法:^[0-9A-HJ-NPQRTUWXY]{18}$
说明:适配统一社会信用代码(18位,包含数字和特定字母),可用于企业信息审核、后台数据录入校验。

三、企业网站建设正则使用注意事项

  • 适配开发语言:不同语言(JavaScript、PHP、Python)的正则语法略有差异,例如JavaScript中需添加 / / 包裹(如 /^1[3-9]\d{9}$/),PHP中需使用 preg_match 函数。
  • 容错性调整:根据企业需求调整正则严格度,例如手机号验证可允许开头空格(添加 ^\s*1[3-9]\d{9}\s*$ ),适配用户输入习惯。
  • 安全防护:过滤用户输入时,需结合正则和其他过滤手段,防止SQL注入、XSS攻击(如过滤 <script> 标签)。
  • 测试验证:使用在线正则测试工具(如 regex101、正则表达式测试器),验证正则是否符合需求,避免遗漏场景(如特殊手机号段、特殊企业域名)。

上一篇:环保行业网站建设全流程指南 下一篇:没有了
相关文章