企业建网站常用正则表达式语法
日期 : 2026-04-28 21:22:23
一、正则表达式基础语法(通用)
正则表达式(Regex)是用于匹配字符串模式的工具,在企业网站开发中,主要用于表单验证(如手机号、邮箱、网址)、后台数据筛选、前端输入校验等场景。核心语法如下,适配大多数网站开发语言(PHP、JavaScript、Python等)。
1. 基础匹配符号
-
.:匹配任意单个字符(除换行符\n),例:
h.t可匹配 hat、hot、hxt 等。 -
^:匹配字符串开头,例:
^abc仅匹配以 abc 开头的字符串(如 abc123,不匹配 xabc)。 -
$:匹配字符串结尾,例:
abc$仅匹配以 abc 结尾的字符串(如 123abc,不匹配 abcxyz)。 -
*:匹配前面的字符0次或多次,例:
ab*可匹配 a、ab、abb、abbb 等。 -
+:匹配前面的字符1次或多次,例:
ab+可匹配 ab、abb、abbb,不匹配 a。 -
?:匹配前面的字符0次或1次,例:
ab?可匹配 a、ab,不匹配 abb。 -
{n}:匹配前面的字符恰好n次,例:
a{3}仅匹配 aaa。 -
{n,}:匹配前面的字符至少n次,例:
a{2,}可匹配 aa、aaa、aaaa 等。 -
{n,m}:匹配前面的字符n到m次,例:
a{2,4}可匹配 aa、aaa、aaaa。 -
[]:匹配括号内任意一个字符,例:
[abc]可匹配 a、b、c;[0-9]匹配任意数字;[a-zA-Z]匹配任意大小写字母。 -
[^]:匹配括号内以外的任意字符,例:
[^0-9]匹配非数字字符。 -
\:转义字符,用于匹配特殊符号(如 .、*、+ 等),例:
\.仅匹配小数点,不匹配任意字符。
2. 常用预定义字符集
- \d:等价于 [0-9],匹配任意数字。
- \D:等价于 [^0-9],匹配非数字。
- \w:等价于 [a-zA-Z0-9_],匹配字母、数字、下划线(企业网站中常用于用户名、密码校验)。
- \W:等价于 [^a-zA-Z0-9_],匹配非字母、数字、下划线(用于过滤特殊符号)。
-
\s:匹配任意空白字符(空格、制表符、换行符等),例:
\s+匹配多个连续空白。 - \S:匹配非空白字符。
3. 分组与逻辑匹配
-
( ):分组,将多个字符视为一个整体,例:
(ab)+可匹配 ab、abab、ababab 等。 -
|:逻辑或,匹配其中一个表达式,例:
abc|def可匹配 abc 或 def。
二、企业建网站高频正则表达式(直接套用)

企业网站开发中,正则主要用于表单验证(用户注册、联系我们、留言板等)和URL/数据提取,以下是最常用场景的正则,附带说明和适配场景。
1. 表单验证类(核心场景)
(1)手机号验证(适配国内企业用户)
语法:
^1[3-9]\d{9}$
说明:开头为1,第二位为3-9(覆盖国内所有手机号段),后面跟9位数字,总长度11位。适用于企业网站“联系电话”“注册手机号”输入校验。
(2)企业邮箱验证(支持企业域名、个人邮箱)
语法:
^[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+$
说明:支持字母、数字、下划线、减号,适配企业邮箱(如 [email protected]、[email protected])和个人邮箱,可直接用于“邮箱订阅”“留言邮箱”校验。
(3)企业网址验证(支持http/https、www/非www)
语法:
^https?://([a-zA-Z0-9_-]+\.)+[a-zA-Z0-9_-]+(/[a-zA-Z0-9_-]*)*$
说明:匹配 http 或 https 开头,支持企业官网域名(如 https://www.company.com、http://xxx.cn),可用于“友情链接”输入校验、后台网址录入。
(4)企业名称验证(支持中文、字母、数字、空格、标点)
语法:
^[a-zA-Z0-9\u4e00-\u9fa5\s·()-]{2,50}$
说明:支持中文(企业中文名称)、字母(英文名称)、数字、空格、常见标点(·、()、-),长度2-50位,适用于“企业信息登记”“供应商录入”。
(5)密码验证(企业后台用户密码,安全等级中等)
语法:
^(?=.*[a-zA-Z])(?=.*\d)[a-zA-Z0-9]{8,16}$
说明:8-16位,必须包含字母和数字,不允许特殊符号(适配企业后台简单密码需求);若需更高安全,可添加特殊符号:
^(?=.*[a-zA-Z])(?=.*\d)(?=.*[!@#$%^&*])[a-zA-Z0-9!@#$%^&*]{8,16}$。(6)邮政编码验证(国内6位邮编)
语法:
^[1-9]\d{5}$
说明:开头不为0,共6位数字,适用于企业“联系地址”表单中的邮编校验。
(7)固定电话验证(国内固定电话,支持分机号)
语法:
^0\d{2,3}-\d{7,8}(-\d{1,4})?$
说明:开头为0,区号2-3位(如010、0571),号码7-8位,可带1-4位分机号(如010-12345678-123),适配企业固定电话录入。
2. 数据提取/过滤类(后台常用)
(1)提取网页中的所有链接(URL)
语法:
https?://[^\s"]+
说明:提取网页中所有 http/https 开头的链接,可用于企业网站爬虫、友情链接批量提取。
(2)过滤HTML标签(后台接收前端富文本,过滤危险标签)
语法:
<[^>]+>
说明:匹配所有HTML标签(如 <div>、<script>),可用于过滤用户留言、富文本输入中的危险标签,防止XSS攻击。
(3)提取企业营业执照号(统一社会信用代码,18位)

语法:
^[0-9A-HJ-NPQRTUWXY]{18}$
说明:适配统一社会信用代码(18位,包含数字和特定字母),可用于企业信息审核、后台数据录入校验。
三、企业网站建设正则使用注意事项
- 适配开发语言:不同语言(JavaScript、PHP、Python)的正则语法略有差异,例如JavaScript中需添加 / / 包裹(如 /^1[3-9]\d{9}$/),PHP中需使用 preg_match 函数。
- 容错性调整:根据企业需求调整正则严格度,例如手机号验证可允许开头空格(添加 ^\s*1[3-9]\d{9}\s*$ ),适配用户输入习惯。
- 安全防护:过滤用户输入时,需结合正则和其他过滤手段,防止SQL注入、XSS攻击(如过滤 <script> 标签)。
- 测试验证:使用在线正则测试工具(如 regex101、正则表达式测试器),验证正则是否符合需求,避免遗漏场景(如特殊手机号段、特殊企业域名)。
上一篇:环保行业网站建设全流程指南
下一篇:没有了
相关文章



精彩导读




热门资讯