正则表达式拆分url实例代码,


目录
  • 背景
  • 案例
    • 使用js举例
    • 使用java举例
  • 正则说明
    • 总结

      背景

      做web开发的同学,经常会有从url中获取二级域名或者主域名或者参数等等需求,需要扎实的正则功底。本文提供一个全面的url拆分案例,需要哪个部分用哪个部分。

      案例

      将url的各个部分拆开,让我想取哪部分就取哪部分?

      url: http://www.baidu.com/love/java?lang=java
      regex: (\w+):\/\/([^/:]+)(:\d*)?([^# ]*)
      

      使用js举例

      var url = "http://www.baidu.com:80/love/java?lang=java";
      var patt1 = /(\w+):\/\/([^/:]+)(:\d*)?([^# ]*)/;
      arr = url.match(patt1);
      for (var i = 0; i < arr.length ; i++) {
          document.write(arr[i]);
          document.write("<br>");
      }
      

      输出结果如下:

      http://www.baidu.com:80/love/java?lang=java
      http
      www.baidu.com
      :80
      /love/java?lang=java

      使用java举例

              String url = "http://www.baidu.com:80/love/java?lang=java";
              Pattern pattern = Pattern.compile("(\\w+):\\/\\/([^/:]+)(:\\d*)?([^# ]*)");
              Matcher matcher = pattern.matcher(url);
              matcher.find();
              for (int i = 1; i <= matcher.groupCount(); i++){
                  System.out.println(matcher.group(i));
              }
      

      输出结果:

      http
      www.baidu.com
      :80
      /love/java?lang=java

      正则说明

      实例中的数组包含 5 个元素,索引 0 对应的是整个字符串,索引 1 对应第一个匹配符(括号内),以此类推。

      第一个括号子表达式捕获 Web 地址的协议部分。该子表达式匹配在冒号和两个正斜杠前面的任何单词。

      第二个括号子表达式捕获地址的域地址部分。子表达式匹配非 : 和 / 之后的一个或多个字符。

      第三个括号子表达式捕获端口号(如果指定了的话)。该子表达式匹配冒号后面的零个或多个数字。只能重复一次该子表达式。

      第四个括号子表达式捕获 Web 地址指定的路径和 / 或页信息。该子表达式能匹配不包括 # 或空格字符的任何字符序列。

      总结

      到此这篇关于正则表达式拆分url的文章就介绍到这了,更多相关正则表达式拆分url内容请搜索PHP之友以前的文章或继续浏览下面的相关文章希望大家以后多多支持PHP之友!

      您可能感兴趣的文章:
      • js匹配网址url的正则表达式集合
      • 匹配URL的正则表达式(推荐)
      • python使用正则表达式提取网页URL的方法
      • php用正则表达式匹配URL的简单方法
      • 通过正则表达式获取url中参数的简单实现
      • php URL验证正则表达式
      • JS正则表达式替换url参数的方法
      • java正则表达式获取url的host示例

      相关内容