源码网商城，靠谱的源码在线交易网站我的订单购物车帮助

当前位置：首页 > 资讯 > 技术文档

asp采集HTML内容常用代码,详讲正则采集

时间：2021-06-20 20:14 编辑：来源：阅读：
扫一扫，手机访问

摘要：asp采集HTML内容常用代码,详讲正则采集

先说一下采集原理：采集程序的主要步骤如下：一、获取被采集的页面的内容二、从获取代码中提取所有用的数据一、获取被采集的页面的内容我目前所掌握的ASP常用获取被采集的页面的内容方法： 1、用serverXMLHTTP组件获取数据

[url=url1]<a href="url2">连接2</a> <br> <a href="url3">连接3</a> <br> 用以下代码就可以获得一个URL连接集合

[u]复制代码[/u][/url] 代码如下:

Set xiaoqi = New Regexp xiaoqi.IgnoreCase = True xiaoqi.Global = True xiaoqi.Pattern = ””“.+?”““ Set Matches =xiaoqi.Execute(页面列表内容) set xiaoqi=nothing url="" For Each Match in Matches url=url&Match.Value Next

4、取得被采集的内容页面内容，根据”提取标记“从被采集的内容页面分别截取要取得的数据因为是动态生成的页面，大多数内容页面内都有相同的html标记，我们可以根据这些有规则的标记提取需要的各个部分的内容。如：每个页面都有网页标题<title>网页标题</title>，用我上面写的MID截取函数就可以获得<title></title>之间的值，也可以用正则表达式来获得。例：body("<title>网页标题</title>","<title>","</title>")

全部评论(0)

上一篇：利用xmlhttp和adodb.stream加缓存技术下载远程Web文件
下一篇：小偷程序2

资讯排行榜
更多>>

关于我们 | 广告合作 | 联系我们 | 隐私条款 | 免责声明 | 网站地图

苏ICP备2024110244号-2 苏公网安备32050702011978号增值电信业务经营许可证编号：苏B2-20251499 | Copyright 2018 - 2025 源码网商城 (www.ymwmall.com) 版权所有

联系客服

客服电话：
400-000-3129

微信版

扫一扫进微信版

返回顶部