源码网商城,靠谱的源码在线交易网站 我的订单 购物车 帮助

源码网商城

node.js正则表达式获取网页中所有链接的代码实例

  • 时间:2020-05-12 14:13 编辑: 来源: 阅读:
  • 扫一扫,手机访问
摘要:node.js正则表达式获取网页中所有链接的代码实例
实现代码
[u]复制代码[/u] 代码如下:
var http = require('http'); //定义函数 var getAHref = function(htmlstr){     var reg = /<a.+?href=('|")?([^'"]+)('|")?(?:\s+|>)/gim;     var arr = [];     while(tem=reg.exec(htmlstr)){         arr.push(tem[2]);     }     return arr; } var qHref = "http://xxx";//设置被查询的目标网址     var req = http.get(qHref, function(res) {     var pageData = "";     res.setEncoding('utf8');     res.on('error', function (errget) {            //出错处理     });     res.on('data', function (chunk) {            pageData += chunk;     });     res.on('end', function(){           //console.dir(pageData);           var content = pageData;//获取到网页内容           var hrefs=getAHref(content);//获取链接     }); });
  • 全部评论(0)
联系客服
客服电话:
400-000-3129
微信版

扫一扫进微信版
返回顶部