源码网商城,靠谱的源码在线交易网站 我的订单 购物车 帮助

源码网商城

Python提取网页中超链接的方法

  • 时间:2022-12-18 11:07 编辑: 来源: 阅读:
  • 扫一扫,手机访问
摘要:Python提取网页中超链接的方法
下面是最简单的实现方法,先将目标网页抓回来,然后通过正则匹配a标签中的href属性来获得超链接 [b]代码如下:[/b]
import urllib2
import re
 
url = 'http://www.sunbloger.com/'
 
req = urllib2.Request(url)
con = urllib2.urlopen(req)
doc = con.read()
con.close()
 
links = re.findall(r'href\=\"(http\:\/\/[a-zA-Z0-9\.\/]+)\"', doc)
for a in links:
  print a
[b]总结[/b] 以上就是这篇文章的全部内容,希望本文的内容对大家的学习或者工作能有所帮助,如果有疑问大家可以留言交流。
  • 全部评论(0)
联系客服
客服电话:
400-000-3129
微信版

扫一扫进微信版
返回顶部