源码网商城,靠谱的源码在线交易网站 我的订单 购物车 帮助

源码网商城

python爬虫教程之爬取百度贴吧并下载的示例

  • 时间:2020-09-24 11:58 编辑: 来源: 阅读:
  • 扫一扫,手机访问
摘要:python爬虫教程之爬取百度贴吧并下载的示例
测试url:[url=http://tieba.baidu.com/p/27141123322?pn]http://tieba.baidu.com/p/27141123322?pn[/url]= begin  1 end   4
[u]复制代码[/u] 代码如下:
import string ,urllib2 def baidu_tieba(url,begin_page,end_page):     for i in range(begin_page, end_page+1):         sName = string.zfill(i,5)+ '.html'         print '正在下载第' + str(i) + '个网页,并将其存储为' + sName + '..........'         f = open (sName,'w+')         m = urllib2.urlopen(url + str(i)).read()         f.write(m)         f.close() bdurl = str(raw_input('url:  n')) begin_page = int(raw_input('begin :n')) end_page = int(raw_input('end : n')) baidu_tieba(bdurl,begin_page,end_page)
  • 全部评论(0)
联系客服
客服电话:
400-000-3129
微信版

扫一扫进微信版
返回顶部