源码网商城,靠谱的源码在线交易网站 我的订单 购物车 帮助

源码网商城

利用Python抓取行政区划码的方法

  • 时间:2021-02-20 12:26 编辑: 来源: 阅读:
  • 扫一扫,手机访问
摘要:利用Python抓取行政区划码的方法
[b]前言[/b] 国家统计局网站上有相对比较齐的行政区划码,对于一些网站来说这是非常基础的数据,所以写了个Python程序将这部分数据抓取下来。 [b]注意:[/b]抓取下来以后还要进行简单的人工的整理 [b]示例代码:[/b]
# -*- coding:utf-8 -*-
'''
获取国家统计局上的行政区划码
'''
import requests,re
base_url = 'http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html'
 
def get_xzqh():
 html_data = requests.get(base_url).content
 pattern = re.compile('<p class="MsoNormal" style=".*?"><span lang="EN-US" style=".*?">(\d+)<span>.*?</span></span><span style=".*?">(.*?)</span></p>')
 areas = re.findall(pattern,html_data)
 print "code,name,level"
 for area in areas:
  print area[0],area[1].decode('utf-8').replace(u' ',''),area[1].decode('utf-8').count(u' ')
 
if __name__=='__main__':
 get_xzqh()
[b]注意事项:[/b] 另外,关于国家地区表的信息,还有另外一种获取渠道,那就是QQ软件自带的国家地区信息表。(文件名为[code]LocList.xml[/code]),一般的存储位置为:[code]C:\Program Files\Tencent\QQ\I18N\2052 [/code] 如需中文版安装中文版QQ即可获取,如需英文版则安装英文版QQ。国际版在1033目录。 code都是按照ISO3166标准写的,极易导入数据库。 [b]总结[/b] 以上就是利用Python获取行政区划码的全部内容,希望本文的内容对大家学习或者使用python能有所帮助,如果有疑问大家可以留言交流。
  • 全部评论(0)
联系客服
客服电话:
400-000-3129
微信版

扫一扫进微信版
返回顶部