源码网商城,靠谱的源码在线交易网站 我的订单 购物车 帮助

源码网商城

c#使用nsoup解析html乱码解决方法分享 nsoup教程

  • 时间:2022-08-12 02:30 编辑: 来源: 阅读:
  • 扫一扫,手机访问
摘要:c#使用nsoup解析html乱码解决方法分享 nsoup教程
下载地址:http://nsoup.codeplex.com/ 简单用法如下:
[u]复制代码[/u] 代码如下:
NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(HtmlString);
处理网络上的页面:
[u]复制代码[/u] 代码如下:
NSoup.Nodes.Document doc = NSoup.NSoupClient.Connect("http://www.1sucai.cn/").Get();
但是遗憾的是NSoup默认的编码是UTF-8,处理中文有乱码(对于编码是UTF-8的自然不会有乱码,但是有些GB2312的就可能有乱码,谢谢 forhells的提醒)。 目前我找到两种解决办法: 1.下载网页源代码再处理
[u]复制代码[/u] 代码如下:
WebClient webClient = new WebClient(); String HtmlString=Encoding.GetEncoding("utf-8").GetString(webClient.DownloadData("http://www.1sucai.cn")); NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(HtmlString);
2.获得网页的流
[u]复制代码[/u] 代码如下:
WebRequest webRequest=WebRequest.Create("http://www.1sucai.cn"); NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(webRequest.GetResponse().GetResponseStream(),"utf-8");
第二种用着比较方便,但是我觉得第一种比较合适,毕竟NSoup是个Html解析类,下载网页代码这种事情本来不应该交给它。
  • 全部评论(0)
联系客服
客服电话:
400-000-3129
微信版

扫一扫进微信版
返回顶部