当前位置: 首页 > news >正文

新冠三阳最新消息上海百度整站优化服务

新冠三阳最新消息,上海百度整站优化服务,橙云的主机支持放两个网站吗,在internet上建设网站最近发现抓取网页数据的工作越来越多了,抓取技术,正则表达式,各种麻烦,这次又遇到了cookie的问题。 首先痛恨一下那些靠cookie来变换网页内容的网站,嘿嘿 在网上找了一些资料,最后整理出来了结论 说结论之前…

最近发现抓取网页数据的工作越来越多了,抓取技术,正则表达式,各种麻烦,这次又遇到了cookie的问题。

首先痛恨一下那些靠cookie来变换网页内容的网站,嘿嘿

 在网上找了一些资料,最后整理出来了结论

 说结论之前先说一下cookie的层次关系,在.net中cookie的大小关系如下CookieContainer--CookieCollection--Cookie  ,其中我们使用的HttpWebRequest使用的正式第一级别也就是CookieContainer,弄明白这个关系以后就可以进行相应的代码开发了

 

 1 public void StartClimb()
 2         {
 3             string urlContent = "";
 4 
 5             try
 6             {
 7                 CookieCollection cookies = new CookieCollection();
 8                 cookies.Add(new Cookie("cookie名称""cookie值"));
 9 
10                 HttpWebRequest webRequest = (HttpWebRequest)WebRequest.Create("http://www.XXXXX.com");
11                 webRequest.Timeout = 30000;
12                 webRequest.AllowAutoRedirect = true;
13                 webRequest.UserAgent = "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)";
14                 webRequest.Accept = "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8";
15                 webRequest.Headers.Set("Pragma""no-cache");
16                 webRequest.Headers.Add("Accept-Language""zh-cn,zh;q=0.5");
17                 webRequest.Headers.Add("Accept-Encoding""gzip,deflate");
18                 webRequest.Headers.Add("Accept-Charset""GB2312,utf-8;q=0.7,*;q=0.7");
19 
20                 CookieContainer myCookieContainer = new CookieContainer();
21                 myCookieContainer.Add(webRequest.RequestUri,cookies);
22                 webRequest.CookieContainer = myCookieContainer;
23 
24                 HttpWebResponse webResponse = (HttpWebResponse)webRequest.GetResponse();
25                 
26 
27                 Stream stream;
28                 //对gzip和deflate进行解密处理
29                 switch (webResponse.ContentEncoding)
30                 {
31                     case "gzip":
32                         stream = new GZipStream(webResponse.GetResponseStream(), CompressionMode.Decompress);
33                         break;
34                     case "deflate":
35                         stream = new DeflateStream(webResponse.GetResponseStream(), CompressionMode.Decompress);
36                         break;
37                     default:
38                         stream = webResponse.GetResponseStream();
39                         break;
40                 }
41 
42                 StreamReader streamReader;
43                 streamReader = new StreamReader(stream, Encoding.UTF8);
44                 //streamReader = new StreamReader(stream, Encoding.Default);
45                 //streamReader = new StreamReader(stream, Encoding.UTF8);
46                 urlContent = streamReader.ReadToEnd();
47                 streamReader.Close();
48                 stream.Close();
49 
50                 if (webRequest != null) { webRequest.Abort(); }
51                 if (webResponse != null) { webResponse.Close(); }
52             }
53             catch (WebException ex)
54             {
55 
56             }
57             catch (Exception ex)
58             {
59 
60             }
61 
62             
63         }

有了上面的代码应该就可以搞定cookie的事情了。不过一般我们在开发的时候可能会忘记Cookie的Domain问题,这样的话在程序执行的时候会导致报错

 

myCookieContainer.Add(webRequest.RequestUri,cookies);
这句话声明了必要的Domain,CSDN上面的一个帖子的问题就出在于此http://topic.csdn.net/u/20080402/18/d63636a7-d81e-40f2-b972-b9c6bb775ac4.html

 

 

对了,如果你不知道需要传递什么cookie给服务器,那么有很多办法,其中最简单的就是通过firefox的firebig来查看,还有ie9里面的f12功能,再有就是自己写程序,在抓取的时候获取一些传回的cookie值,但是记得也要声明URL

 

HttpWebResponse webResponse = (HttpWebResponse)webRequest.GetResponse();
CookieCollection CCol = myCookieContainer.GetCookies(webRequest.RequestUri);
 

 

 

 

 

转载于:https://www.cnblogs.com/duohahawuwu/archive/2011/04/20/2021975.html

http://www.lbrq.cn/news/2687851.html

相关文章:

  • 济南造价工程信息网重庆seo结算
  • 美工做网站尺寸多少钱苹果被曝开发搜索引擎对标谷歌
  • 已经有域名 怎么修改网站如何优化网站
  • 自己有网站 做app企业网站的推广形式有
  • 海南省建设考试网站首页上海野猪seo
  • 企业网络营销网站婚恋网站排名前三
  • 开平做网站百度搜索引擎官网入口
  • 免费汽车租赁网站模板谷歌 chrome 浏览器
  • 做英文网站多钱游戏推广合作平台
  • 网站模板jspseo是什么意思蜘蛛屯
  • 上海公安网站百度推广联盟
  • 大前端网站网站关键词优化方案
  • 网站开发 怎样做费用结算外贸网站推广优化
  • 申请建设活动中心网站短视频关键词优化
  • 网络工程专业毕业论文宁波seo免费优化软件
  • 企业 办公 网站模板地推接单平台网
  • seo综合查询工具可以查看哪些数据海淀区seo全面优化
  • 鸡西建设网站腾讯云服务器
  • 天津建设局网站首页营销型网站建设步骤
  • 廊坊网页模板建站站长工具百科
  • 做任务网站有哪些内容网络优化公司
  • 网站做301还是302seo研究协会网app
  • 如何写网站建设方案seo综合查询接口
  • 微信公众号的微网站怎么做的淘宝运营
  • ai做网站网站广告接入
  • 培训销售网站建设怀柔网站整站优化公司
  • 企业网站建设后需要单独服务器百度客服在线咨询人工服务
  • 大学生互助联盟网站建设需求分析说明表小米口碑营销案例
  • 好的网站分享百度seo软件首选帝搜软件
  • 网页设计素材图片免费百度seo优化教程免费
  • 算法打卡力扣第88题:合并两个有序数组(easy)
  • lesson36:MySQL从入门到精通:全面掌握数据库操作与核心原理
  • 【DL】深层神经网络
  • C++11的历史和统一的初始化列表
  • Flutter Provider 状态管理全面解析与实战应用:从入门到精通
  • 亚马逊广告底层逻辑重构:从流量博弈到价值创造的战略升维