<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">
<channel>
<title><![CDATA[向东博客 专注WEB应用 构架之美 --- 构架之美，在于尽态极妍 | 应用之美，在于药到病除]]></title> 
<link>http://www.jackxiang.com/index.php</link> 
<description><![CDATA[赢在IT，Playin' with IT,Focus on Killer Application,Marketing Meets Technology.]]></description> 
<language>zh-cn</language> 
<copyright><![CDATA[向东博客 专注WEB应用 构架之美 --- 构架之美，在于尽态极妍 | 应用之美，在于药到病除]]></copyright>
<item>
<link>http://www.jackxiang.com/post//</link>
<title><![CDATA[snoopy——PHP版的网络客户端，破解验证码的请求好像用得上。]]></title> 
<author>jack &lt;xdy108@126.com&gt;</author>
<category><![CDATA[WEB2.0]]></category>
<pubDate>Wed, 30 Dec 2009 02:16:22 +0000</pubDate> 
<guid>http://www.jackxiang.com/post//</guid> 
<description>
<![CDATA[ 
	背景：当使用对字符串验证的土图片破解后，有用snoopy去伪装请求，如下：破解完成上面的验证码，我们就可以使用snoopy(比curl要轻量，所以我喜欢)来模拟浏览器器，访问网站了。<br/>来自：<br/>http://blog.csdn.net/ugg/article/details/3953137&nbsp;&nbsp;<br/>http://blog.csdn.net/ugg/article/details/3972368<br/><br/> snoopy是一个php类，用来模仿web浏览器的功能，它能完成获取网页内容和发送表单的任务。&nbsp;&nbsp;<br/> 下面是它的一些特征：&nbsp;&nbsp;<br/> 1、方便抓取网页的内容&nbsp;&nbsp;<br/> 2、方便抓取网页的文字（去掉HTML代码）&nbsp;&nbsp;<br/> 3、方便抓取网页的链接&nbsp;&nbsp;<br/> 4、支持代理主机&nbsp;&nbsp;<br/> 5、支持基本的用户/密码认证模式&nbsp;&nbsp;<br/> 6、支持自定义用户agent,referer,cookies和header内容&nbsp;&nbsp;<br/> 7、支持浏览器转向，并能控制转向深度&nbsp;&nbsp;<br/> 8、能把网页中的链接扩展成高质量的url（默认）&nbsp;&nbsp;<br/> 9、方便提交数据并且获取返回值&nbsp;&nbsp;<br/> 10、支持跟踪HTML框架（v0.92增加）&nbsp;&nbsp;<br/> 11、支持再转向的时候传递cookies&nbsp;&nbsp;<br/> 下面是简单的例子，比如说我们抓取我的blog的文字&nbsp;&nbsp;<br/><br/><div class="code"> include &quot;Snoopy.class.php&quot;;&nbsp;&nbsp;<br/> $snoopy = new Snoopy;&nbsp;&nbsp;<br/> $snoopy-&gt;fetchtext(&quot;http://www.phpobject.net/blog&quot;);&nbsp;&nbsp;<br/> echo $snoopy-&gt;results; </div><br/> ^_^，不错把，在比如抓取链接&nbsp;&nbsp;<br/><br/><div class="code"> include &quot;Snoopy.class.php&quot;;&nbsp;&nbsp;<br/> $snoopy = new Snoopy;&nbsp;&nbsp;<br/> $snoopy-&gt;fetchlinks(&quot;http://www.phpobject.net/blog&quot;);&nbsp;&nbsp;<br/> print_r($snoopy-&gt;results); </div><br/> 使用snoopy提交数据实现登陆&nbsp;&nbsp;<br/> 模拟登陆可以用curl或者socket来实现，当curl需要服务器相应的启用curl module，自己socket实现相对比较麻烦，使用snoopy就简单了很多啦。&nbsp;&nbsp;<br/> 在这里，我们使用喜悦国际村做为例子。（^_^，纯属研究）&nbsp;&nbsp;<br/> 首先，我们要获取到登陆需要发送什么字段，目标地址是什么。这里我们使用snoopy的fetchform来实现。&nbsp;&nbsp;<br/><div class="code"> include &quot;Snoopy.class.php&quot;;&nbsp;&nbsp;<br/> $snoopy = new Snoopy;&nbsp;&nbsp;<br/> $snoopy-&gt;fetchform(&quot;http://www.jackxiang.com/happy/logging.php?action=login&quot;);&nbsp;&nbsp;<br/> print $snoopy-&gt;results;&nbsp;&nbsp;</div><br/> 当然你也可以直接查看http://www.jackxiang.com/happy/…的源代码来实现，不过这样更加方便把。这里，我们获取到目标和提交的数据，下一步就可以实现模拟登陆了。代码如下：&nbsp;&nbsp;<br/> <br/><div class="code">include &quot;Snoopy.class.php&quot;;&nbsp;&nbsp;<br/> $snoopy = new Snoopy;&nbsp;&nbsp;<br/> $submit_url = &quot;http://www.jackxiang.com/happy/logging.php?action=login&quot;;&nbsp;&nbsp;<br/>&nbsp;&nbsp;&nbsp;&nbsp;<br/> $submit_vars&#91;&quot;loginmode&quot;&#93; = &quot;normal&quot;;&nbsp;&nbsp;<br/> $submit_vars&#91;&quot;styleid&quot;&#93; = &quot;1&quot;;&nbsp;&nbsp;<br/> $submit_vars&#91;&quot;cookietime&quot;&#93; = &quot;315360000&quot;;&nbsp;&nbsp;<br/> $submit_vars&#91;&quot;loginfield&quot;&#93; = &quot;username&quot;;&nbsp;&nbsp;<br/> $submit_vars&#91;&quot;username&quot;&#93; = &quot;********&quot;; //你的用户名&nbsp;&nbsp;<br/> $submit_vars&#91;&quot;password&quot;&#93; = &quot;*******&quot;; //你的密码&nbsp;&nbsp;<br/> $submit_vars&#91;&quot;questionid&quot;&#93; = &quot;0&quot;;&nbsp;&nbsp;<br/> $submit_vars&#91;&quot;answer&quot;&#93; = &quot;&quot;;&nbsp;&nbsp;<br/> $submit_vars&#91;&quot;loginsubmit&quot;&#93; = &quot;提&nbsp;&nbsp; 交&quot;;&nbsp;&nbsp;<br/> $snoopy-&gt;submit($submit_url,$submit_vars);&nbsp;&nbsp;<br/> print $snoopy-&gt;results;&nbsp;&nbsp;</div>^_^，是不是显示你已经登陆了？使用snoopy就是这么简单！<br/><br/>参考使用php snoopy 类模拟GET/POST请求：http://outofmemory.cn/code-snippet/2463/usage-php-snoopy-class-moni-GET-POST-request<br/><br/>Download 类名：http://sourceforge.net/projects/snoopy/<br/>代码参考：http://www.nowamagic.net/librarys/veda/detail/855
]]>
</description>
</item><item>
<link>http://www.jackxiang.com/post//#blogcomment</link>
<title><![CDATA[[评论] snoopy——PHP版的网络客户端，破解验证码的请求好像用得上。]]></title> 
<author> &lt;user@domain.com&gt;</author>
<category><![CDATA[评论]]></category>
<pubDate>Thu, 01 Jan 1970 00:00:00 +0000</pubDate> 
<guid>http://www.jackxiang.com/post//#blogcomment</guid> 
<description>
<![CDATA[ 
	
]]>
</description>
</item>
</channel>
</rss>