<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">
<channel>
<title><![CDATA[向东博客 专注WEB应用 构架之美 --- 构架之美，在于尽态极妍 | 应用之美，在于药到病除]]></title> 
<link>http://www.jackxiang.com/index.php</link> 
<description><![CDATA[赢在IT，Playin' with IT,Focus on Killer Application,Marketing Meets Technology.]]></description> 
<language>zh-cn</language> 
<copyright><![CDATA[向东博客 专注WEB应用 构架之美 --- 构架之美，在于尽态极妍 | 应用之美，在于药到病除]]></copyright>
<item>
<link>http://www.jackxiang.com/post//</link>
<title><![CDATA[PHP正则表达式提取超链接及其标题]]></title> 
<author>jack &lt;xdy108@126.com&gt;</author>
<category><![CDATA[WEB2.0]]></category>
<pubDate>Fri, 12 Sep 2008 06:07:04 +0000</pubDate> 
<guid>http://www.jackxiang.com/post//</guid> 
<description>
<![CDATA[ 
	有这么一段HTML，比较不规则的，如果要提取其中的链接地址和链接名称，怎么弄？<br/><br/>//HTML<br/>$str = &#039;&lt;a id=&quot;top8&quot; href=&quot;http://list.mp3.baidu.com/song/A.htm?top8&quot; class=&quot;p14&quot; target=&quot;_top&quot;&gt;歌曲列表&lt;/a&gt;&lt;br&gt;&lt;a target=&quot;_blank&quot; id=&quot;bp&quot; href=&quot;http://list.mp3.baidu.com/list/bangping.html&quot; class=&quot;p14&quot;&gt;中文金曲榜&lt;/a&gt;&lt;br&gt;&lt;td nowrap=&quot;nowrap&quot;&gt;&amp;#8226;&amp;nbsp;&lt;a id=&quot;top19&quot; href=&quot;qingyinyue.html?top19&quot; class=&quot;p14&quot; target=&quot;_top&quot;&gt;轻音乐&lt;/a&gt;&lt;/td&gt;&#039;;<br/><br/>利用正则表达式是最简单的，其它的办法，偶米去想。。。<br/><br/>$pat = &#039;/&lt;a(.*?)href=&quot;(.*?)&quot;(.*?)&gt;(.*?)&lt;&#92;/a&gt;/i&#039;;<br/>preg_match_all($pat, $str, $m);<br/><br/>输出方法：<br/><br/>print_r($m[2]);<br/>print_r($m[4]);<br/><br/>或者：<br/>for($i=0;$i&lt;count($m[2]) ;$i++ ){<br/>&nbsp;&nbsp;&nbsp;&nbsp;echo &#039;&lt;li&gt;&lt;a href=&quot;&#039;.$_SERVER[&#039;PHP_SELF&#039;].&#039;?url=&#039;.$m[2][$i].&#039;&quot;&gt;&#039;.$m[4][$i].&#039;&lt;/a&gt;&#039;;<br/>}<br/><br/>显示结果是：<br/><br/>Array ( [0] =&gt; http://list.mp3.baidu.com/song/A.htm?top8 [1] =&gt; http://list.mp3.baidu.com/list/bangping.html [2] =&gt; qingyinyue.html?top19 ) Array ( [0] =&gt; 歌曲列表 [1] =&gt; 中文金曲榜 [2] =&gt; 轻音乐 )<br/><br/>于是，我们要采集某个网站的标题及链接地址方法就出来了。。。自己套用吧。。。<br/>
]]>
</description>
</item><item>
<link>http://www.jackxiang.com/post//#blogcomment</link>
<title><![CDATA[[评论] PHP正则表达式提取超链接及其标题]]></title> 
<author> &lt;user@domain.com&gt;</author>
<category><![CDATA[评论]]></category>
<pubDate>Thu, 01 Jan 1970 00:00:00 +0000</pubDate> 
<guid>http://www.jackxiang.com/post//#blogcomment</guid> 
<description>
<![CDATA[ 
	
]]>
</description>
</item>
</channel>
</rss>