<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">
<channel>
<title><![CDATA[向东博客 专注WEB应用 构架之美 --- 构架之美，在于尽态极妍 | 应用之美，在于药到病除]]></title> 
<link>http://www.jackxiang.com/index.php</link> 
<description><![CDATA[赢在IT，Playin' with IT,Focus on Killer Application,Marketing Meets Technology.]]></description> 
<language>zh-cn</language> 
<copyright><![CDATA[向东博客 专注WEB应用 构架之美 --- 构架之美，在于尽态极妍 | 应用之美，在于药到病除]]></copyright>
<item>
<link>http://www.jackxiang.com/post//</link>
<title><![CDATA[Linux下的文件行分割：split函数]]></title> 
<author>jack &lt;xdy108@126.com&gt;</author>
<category><![CDATA[WEB2.0]]></category>
<pubDate>Fri, 17 Sep 2010 05:48:43 +0000</pubDate> 
<guid>http://www.jackxiang.com/post//</guid> 
<description>
<![CDATA[ 
	<div class="code">split -l 5000 CCC.txt CCC_New.txt</div><br/><br/>[~/split]# ls<br/>CCC_New.txtaa&nbsp;&nbsp;CCC_New.txtad&nbsp;&nbsp;CCC_New.txtag&nbsp;&nbsp;CCC_New.txtaj&nbsp;&nbsp;CCC_New.txtam&nbsp;&nbsp;CCC_New.txtap<br/>CCC_New.txtab&nbsp;&nbsp;CCC_New.txtae&nbsp;&nbsp;CCC_New.txtah&nbsp;&nbsp;CCC_New.txtak&nbsp;&nbsp;CCC_New.txtan&nbsp;&nbsp;CCC_New.txtaq<br/>CCC_New.txtac&nbsp;&nbsp;CCC_New.txtaf&nbsp;&nbsp;CCC_New.txtai&nbsp;&nbsp;CCC_New.txtal&nbsp;&nbsp;CCC_New.txtao&nbsp;&nbsp;CCC.txt<br/>今天接到一个需求是提取5月访问某域名的所有用户号码，文件一存放访问域名下地址A的用户号码，剩余用户按照50万整数一个包为规则提取。<br/><br/>这个剩余用户按照50万一个包让人看着有点紧张，怎么提？难道要用rownum？<br/><br/>不要被蒙蔽！还是提成一个文件好了，用linux下的split一分就完事了。<br/><br/>怎么用？<br/><br/>这样写<br/><br/><br/><div class="code">split -l 500000 js_24875.csv new_js_24875.csv</div><br/><br/><div class="code">split&nbsp;&nbsp;-l n</div>把infile拆分为n行的段，默认一个文件为1000行、、<br/><br/><br/><div class="code">split --help<br/>&nbsp;&nbsp;-l, --lines=NUMBER&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;put NUMBER lines per output file</div><br/>注意：<br/>split: Output file suffixes exhausted 注意此处：split在提示我们说输出时的文件名后缀被用光了<br/><br/><br/><br/>[root@linux ~]# split [-bl] file PREFIX<br/>参数：<br/>-b&nbsp;&nbsp;：后面可接欲分割成的档案大小，可加单位，例如 b, k, m 等；<br/>-l&nbsp;&nbsp;：以行数来进行分割。<br/>范例：<br/>范例一：我的 /etc/termcap 有七百多K，若想要分成 300K 一个档案时？<br/>[root@linux ~]# cd /tmp; split -b 300k /etc/termcap termcap<br/>[root@linux tmp]# ls -l termcap*<br/>-rw-rw-r--&nbsp;&nbsp;1 root root&nbsp;&nbsp;307200&nbsp;&nbsp;8月 17 00:25 termcapaa<br/>-rw-rw-r--&nbsp;&nbsp;1 root root&nbsp;&nbsp;307200&nbsp;&nbsp;8月 17 00:25 termcapab<br/>-rw-rw-r--&nbsp;&nbsp;1 root root&nbsp;&nbsp;184848&nbsp;&nbsp;8月 17 00:25 termcapac<br/># 那个档名可以随意取的啦！我们只要写上前导文字，小档案就会以<br/># xxxaa, xxxab, xxxac 等方式来建立小档案的！<br/>范例二：如何将上面的三个小档案合成一个档案，档名为 termcapback<br/>[root@linux tmp]# cat termcap* &gt;&gt; termcapback<br/># 很简单吧？就用资料流重导向就好啦！简单！
]]>
</description>
</item><item>
<link>http://www.jackxiang.com/post//#blogcomment</link>
<title><![CDATA[[评论] Linux下的文件行分割：split函数]]></title> 
<author> &lt;user@domain.com&gt;</author>
<category><![CDATA[评论]]></category>
<pubDate>Thu, 01 Jan 1970 00:00:00 +0000</pubDate> 
<guid>http://www.jackxiang.com/post//#blogcomment</guid> 
<description>
<![CDATA[ 
	
]]>
</description>
</item>
</channel>
</rss>