|
火車頭免費(fèi)版本不支持采集結(jié)果的外掛處理,比如采用php來輔助處理結(jié)果,而火車頭本身對于正則表達(dá)式的不完整支持,
導(dǎo)致對于采集一些有混淆文字的內(nèi)容效果不好,那么咱們怎么做到過濾那些混淆字串呢?
其實(shí)很簡單--采用服務(wù)器端過濾
比如采集發(fā)送到服務(wù)器端是:
$_POST = array("subject"=> "這里是標(biāo)題","content"=> "<div class='1fadfafasfasdf'>混淆文字</div>這里是內(nèi)容");
在服務(wù)器端我們稍加處理:
$_POST["content"] = preg_replace("正則表達(dá)式","",$_POST["content"]);
就可以使用熟悉的工具完成工作。
有朋友說了,我服務(wù)器端代碼是加密的怎么辦?
其實(shí)很簡單 比如 add.php 加密 ,那么將add.php 改名為 add_ori.php
然后建立新的 add.php
<?
//處理上傳來的數(shù)據(jù)
....
include dirname(__FILE__)."/add_ori.php";
?>
這樣就可以了
php技術(shù):火車采集器 免費(fèi)版使出收費(fèi)版本功能實(shí)現(xiàn)原理,轉(zhuǎn)載需保留來源!
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。