中文字幕日韩一区二区_国产一区二区av_国产毛片av_久久久久国产一区_色婷婷电影_国产一区二区精品

深入php數(shù)據(jù)采集的詳解

這里介紹兩個php采集能用到的好工具。一個是Snoopy,一個是simple_html_dom。采集還有很多方式(其實(shí)本質(zhì)就2-3種,其他的都是衍生的),php自帶了幾個方法也能直接進(jìn)行采集。但是,出于把懶惰進(jìn)行到底的精神。我們還是可以通過這兩個工具,讓采集變得更簡單。

網(wǎng)上有不少介紹Snoopy的,下面是別人翻譯的Snoopy的SDK
//////////////////////////////////////////////////////////////
Snoopy是一個php類,用來模擬瀏覽器的功能,可以獲取網(wǎng)頁內(nèi)容,發(fā)送表單。
Snoopy的一些特點(diǎn):
1抓取網(wǎng)頁的內(nèi)容 fetch
2抓取網(wǎng)頁的文本內(nèi)容 (去除HTML標(biāo)簽) fetchtext
3抓取網(wǎng)頁的鏈接,表單 fetchlinks fetchform
4支持代理主機(jī)
5支持基本的用戶名/密碼驗(yàn)證
6支持設(shè)置 user_agent, referer(來路), cookies 和 header content(頭文件)
7支持瀏覽器重定向,并能控制重定向深度
8能把網(wǎng)頁中的鏈接擴(kuò)展成高質(zhì)量的url(默認(rèn))
9提交數(shù)據(jù)并且獲取返回值
10支持跟蹤HTML框架
11支持重定向的時候傳遞cookies
要求php4以上就可以了 由于本身是php一個類 無需擴(kuò)支持 服務(wù)器不支持curl時候的最好選擇,
類方法:
fetch($URI)
――― 主站蜘蛛池模板: 一区二区av | 国产精品国产三级国产aⅴ无密码 | 日韩精品一区二区三区中文在线 | 999精彩视频 | av日韩在线播放 | 日韩av在线不卡 | 黄网站涩免费蜜桃网站 | 狠狠干夜夜草 | 国产免费一区二区三区 | 亚洲国产精品一区二区三区 | 精品视频久久久久久 | 国产精品高潮呻吟久久av野狼 | 国产男女猛烈无遮掩视频免费网站 | 91中文视频| 性色视频| 男女啪啪高潮无遮挡免费动态 | 久久影院一区 | 欧美xxxx色视频在线观看免费 | 青青草网站在线观看 | 春色av| 中文字幕亚洲欧美 | 久久国产精品久久久久久 | 一级黄色夫妻生活 | 黄色成人免费在线观看 | 欧美专区在线 | 一区二区免费在线视频 | 日韩精品视频一区二区三区 | www.久草| 欧美黑人体内she精在线观看 | 九色国产 | 久久99国产精一区二区三区 | 亚洲一区二区精品视频 | 久久大陆| 伊人网伊人网 | 亚洲国产精品视频 | 国产精品久久久久久久久久妇女 | 毛片的网址 | 天堂综合网久久 | 中文字幕免费在线观看 | 日韩欧美一区二区三区免费观看 | 特黄色毛片 |