淘寶商家如何用代碼爬抓電商數(shù)據(jù)?具體操作方法是什么?
ymq362010483樓主|2020-08-20|11:48|發(fā)布在分類 / 店鋪管理|閱讀:8282
ymq362010483樓主|2020-08-20|11:48|發(fā)布在分類 / 店鋪管理|閱讀:8282
網(wǎng)址的q=后面的T%D0%F4是T恤的uncode碼,另外,利用參數(shù)sort來指定排名類型,如sort=default是綜合排名sort=renqi-desc是人氣排名sort=sale-desc是銷量排名s=40是頁碼,公式是40(頁碼-1),非常明顯,s=40就是第2頁直接利用代碼組合網(wǎng)址,如http://s.taobao.com/search實(shí)例一:獲取淘寶搜索結(jié)果頁寶貝信息如下圖,搜索了關(guān)鍵詞“T恤”后,會(huì)看到類似這樣的結(jié)果,我想把寶貝標(biāo)題和價(jià)格,排名位置等信息給抓取到本地?cái)?shù)據(jù)庫或者表格里面然后寫入代碼(這里是截圖,在文章最后,會(huì)附上文本版的代碼)大家注意到,在第四行,有個(gè)很長(zhǎng)很長(zhǎng)的一串URL = "http://s.taobao.com/search工具:Excel2013(用哪個(gè)版本都是可以的)語言:Visual Basic for Applications(簡(jiǎn)稱VBA,集成在Office套件里面的開發(fā)程式,有些精簡(jiǎn)版或者用戶在安裝的時(shí)候取消了VBA套件,就會(huì)無法啟動(dòng))我原本學(xué)的是硬件開發(fā),只會(huì)匯編,寫這類程序不是我擅長(zhǎng)的,而且是自學(xué)的只有半桶水的狀態(tài)那么下面我用taobao.itemcats.get,來做例子首先,要閱讀這個(gè)API的說明文檔,知道這個(gè)接口的調(diào)用參數(shù),然后可以到沙箱里面測(cè)試http://api.taobao.com/apitools/apiTools.htmcatId=3apiName=taobao.itemcats.get,可以觀察返回的結(jié)果,我們要的數(shù)據(jù)一樣在兩個(gè)分隔符的中間,只要提取出來即可實(shí)例二:用首先,要到api.taobao.com注冊(cè)開發(fā)者身份,拿到app key 和 app secret然后,根據(jù)開發(fā)文檔的API列表:open.taobao.com/api/api_list.htm,查找相應(yīng)功能的api最后寫代碼即可,這段代碼,只要把a(bǔ)pp_key和secret替換成自己的,就可以運(yùn)行了運(yùn)行結(jié)果是把女裝(parent_cid是16)的子類目代碼和對(duì)應(yīng)的子類目名稱獲取下來其他電商平臺(tái),如一號(hào)店等,原理都是一樣的然后進(jìn)入vba編程環(huán)境插入模塊可以在這些模塊里面寫程式,下圖我一口氣插入了4個(gè)模塊,我在其中一個(gè)模塊上面寫入代碼即可
這個(gè)問題還有疑問的話,可以加幕.思.城火星老師免費(fèi)咨詢,微V.信X號(hào)是為: msc496。
推薦閱讀:
微信掃碼回復(fù)「666」