吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 5897|回复: 12
收起左侧

[Python 转载] 基于Scrapy框架爬虫淘宝列表图片和店铺名

[复制链接]
qq58452077 发表于 2018-7-22 11:32
本帖最后由 qq58452077 于 2018-7-22 12:18 编辑

                              爬虫使用教程
一.安装python2运行环境   
1.可以去官网下载
a)     . https://www.python.org/downloads/      
      QQ图片20180722105941.png       
2.文件夹里     
QQ图片20180722110237.png
配置window环境变量
1. QQ图片20180722110417.png          
       QQ图片20180722110421.png      
   2.网上有详细安装说明
https://jingyan.baidu.com/article/7908e85c78c743af491ad261.html        
.安装python2第三方库
1.使用python自带包管理器pip安装
         pip install Scrapy
         pip install Django==1.8.2

         pip install selenium
         pip install image
2.安装py2win32
这个是二级制文件  
    QQ图片20180722110735.png
  也是可以用pip install pypiwin32 安装
.修改项目配置
   QQ图片20180722111051.png
             QQ图片20180722111128.png
             QQ图片20180722112305.png   
修改settings.py文件  
QQ图片20180722112417.png               
1.修改谷歌浏览器驱动目录      
CHROMEDRIVER_PATH= r"D:\Program Files (x86)\Browser\Chrome\chromedriver.exe"     
2.修改谷歌浏览器安装运行文件      
CHROMEBIN_PATH =r"D:\Program Files (x86)\Browser\Chrome\Chrome.exe"
       QQ图片20180722112532.png   
       QQ图片20180722112625.png      
   QQ图片20180722112840.png    
   QQ图片20180722112922.png    
修改文件图片存放路径  IMAGES_STORE ="E:\home"
五.运行项目      
  进入文件夹
   QQ图片20180722113039.png
  按shift+右键点击在此处打开命令窗口  
     Python  cmdline.py

      
             taobaoSpider.rar (23.16 KB, 下载次数: 45)

            其他附件下载(python2,pywin32,Chrome(包含selenium驱动))
            链接: https://pan.baidu.com/s/1kzkT3IGQdlC6EuZKmaM1qQ 密码: 8agm
         

      (楼主还是一方式基于Splash框架爬虫,此方式需要搭建docker虚拟环境来运行
       以上两个方式大概不会被反爬虫机制所限制

           此爬虫仅供学习和参考(如有api版本方式爬虫望告知楼主)
      




       新人发帖,坛友们多多支持!!!!!


       望大佬指点指点!!!
      

      
   
         
            

免费评分

参与人数 2吾爱币 +4 热心值 +2 收起 理由
zrl201314 + 1 + 1 用心讨论,共获提升!
wushaominkk + 3 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

zrl201314 发表于 2018-11-17 15:47
大佬  你说的 基于Splash框架爬虫,此方式需要搭建docker虚拟环境来运行 这个方法怎么实现的,求分享套路 谢谢
苏紫方璇 发表于 2018-7-22 11:37 来自手机
sdlwqzk 发表于 2018-7-22 11:42
 楼主| qq58452077 发表于 2018-7-22 11:47

已经上传了。。
隰则有泮 发表于 2018-7-22 11:49 来自手机
楼主的id 很危险啊0.0
头像被屏蔽
斩荒 发表于 2018-7-22 11:56 来自手机
提示: 作者被禁止或删除 内容自动屏蔽
过河的靴子 发表于 2018-7-22 18:27
挺详细的教程,很适合小白
 楼主| qq58452077 发表于 2018-7-22 19:36
过河的靴子 发表于 2018-7-22 18:27
挺详细的教程,很适合小白

还好。还好!!!  
天台 发表于 2018-7-23 14:35
感觉不错 先存下来了 晚上运行一下试试
水泥工艺学 发表于 2018-8-3 00:16

很有兴趣 关注一下~
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止灌水或回复与主题无关内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-4-26 08:03

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表