吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 6504|回复: 27
收起左侧

[其他原创] 【友友 RPA】零基础小白系列分享:阿里巴巴、天猫、淘宝商品评价图片采集

  [复制链接]
lisaisacat 发表于 2022-7-14 17:16
本帖最后由 lisaisacat 于 2022-7-14 19:06 编辑

开发环境:
友友编辑器版本 1.2.6
SDK 版本 1.0.2.31

Microsoft Windows 10 专业版 10.0.19043 64 位
NET Framework 4.8.4400.0

运行环境:
Chrome 浏览器
Version 102.0.5005.63 (Official Build) (64-bit)
需要安装友友谷歌插件 v1.0.52



可视化流程:
image.png

设计思路:
1. 输入关键词搜索
2. 循环相似元素获取商品信息
3. 写入 Excel
4. 重命名:阿里巴巴+关键词+日期
5. 如果要抓取多页还可以用For 次数循环+【点击目标】点击下一页按钮

关于元素:
相关阅读:https://www.52pojie.cn/thread-1652269-1-1.html
由于阿里巴巴的网页写得很规范,几乎无需对元素属性进行编辑,这里要为程序员点个赞~
相比之下企查查程序员写的简直就是一坨 X

代码详解:
第 1 行和第 2 行:赋值,也就是创建后面要用到的变量,方便后期维护
一个是 Excel 文件路径,一个是搜索关键词,因为后面好几个地方重复用到,用变量的话以后修改就不用挨个去找了
image.png

第 3 行~第 6 行和菜鸟流程很像,这里就不详细说了,都是中文,应该都能看懂吧


第 7 行:这里是因为上面点击搜索按钮自动打开了新标签页,就需要获取下网页对象
image.png




第 9 行:先给 Excel 写个表头,注意这里的范围是行,所以写入内容的格式为列表
如果说数字和文本是一颗颗珠子,那么列表则可以理解为用珠子穿起来的一串
格式为 ["","",""]
双引号表示珠子是文本,半角逗号分隔
image.png




接下来是几个循环相似元素和写入,大同小异,只讲一个就行:

image.png

首先是如何获取相似元素,点击右侧【选择目标】或者缩略图,选择(CTRL+鼠标左键)一个元素
比如下图中的标题 1,然后点击【选择相似元素】,CTRL+鼠标左键点击标题 2
会在网页上把相似元素高亮显示,如果发现和你要选的相似元素符合,就点击【保存】
image.png
image.png

如果发现结果不太满意,也可以重新选择元素 2,甚至点击重新选择,从元素 1 开始
image.png
循环相似元素的返回值有俩,大部分时候我们只用到循环项
在这里就是一个个的标题了
注意返回类型要选择文本才能获取到文字,当然你也可以选择链接,再多加个循环写到后面的列

接下来就是查看列 A 现在有几行,比如只写入了 1 行,那么就赋值“写入行数”为 1+1=2,即接下来的内容要写在 A2 单元格




第 35 行:自动调整下列宽

image.png



最后几行就是给文件重命名,防止下次运行的时候把它给覆盖了
需要注意的是,获取到的时间不一定是数字格式噢
字符串和变量之间的连接符是加号 +
image.png
image.png

最终效果
这个流程有个很大的缺陷就是因为部分商品没有复购率信息,循环获取就会导致商品和复购率对不上号,目前我还没想到什么办法解决……


image.png
image.png


子流程里加了个结构化数据的,倒是可以保证每个商品的信息都在一起,但是没有进行拆分,看起来很乱
image.png

流程源码下载:
阿里巴巴商品信息:https://console.yoyorpa.com/process_share?id=sSNTW4R6FkRFzZu7Hoguxlsx5CtFNVYgNL9KP1Qvm
天猫商品评论图片和淘宝评价采集:https://console.yoyorpa.com/process_share?id=oxG7FvHZysaxezz2xcu41b9HqTjyrD3QcLYShGRQ92ooCYra
image.png
image.png

友友编辑器 beta 测试版(http://www.yoyorpa.com/studio)


使用方法:
友友编辑器→左上角文件→导入压缩包→选择流程项目→顶部运行



写在最后
同样的思路可以用于绝大多数网页信息的采集,比如我做过的黑猫投诉、淘宝评价、教务系统分数、亚马逊、股票信息排行等等,框架都差不多,只是有些网页开发的不太规范,需要在元素属性那里调整下

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
zhanglei1371 + 1 + 1 热心回复!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| lisaisacat 发表于 2022-7-18 10:14
qq20048888 发表于 2022-7-14 21:54
可以打包exe吗? 收费吗?

仔细看帖子
 楼主| lisaisacat 发表于 2022-7-14 18:26
一场荒唐半生梦 发表于 2022-7-14 18:08
某宝 某多 某东之类的可以用吗 楼主

都可以啊 拼多多我也试了 不过只支持电脑浏览器的网页版噢
一场荒唐半生梦 发表于 2022-7-14 18:08
qq20048888 发表于 2022-7-14 21:54
可以打包exe吗? 收费吗?
lsy832 发表于 2022-7-14 23:09
自动化么???
请输入密码 发表于 2022-7-15 00:46
友友 RPA 收费吗?
yyl530 发表于 2022-7-15 05:28
学习一下
happycrab 发表于 2022-7-15 11:35
win10系统,打开阿里巴巴.xlxs会报错说打开失败,我修改了路径并创建文件后,也还是打开失败
happycrab 发表于 2022-7-15 11:37
这是报错信息

报错信息

报错信息
sq7649 发表于 2022-7-16 17:26
学习一下,
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止灌水或回复与主题无关内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-4-29 19:09

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表