吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 503|回复: 2
收起左侧

[Python 原创] Dissionpage实现 Molecular Plant文献获取

[复制链接]
13955925361 发表于 2024-5-23 20:08
本帖最后由 13955925361 于 2024-5-23 20:34 编辑

co中的参数请填写自己浏览器所在地址
page.get()的网址请填写自己想请求的具体网址(https://www.sciencedirect.com  Molecular plant 主站中) 关键词自选

[Python] 纯文本查看 复制代码
import numpy as np
import pandas as pd

from DrissionPage import ChromiumPage
from DrissionPage import ChromiumPage,ChromiumOptions
co=ChromiumOptions().set_paths(browser_path=r'C:\Program Files (x86)\Microsoft\Edge\Application\msedge.exe')
page = ChromiumPage(co)
page.get('https://www.sciencedirect.com/search?qs=wheat&pub=Molecular%20Plant&cid=311979&sortBy=date')
a=page.eles('.ResultItem col-xs-24 push-m')
weblist=[]
for i in a:
    t=i.ele('t:a').text
    ppp=str(i.ele('.srctitle-date-fields').text)
    pp = ppp.split(' ')[-2:]
    p=' '.join(pp)
    w=i.ele('t:a').attr('href')
    j = 'Molecular Plant'
    data = {
        'Title': t,
        'Pubdate': p,
        'Journal': j,
        'Web': w
    }
    weblist.append(w)
    df = pd.DataFrame(data,index=[0])
    df.to_csv('test1.csv',mode='a',index=False,header=False)
for i in weblist:
    page.get(i,retry=3,interval=2,timeout=10)
try:
    d = page.ele('.anchor doi anchor-default').attr('href')
except:
    d = 'None'
try:
    Ab = page.ele('#abspara0010').text
except:
    Ab = 'None'
lis = [i, d, Ab]
df = pd.DataFrame(lis)
df.to_csv('test2.csv', mode='a', index=False, header=False)

免费评分

参与人数 1吾爱币 +5 热心值 +1 收起 理由
苏紫方璇 + 5 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

Cacarot 发表于 2024-5-24 09:47
感觉Dissionpage比selenium强
feiyu361 发表于 2024-5-24 09:55
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止灌水或回复与主题无关内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-6-16 18:28

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表