用selenium驱动浏览器往下滑动,刷新全部数据,实现所有数据都可获取

2021年9月20日 4点热度 0条评论 来源: weixin_43256057

意义:用selenium访问浏览器时,该网站可能只给你上半部分的数据,爬虫也只能获取这些数据了,你需要滑动到下面,它才给你返回下半部分的网页数据。这样就可以获取到该页面的全部数据。
scrollTop=8000的8000是可以自己调整,是指明要滑动的距离(单位:像素) 。
在self.dri.get(
https://search.jd.com/Search?keyword=华为手机&enc=utf-8&qrst=1&rt=1&stop=1&vt=2&bs=1’) 后面添加下面语句。

    js = 'var q=document.documentElement.scrollTop=8000'
    self.dri.execute_script(js)
    time.sleep(3)

往下再写self.get_page_from_url()等方法即可,网速慢的话time.sleep()时间还得延长超过3秒哦。

管用的希望能给我点赞或收藏哦。

    原文作者:weixin_43256057
    原文地址: https://blog.csdn.net/weixin_43256057/article/details/90693584
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系管理员进行删除。