跳到主要内容

爬虫基础

被高教院拉过去手动下载了几百篇论文,对爬虫的需求迫在眉睫,不能再重复劳动了,这就开始学爬虫

教程地址:【【吊打付费】目前B站最完整的Python爬虫教程,包含所有干货内容!这还没人看,我不更了!】 https://www.bilibili.com/video/BV1uN4y1W7Du/?p=53&share_source=copy_web&vd_source=6d00b53723acbde42820eed19b9e7c5b

教程有点过期了,但是也能用,有些网站爬不了就换别的

1.爬虫基础

需要python基础,这个看看书一天就能搞定了。不熟的地方写的时候再学

爬虫就是用代码代替浏览器请求获取数据,难点目前有两个

1是反爬,教程里好多网站用教程的方法没法爬取了

2是文件数据解析。这个按我的需求比较简单,很多方法能实现

2.常用爬虫工具库

requests:发送网络请求

bs4,xpath:解析网页数据