爬虫基础
被高教院拉过去手动下载了几百篇论文,对爬虫的需求迫在眉睫,不能再重复劳动了,这就开始学爬虫
教程地址:【【吊打付费】目前B站最完整的Python爬虫教程,包含所有干货内容!这还没人看,我不更了!】 https://www.bilibili.com/video/BV1uN4y1W7Du/?p=53&share_source=copy_web&vd_source=6d00b53723acbde42820eed19b9e7c5b
教程有点过期了,但是也能用,有些网站爬不了就换别的
1.爬虫基础
需要python基础,这个看看书一天就能搞定了。不熟的地方写的时候再学
爬虫就是用代码代替浏览器请求获取数据,难点目前有两个
1是反爬,教程里好多网站用教程的方法没法爬取了
2是文件数据解析。这个按我的需求比较简单,很多方法能实现
2.常用爬虫工具库
requests:发送网络请求
bs4,xpath:解析网页数据