Sci-Hub + Python爬虫实现文献批量下载

操作思路 在Web of Science或者其他学术搜索引擎上查找所需要的文献,然后将全体检索结果的信息导出成Excel(包括作者、标题、出版年份、期刊、DOI号等等) 以DOI号为检索条件,到Sci-Hub下载文献,将这一过程写成爬虫进行批量处理 导出DOI号序列,写成循环来逐个爬取 以DOI号检索文献,进入下载页面,查找到保存按钮对应的元素,下载到本地 将下载的PDF文件按照自己的标准重命名 手动补全无法在Sci-Hub上得到的文献 ...

May 18, 2022 · 4 min · Sheng, D.

我国海水水质数据分析

环境数据分析课程的大作业,主要目的应用一下课上学到的一些数据分析方法。 通过爬虫获取我国沿海海水水质的监测数据; 以散点图直观反映水质类别的分布和随时间变化情况; 将化学需氧量数据转换为正态分布,以海区/省份为分类变量进行单因素方差分析; 将无机氮数据转换为正态分布,用Pearson分析和线性回归分析考察化学需氧量和无机氮数据的相关性; 利用机器学习,从多个污染指标数据预测海区分类。 ...

April 24, 2022 · 10 min · Sheng, D.

用Python爬虫爬取高校教师邮箱

最近在做的一个科研训练项目需要向某一交叉领域的专家们发送问卷调查。于是想到通过爬虫爬取国内各大高校在环境、建筑、能源等专业的教授的信息(姓名、邮箱、研究领域等等),再根据研究方向初步筛选,得到待定的专家组名单。🕷️ 预先准备 安装python第三方库:requests,re,csv(必要) 正则表达式在线测试工具:在线正则表达式测试 (oschina.net)(非必要) ...

March 18, 2022 · 2 min · Sheng, D.