客至汲泉烹茶, 抚琴听者知音

pdf

前言我需要国家重点监控企业名单数据,网上找了一下,最新数据是2017年,网址如下:https://www.cenews.com.cn/company/201711/t20171116_858015.html。写个爬虫脚本把所有pdf下载下来后,遇到个大问题:pdf肯定是无法直接使用的,我需要把他们转为DataFrame格式方便分析。python方案首先我用的肯定是python,搜了一下貌似大...