集搜客爬虫结果很多个xml,于是做了一个python项目,自动将xml文件合并到一个csv文件中!这样excel就可以查看结果了!
|
2 months ago | |
---|---|---|
data | 7 years ago | |
.gitignore | 2 months ago | |
LICENSE | 7 years ago | |
README.md | 2 months ago | |
csv2excel.py | 4 years ago | |
main.py | 2 months ago | |
requirements.txt | 2 months ago | |
start_gooexport.bat | 2 months ago |
集搜客爬虫结果很多个xml,于是做了一个python项目,自动将xml文件合并到一个csv文件中!这样excel就可以查看结果了!
使用方法:
dataPath=xx resultFile=xx
needData=soup.findChild("box1") # 这里 box1 为 jisouke 整理箱的名称,比如box1
爬虫数据放到 data 目录中。
python main.py
virtualenv .venv
source .venv/bin/activate
.venv\Scripts\activate.bat
pip install pyinstaller
pip install -r requirements.txt
python main.py -i /workspace/gooExport/data
pyinstaller --onefile main.py