soumu_scrapy

setup and basic usage

python 3.6.x recommended.

clone this repository

git clone https://github.com/01mokuba/soumu_scrapy.git
cd maff_scrapy

install Scrapy

python -m venv .venv
source ./.venv/bin/activate
pip install scrapy

run the crawler

cd soumu_scrapy
scrapy crawl archive -o soumu.json --logfile soumu.log

The results saved in soumu_scrapy/maff.json and the log saved in soumu_scrapy/maff.log. Downloaded PDFs are saved in soumu_scrapy/downloads/full.

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
soumu_scrapy		soumu_scrapy
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
scrapy.cfg		scrapy.cfg
soumu.json		soumu.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

soumu_scrapy

soumu_scrapy

.gitignore

.gitignore

LICENSE

LICENSE

README.md

README.md

scrapy.cfg

scrapy.cfg

soumu.json

soumu.json

Repository files navigation

soumu_scrapy

setup and basic usage

About

Releases

Packages

Languages

License

01mokuba/soumu_scrapy

Folders and files

Latest commit

History

Repository files navigation

soumu_scrapy

setup and basic usage

About

Resources

License

Stars

Watchers

Forks

Languages