-
-
Notifications
You must be signed in to change notification settings - Fork 416
Commit
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
Simplifica definição de extensão de arquivo baixado (#1153)
Melhorias em #1045 Quando a extensão do arquivo não é informada no nome dele, tentamos identificar ela através dos headers do response ou através de seu conteúdo. Porém devido a maneira como o Scrapy funciona, isso vai fazer com que o arquivo seja baixado novamente em novas execuções do spider. Para resolver esse problema seria necessários muitas mudanças na estrutura do Scrapy (incluindo a criação de novos FileStorage, o que tornaria o projeto mais complexo, com um ganho de performance irrelevante. Com esse modificação, identificamos a extensão, e se ela não vier por padrão, o arquivo será baixado novamente toda vez que reexecutarmos o spider (o que nunca acontece em produção para a data específica)
- Loading branch information
Showing
4 changed files
with
35 additions
and
4 deletions.
There are no files selected for viewing
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
|
@@ -3,6 +3,7 @@ boto3==1.24.89 | |
click | ||
chompjs | ||
dateparser | ||
filetype | ||
itemadapter | ||
jinja2 | ||
psycopg2-binary | ||
|
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters