You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Então o raspador que temos - am_associacao_municipios.py que usa a BaseSigpub - pode não servir mais. Ao mesmo tempo, alguns elementos de página e o layout do diário parecem seguir iguais.
Tarefa
É necessário confirmar se realmente a mudança do site demanda a mudança do raspador, testando o código atual para a nova URL e, caso o código que temos não servir mais, desenvolver o raspador para o site novo.
É necessário atualizar o raspador para seguir o padrão de projeto. Por exemplo, está faltando o start_date (não achei a data exata, a edição mais velha que consegui encontrar é a 11: https://diariomunicipalaam.org.br/visualizar-publicacao/20091023). Se a edição 11 está em outubro de 2009, a 1 deve estar por ali no meio do ano de 2009.
Interessante notar que nesse site novo, o /path é a data. No caso acima 20091023 <> 2009-10-23
The text was updated successfully, but these errors were encountered:
Parece que a associação de municípios do Amazonas migrou de site:
antes: https://www.diariomunicipal.com.br/aam; agora: https://diariomunicipalaam.org.br/
Então o raspador que temos - am_associacao_municipios.py que usa a BaseSigpub - pode não servir mais. Ao mesmo tempo, alguns elementos de página e o layout do diário parecem seguir iguais.
Tarefa
É necessário confirmar se realmente a mudança do site demanda a mudança do raspador, testando o código atual para a nova URL e, caso o código que temos não servir mais, desenvolver o raspador para o site novo.
É necessário atualizar o raspador para seguir o padrão de projeto. Por exemplo, está faltando o
start_date
(não achei a data exata, a edição mais velha que consegui encontrar é a 11: https://diariomunicipalaam.org.br/visualizar-publicacao/20091023). Se a edição 11 está em outubro de 2009, a 1 deve estar por ali no meio do ano de 2009.Interessante notar que nesse site novo, o
/path
é a data. No caso acima20091023
<> 2009-10-23The text was updated successfully, but these errors were encountered: