Este projeto realiza scraping de dados de produtos do Aliexpress, extraindo informações como nome do produto, preço, disponibilidade em estoque, detalhes sobre frete e se é a primeira compra.
/chrome_config
: Configuração do driver do Chrome para uso com Selenium.main.py
: Script principal que executa o scraping dos produtos.exemplo.json
: Arquivo de exemplo contendo os links e IDs dos produtos a serem analisados.
selenium
chromedriver
json
random
-
Clone este repositório:
git clone https://github.com/pedrohcleal/aliexpress_srape.git
-
Crie e ative um ambiente virtual:
python -m venv venv # No Linux: python3 -m venv venv venv\Scripts\activate # No Linux: source venv/bin/activate
-
Instale as dependências:
pip install -r requirements.txt
-
Configure o driver do Chrome na pasta
chrome_config
caso seja necessário, mas já está pronto para uso
-
Edite o arquivo
exemplo.json
com os produtos que deseja consultar. O formato é:[ { "link": "https://pt.aliexpress.com/item/1005007012057921.html", "idProduct" : 1, "oldPrice": 5.50, "oldStock" : 10 }, { "link": "https://pt.aliexpress.com/item/1005005970704465.html", "idProduct" : 2, "oldPrice": 5.50, "oldStock" : 10 }, ... ]
-
Execute o script:
python main.py
-
O resultado será salvo no arquivo
final_updates_ali.json
.
- e_primeira_compra: Verifica se é a primeira compra do usuário no produto.
- preco_produto: Extrai o preço atual do produto.
- verificar_estoque: Verifica se o produto está em estoque.
- texto_frete: Extrai e trata informações sobre o frete.
- get_ali_id: Extrai o ID do produto a partir do link da página.
O script gera um arquivo final_updates_ali.json
com as seguintes informações:
[
{
"idProduct": "123",
"ali_id": "456789",
"ali_link": "https://www.aliexpress.com/item/example.html",
"ali_nome_produto": "Exemplo de Produto",
"e_primeira_compra": true,
"em_estoque": false,
"frete": {"free_shipping": 1, "shipping": "0"},
"preco": "R$100,00",
"OldStock": 20,
"oldPrice": 23.40,
}
]