WV Code - Arquivos do Blog

Olá!!!

Aqui neste repositório, você encontrará todos os scripts e datasets que são utilizados nos artigos do nosso blog.

Todos os scripts foram desenvolvidos por mim e pela Vanessa, com a finalidade de ilustrar o conhecimento que estamos querendo compartilhar.

Todos os datasets são públicos e foram obtidos em diversos sites. O arquivo readme.md em cada folder tem mais detalhes. Se você for utilizar estes arquivos em outras atividades, não esqueça de referenciar a origem do dataset.

Abaixo seguem algumas orientações de como utilizar estes datasets.

Estou utilizando o Google Colab

Se você está seguindo a dica dos instrutores e utilizando o Google Colab para escrever seus notebooks, você pode baixar uma cópia dos dados no próprio Google Colab. Para isto, você precisa apenas adicionar o seguinte comando em uma célula de código do seu notebook:

!git lfs clone -l -s https://github.com/wvcode/blog-arquivos.git

Dica
Ao organizar seu notebook, crie uma seção no início onde você inicializa o ambiente, incluindo realizar o download dos datasets.

Este mesmo comando deve funcionar em outros ambientes similares ao Google Colab, como o Jupyter e Deepnote.

Estou utilizando VSCode, PyCharm e outras IDEs

Isto significa que você está utilizando seu próprio computador para realizar o desenvolvimento dos seus notebooks. Por isso, a maneira mais simples é baixar o repositório em um local que você possa acessar facilmente a partir dos seus notebooks.

Escolha um diretório e utilize o seguinte comando a partir do seu prompt:

> git clone https://github.com/wvcode/blog-arquivos.git && rm -rf blog-arquivos/.git

AVISO: esse comando funciona em sistemas operacionais linux e mac. Se você está usando Windows, o comando se divide em dois:

> git clone https://github.com/wvcode/blog-arquivos.git 
> del blog-arquivos/.git

Dependências

Para baixar os datasets no seu computador, você precisa ter o cliente do Git instalado em seu computador. Você pode obte-lo aqui.

E se eu não quiser baixar os arquivos, como faço???

Se você não quiser baixar os arquivos, para poupar seus recursos de armazenamento, ainda existe uma alternativa: você pode acessar os arquivos de forma online através de uma URL especial do GitHub!

URL

https://github.com/wvcode/blog-arquivos/blob/main/datasets/<diretorio>/<nome do arquivo>?raw=true

onde:

<diretorio> - pasta de onde queremos ler o arquivo. Exemplo: pokemons é a pasta que contém o dataset de pokemons.
<nome do arquivo> - nome do arquivo de dados. Exemplo: na pasta pokemons temos o arquivo pokemons.csv.

Então, mostrando o exemplo completo: Se quisermos carregar os dados de pokemons em um DataFrame do Pandas, o código seria esse:

import pandas as pd

pokemons = pd.read_csv('https://github.com/wvcode/blog-arquivos/blob/main/datasets/pokemons/pokemon.csv?raw=true')

print(pokemons.shape)
(1032, 44)

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
datasets		datasets
scripts		scripts
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

WV Code - Arquivos do Blog

Estou utilizando o Google Colab

Estou utilizando VSCode, PyCharm e outras IDEs

Dependências

E se eu não quiser baixar os arquivos, como faço???

URL

About

Releases

Packages

Languages

License

wvcode/blog-arquivos

Folders and files

Latest commit

History

Repository files navigation

WV Code - Arquivos do Blog

Estou utilizando o Google Colab

Estou utilizando VSCode, PyCharm e outras IDEs

Dependências

E se eu não quiser baixar os arquivos, como faço???

URL

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages