phishing-website-detection

Final master's degree project.

I used this dataset https://archive.ics.uci.edu/ml/datasets/phishing+websites and got good results using xgboost and a simple perceptron.

Undersampling techniques were used such as One-Sided Selection and Condensed Nearest Neighbor and they massively improved the training time of SVM models and the accuracy/precision/F1 measures of SVM with RBF Kernel.

Creators of the dataset used: Mohammad, Rami, Thabtah, Fadi Abdeljaber and McCluskey, T.L. (2015) Phishing Websites Dataset. [Dataset] (Unpublished)

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
assets		assets
data		data
final_models		final_models
gs_models		gs_models
publications		publications
rebalanced_data		rebalanced_data
Clustering.ipynb		Clustering.ipynb
Data Splitting.ipynb		Data Splitting.ipynb
EDA.ipynb		EDA.ipynb
MemoriaTFM.pdf		MemoriaTFM.pdf
Modeling I.ipynb		Modeling I.ipynb
Modeling II.ipynb		Modeling II.ipynb
Neural Network.ipynb		Neural Network.ipynb
Presentación TFM.pdf		Presentación TFM.pdf
README.md		README.md
Spark.ipynb		Spark.ipynb
Testing models.ipynb		Testing models.ipynb
accuracy_ranking.png		accuracy_ranking.png
dt.png		dt.png
environment.yml		environment.yml
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

phishing-website-detection

About

Releases

Packages

Languages

jvicentem/phishing-website-detection

Folders and files

Latest commit

History

Repository files navigation

phishing-website-detection

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages