Skip to content

Latest commit

 

History

History
441 lines (221 loc) · 21 KB

path-full-stack-data-science.md

File metadata and controls

441 lines (221 loc) · 21 KB

全栈数据科学的路径

原文:www.kdnuggets.com/2021/09/path-full-stack-data-science.html

评论

作者:Jawwad Shadman Siddique,德州理工大学研究生

全栈数据科学已经成为计算机科学领域最热门的行业之一。从传统数学到数据工程等高级概念,这个行业要求广泛的知识和专业技能。它的需求在在线资源、书籍和教程中呈指数级增长。对初学者来说,这简直是令人不知所措。大多数初学者要么从 Python 课程、机器学习课程或一些基础数学课程开始。但许多人往往不知道从哪里入手。面对如此众多的资源,他们常常在各大平台之间游移,浪费了很多时间。


我们的三大课程推荐

1. 谷歌网络安全证书 - 快速进入网络安全职业道路

2. 谷歌数据分析专业证书 - 提升你的数据分析技能

3. 谷歌 IT 支持专业证书 - 支持你的组织 IT


涉及数据科学的学科领域。

本文的目标 不是列出所需的课程大纲,而是列出在端到端数据科学领域中,每个学科领域的一些突出的在线资源。它将帮助初学者在不浪费宝贵时间的情况下开始他们的数据科学之旅。我尽量将资源按顺序排列。但这可能会根据个人的专业知识和需求有很大差异。本文的重点仅仅是列出一些深入且全面的在线课程和教程,涉及到全栈数据科学的领域。我尽力将列表保持尽可能简短,以帮助初学者开始学习,而无需过多选择。

以下领域的资源

  • 数学 — 线性代数、微积分、概率、统计和凸优化

  • Python 编程 — 基础、面向对象的概念、算法、数据结构和数据科学应用

  • R 编程 — 基础、数据科学和网络应用

  • 核心数据科学概念— 数据库编程、机器学习、深度学习、自然语言处理、计算机视觉、强化学习、数据可视化、模型部署、大数据

  • C/C++ 编程— 基础、问题解决、面向对象编程概念、算法和数据结构

  • 计算机科学基础— 介绍、算法、数据结构、离散数学、操作系统、计算机体系结构、数据库概念、Git 和 GitHub

数学

线性代数

  1. 讲师:Grant Sanderson / 频道:3Blue1Brown

    课程: 线性代数的精髓

  2. 讲师:Prof. Gilbert Strang / MIT OpenCourseWare

    课程: 线性代数 / Youtube

  3. 讲师:Kaare Brandt Petersen & Michael Syskind Pedersen

    书籍: 矩阵代数

微积分

  1. 讲师:Grant Sanderson / 频道:3Blue1Brown

    课程: 微积分的精髓

  2. 讲师:Prof. David Jerison / MIT OpenCourseWare

    课程: 单变量微积分 / YouTube

  3. 讲师:Prof. Denis Auroux / MIT OpenCourseWare

    课程: 多变量微积分 / YouTube

概率与统计

  1. 讲师:Khan Academy

    课程: 概率论

  2. 讲师:Khan Academy

    课程: 统计学

  3. 讲师:Joshua Starmer

    课程: 统计学基础

  4. 讲师:Prof. John Tsitsiklis / MIT OpenCourseWare

    课程: 概率方法

  5. 讲师:Allen B. Downey

    书籍: 统计思维

注:在完成 Python 和统计学基础后使用此书

凸优化(高级概念)

  1. 讲师:Prof. Stephen Boyd / Stanford

    课程: 凸优化简介

Python 编程

Python 基础

  1. Python for Everybody: 课程 / 书籍 / 网站

  2. 《笨办法学 Python》: 书籍

  3. 《Think Python》:书籍

  4. Krish Naik 的 Python 编程:课程

  5. 完整的 Python 训练营:课程

算法与面向对象编程(OOP)与 Python

  1. 问题解决与面向对象编程(OOP)与 Python:课程

  2. 《Grokking Algorithms》:书籍

  3. 用 Python 自动化无聊的事务:课程

  4. (高级) 创业公司的社交网络分析:书籍

Python 数据科学

  1. Python 数据科学手册:书籍

  2. 数据科学与 Python:freecodecamp 课程

  3. 计算思维与数据科学导论:课程

  4. 应用数据科学与 Python:课程

R 编程

  1. R 数据科学:书籍

  2. 用 R 进行实用机器学习:书籍

  3. 使用 R Shiny 的互动网页应用:教程

数据库编程

  1. 数据库系统基础:书籍

  2. SQL 与 NoSQL| MySQL 与 MongoDB:教程/教程

  3. 完整的数据库设计课程:教程

  4. 使用 MySQL 的 SQL:课程

  5. PostgreSQL:课程

  6. PostgreSQL for Everybody:课程

  7. 使用 Python 的 SQLite:课程

  8. 流行的数据库:教程

数据可视化

  1. Edureka 的 Power BI 完整课程:课程

  2. Simplilearn 的 Power BI 完整课程:课程

  3. Edureka 的完整 Tableau 课程:课程

  4. Simplilearn 的完整 Tableau 课程:课程

  5. freecodecamp.org 的 Tableau 速成课程:课程

机器学习

初学者课程

  1. 教授:Andrew Ng

  2. 讲师:Abu Yaser Mustafa

  3. 讲师:Krish Naik

  4. AI 介绍:Coursera/ Edureka

  5. MIT 的人工智能:课程

使用 Python 的应用机器学习课程

  1. 机器学习 A-Z:课程

  2. 使用 Python 的实用机器学习:课程

实践机器学习书籍

  1. 使用 Scikit-Learn、Keras 和 TensorFlow 的实用机器学习:书籍

  2. 100 页机器学习书籍:书籍

  3. 数据学习:书籍

深度学习

专业课程

  1. 讲师:Andrew Ng/ YouTube

  2. 讲师:Krish Naik

  3. 讲师:Yann Le’Cun

  4. 讲师:MIT

使用 Python 和 TensorFlow 的应用深度学习

  1. 深度学习 A-Z: 实践人工神经网络:课程

  2. freecodecamp.org 的 TensorFlow 完整课程:课程

  3. AI TensorFlow 开发者专业证书:课程

  4. TensorFlow 数据与部署:课程

实践深度学习书籍

  1. 深度学习书籍:书籍

  2. 深度学习基础:书籍

自然语言处理

  1. deeplearning.ai 的 NLP 专业课程:课程

  2. 斯坦福大学的深度学习 NLP:课程/ YouTube

  3. Krish Naik 的完整 NLP:课程

计算机视觉

  1. 用于视觉识别的卷积神经网络: 课程

  2. Krish Naik 的完整计算机视觉课程: 课程

  3. freecodecamp.org 的完整 OpenCV 课程: 课程

强化学习

  1. DeepMind 的强化学习: 课程

  2. 斯坦福大学的强化学习: 课程

  3. 阿尔伯塔大学的强化学习: 课程

Web 开发

  1. Corey Schafer 的 Django 教程: 课程

  2. Django for Everybody: 课程

  3. Corey Schafer 的 Flask 教程: 课程

  4. Traversy Media 的 Web 开发: 网页链接YouTube

  5. 全栈 Web 开发指南: 教程

  6. 面向每个人的网页设计: 课程

  7. 面向每个人的 Web 应用程序: 课程

Git & Github

  1. freecodecamp.org 的速成课程: 课程

  2. Traversy Media 的速成课程: 课程

  3. Edureka 的完整课程: 课程

  4. Mosh 的 Git 入门教程: 课程

  5. Amigoscode 的 Git 和 Github 教程: 课程

AWS

  1. AWS 认证: 教程

  2. AWS 入门教程: 课程

  3. AWS 基础知识入门: 课程

  4. AWS 认证云计算从业者培训: 课程

  5. AWS 认证解决方案架构师 — 助理培训: 课程

  6. AWS 认证开发者 — 助理培训: 课程

  7. AWS SysOps 管理员-助理培训: 课程

模型部署

  1. 教师: Krish Naik

  2. 教师: Daniel Bourke

  3. 实时端到端模型部署: 教程

  4. 使用 Amazon Sagemaker 进行模型部署:教程

  5. 使用 Azure 进行模型部署:教程

大数据

  1. CrashCourse 的大数据导论:教程

  2. Edureka 的大数据导论:教程

  3. Simplilearn 的大数据介绍:教程

  4. Edureka 的大数据与 Hadoop:课程

  5. Edureka 的 Apache Spark:课程

C/C++编程与问题解决

教程与课程

  1. Mike 的完整 C 教程:课程

  2. Caleb Curry 的完整 C++教程:课程

  3. Suldina Nurak 的完整 C++教程:课程

  4. C++面向对象编程概念:课程

  5. 使用 C++进行问题解决与面向对象编程:课程

  6. C++中的指针:课程

  7. 使用 C++的 STL:课程

  8. 使用 C/C++的数据结构:课程

书籍

  1. Bjarne Stroustrup 的 C++编程语言:书籍

  2. Dennis Ritchie 的 C 编程语言:书籍

算法与数据结构

  1. MIT 的算法导论:课程

  2. MIT 的算法设计与分析:课程

  3. MIT 的高级算法:课程

  4. GeeksforGeeks 的竞赛编程指南:网页链接

  5. Thomas H. Cormen 的算法导论:书籍

计算机科学基础

  1. 计算机科学的缺失学期:课程

  2. CMU 的计算机系统架构:课程

  3. MIT 的计算机系统架构: 课程

  4. Neso Academy 的操作系统课程: 课程

  5. UC Berkeley 的操作系统: 课程

  6. 软件工程基础: 课程

我尝试提供一些具体的资源(课程/教程/书籍),这些资源深入且在网络上非常知名,对大量数据科学学习者非常有帮助。我尽量提供了我熟悉的资源。毋庸置疑,还有许多优秀的资源被遗漏。因此,这份列表不应被视为专家指南。相反,它挑选了一些突出的课程,以便让初学者的学习旅程更加轻松。我将最后提供一些最受欢迎的 YouTube 频道,这些频道有大量的学习材料和关于该主题的很好的指导。

顶级 YouTube 数据科学频道

  1. Krish Naik

  2. Sentdex

  3. 3Blue1Brown

  4. org

  5. StatQuest with Joshua Starmer

  6. Python 程序员

  7. Corey Schafer

  8. Tech with Tim

  9. Two Minute Papers

  10. Data School

  11. Caleb Curry

  12. Andreas Kretz

  13. Traversy Media

  14. 斯坦福在线

  15. Yannic Kilcher

  16. GeeksforGeeks

  17. Numberphile

  18. AI

  19. mycodeschool

  20. 可视化艺术

原文. 经许可转载。

相关:

更多相关内容