Dans cet article, je présente les cours et les livres qui me semblent les plus optimaux pour apprendre à partir de zéro le machine learning / la science des données. J'essaie de donner une liste qui sera la plus courte possible et en même temps donner toutes les connaissances nécessaires pour démarrer dans la pratique, sans lacunes sérieuses dans les connaissances.
Avertissement
Vous pouvez comprendre sur quoi reposent ces recommandations en lisant les articles précédents, qui décrivent mon parcours et mes principes d'auto-apprentissage, ainsi que des considérations générales sur la façon de construire les étapes d'apprentissage:
Articles précédents
Les lignes directrices de cet article deviendront obsolètes et, à coup sûr, d'excellents cours et livres pourraient y être inclus. Mais ce sont au moins quelques-uns des meilleurs matériaux sur leurs sujets. Pour préparer cette liste, des dizaines de cours et de livres ont été jetés, qui visent également à apprendre à partir de zéro, mais sont moins bons pour présenter les concepts fondamentaux.
Les directives ne couvrent pas toutes les compétences techniques potentiellement requises. Pour avoir une idée de tout ce qui devra probablement être maîtrisé, voir Apprendre la science des données à partir de zéro: jalons et jalons.
Je ne cite pas de matériel sur les réseaux de neurones car, dans la plupart des cas, je considère qu'il est inefficace de commencer à apprendre avec eux ou de les étudier aux premiers stades de l'auto-apprentissage.
Compétences de base requises
Connaissance des bases de la programmation: Python et SQL
Il est impossible de faire de l'apprentissage automatique ou de la science des données sans maîtrise de la programmation en Python ou R (mieux vaut commencer avec Python). En outre, la grande majorité des postes vacants dans l'apprentissage automatique «classique» (résolution de problèmes commerciaux et travail avec des données initialement numériques / statistiques) nécessiteront des connaissances en SQL. Pour obtenir des instructions de base sur la façon de les apprendre, consultez Auto-apprentissage en science des données, de zéro à senior en deux ans .
Mathématiques
. , , , .
, - : ( ), (, , , ), , .
: . , 2 3 . 2 3 , . Math for machine learning, London Imperial College.
( , ), , : Robert Ghrist. . coursera.org, stepik.org
,
Datasmart ( ) - . , data science. , , . , python, pandas, scikit-learn - ( , .. ).
. . ( , .. , , ). - (). , .
— 8 , 2 — seaborn ( , ).
Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking, by Foster Provost ( ) - , , . Datasmart, . " " () . , ..
, - , / - . .
, , , . . , .. , , . . , .
" " - , . -, . , . Python, Pandas, scikit-learn.
- , Python. Applied DS with Python ( 1 3. 2, 4 )
, ( jupyter, pandas). , , . , - .
https://stepik.org/course/4852/syllabus
« » ( " " ). 3 , , 1 , . , ; . 4 , , , , .. , .
Kaggle : ( ) , , , ( .. ). - , , , .
scikit-learn - . , .. .
pandas, - , . , . , .
Python python standard library - . , . , collections itertools
-
( ). . , , : https://www.coursera.org/learn/competitive-data-science. kaggle - .
,
- . - -.
, - , Goodhart's law. .
/
, , https://towardsdatascience.com; 3 .
Statistics Done Wrong .The woefully complete guide by Alex Reinhart - . .
Python Machine Learning, by Sebastian Raschka - , . .
, - .
Git - . - Ry's Git tutorial. git. : http://ndpsoftware.com/git-cheatsheet.html
https://www.practicaldatascience.org/ - . , , , ( Cloud , .. , ).
?
. , , - , - /, , , , - , . - .
/
, , , .
, - self.development.mentor gmail.com,
Certains ont réalisé qu'il valait mieux pour eux d'aller dans un autre domaine (programmation, grand rendez-vous), certains ont pu adapter le programme d'études / plan de carrière aux besoins individuels, à certains j'ai conseillé ceux qui pourraient mieux les aider, et sauvé quelqu'un (? ) De passer du temps inefficace pour des projets sans issue.
Et si mes articles vous sont utiles, vous pouvez aussi me motiver financièrement pour de futurs articles, sous cet article, il devrait y avoir un bouton «faire un don» à ces fins.