Il y a quelques années, je me suis brièvement intéressé à l'apprentissage automatique et à l'analyse de données, j'ai même écrit une courte série sur mon immersion dans ce monde étonnant, du point de vue d'un débutant complet.
Comme cela arrive souvent lorsque j'apprends quelque chose de nouveau, je voulais vraiment faire mon propre "vélo". Malheureusement, je ne connais pas grand-chose aux mathématiques et à la programmation, donc mon propre jeu de données est devenu un candidat pour le rôle de «vélo».
Plus de deux ans se sont écoulés depuis ce moment, et maintenant je me suis mis à partager ma petite expérience avec vous.
Dans cet article, nous examinerons plusieurs sources potentielles d'auto-collecte de données (y compris celles qui ne sont pas très populaires), et essayerons également de trouver au moins un avantage dans ce processus.
Table des matières:
Partie I: Introduction
Partie II: Sources de données
Partie III: Est-ce que cela en profite?
Partie IV: Conclusion
Partie I: Introduction
Dès la partie introductive, vous avez probablement déjà deviné que je ne suis pas un gourou de l'analyse de données et de l'apprentissage automatique. Je ne peux guère être qualifié de pionnier dans le domaine de la recherche de sources de données ouvertes. Par conséquent, cet article ne porte pas sur les bonnes pratiques, mais sur la suppression de la «démangeaison entre vos mains» au cas où vous auriez l'idée de créer votre propre jeu de données.
.
, « » , « » .
II:
.
. .
Kaggle. Kaggle .
, - , .
.
« » 2010- , - 2015 .
.
, , :
.
. , API .
, .
( ), .
, « » , :
,
. . .
. , .
. , . 2016 2020 GitHub.
, -, .
III: ?
. , .
, :
- Python ( ) . , - .
- , .
- . , . , , .
- , . , , «», . , , , .
- , - .
IV:
, «», , .
, , : « », .
.
- , .