Dans ce matériel, je veux parler de la façon dont vous pouvez agir pour quelqu'un qui souhaite acquérir de manière indépendante des connaissances dans les domaines de la DS, de l'IA et du ML. L'application des méthodes d'enseignement suggérées ici peut conduire à de bons progrès dans l'apprentissage de nouvelles choses. Ici, en plus, je vais partager des liens vers les ressources que j'utilise, et que je suis sans l'ombre d'un doute prêt à recommander aux autres.
Apprenez quelques disciplines mathématiques
Les mathématiques, même si quelqu'un ne les aime pas, sont très importantes dans le domaine qui nous intéresse. Je pense qu'il est prudent de dire que ceux qui lisent ceci ont déjà une partie des connaissances mathématiques qu'ils ont acquises à l'école. C'est une bonne base, mais ce n'est pas assez proche pour quelqu'un qui souhaite se développer dans les domaines de la DS, de l'IA et du ML. À savoir, ici, vous devez plonger un peu plus dans les mathématiques qu'à l'école, vous devez apprendre certaines choses à partir des statistiques, de l'algèbre et d'autres disciplines mathématiques. Je voudrais dresser une liste de ressources mathématiques utiles pour DS, mais cela a déjà été fait pour moi dans cet article. Et ils l'ont très bien fait.
Apprenez à programmer
Si vous débutez dans l'auto-apprentissage, ne vous lancez pas directement dans l'apprentissage de l'écriture de code à des fins d'apprentissage automatique. Au lieu de cela, il vaut la peine d'apprendre des concepts de programmation de base qui ne sont liés à aucun domaine. Apprenez ce qu'est la programmation, familiarisez-vous avec les différents types de code qui existent et comprenez comment écrire correctement des programmes. Ceci est très important car en maîtrisant la programmation, vous apprendrez de nombreuses idées de base qui vous seront utiles tout au long de votre carrière DS.
Ne vous précipitez pas, ne vous efforcez pas d'apprendre immédiatement quelque chose de difficile. Votre compréhension des bases affectera toute votre future carrière professionnelle. Icivous pouvez trouver de très bons tutoriels vidéo qui vous initient à la programmation et à l'informatique. À savoir, ils découvrent les choses les plus importantes que vous devez comprendre. Prenez le temps de répondre à cette question et essayez de comprendre tout ce que vous apprenez.
Choisissez un langage de programmation et faites-le correctement
Il existe de nombreux langages de programmation utilisés par ceux des domaines DS, AI et ML. Les plus couramment utilisés ici sont Python, R, Java, Julia et SQL. D'autres langues peuvent être utilisées dans ces domaines, mais celles que j'ai énumérées sont utilisées plus souvent que d'autres pour une raison:
- Ils sont faciles à apprendre. Si vous accordez suffisamment de temps pour les étudier et faites preuve de persévérance et de constance dans la formation, vous pouvez obtenir un certain succès assez rapidement.
- , , .
- , .
- , , , DS, AI ML.
- — .
Il n'y a rien de mal à apprendre plusieurs langages de programmation. Et, en fait, il est utile de connaître plus d'une langue. Mais lorsque vous apprenez à programmer, ne vous précipitez pas. Vous devez essayer d'étudier, dans un certain laps de temps, une seule langue, sinon vous risquez d'être très confus. Par conséquent, il est préférable d'apprendre les langues une à la fois, en accordant une attention particulière à ceux de leurs mécanismes qui vous seront utiles dans votre travail. Je suggérerais de choisir Python comme première langue. C'est un langage assez simple que même un débutant peut facilement comprendre. De plus, je vous recommande d'étudier d'abord la programmation générale en Python, puis de vous rendre dans des outils Python spécialisés pour l'analyse de données.
Apprenez à collecter des données
Le plus souvent, personne ne vous fournira des données spécialement conçues pour vous, et parfois vous pouvez ne pas avoir de données du tout. Mais, dans tous les cas, vous devez trouver un moyen de collecter les données avec lesquelles vous travaillerez. L'organisation pour laquelle vous travaillez peut avoir un bon système de collecte de données. Si oui, c'est un gros plus pour vous. Si votre organisation ne dispose pas d'un tel système, vous devez trouver un moyen de collecter des données. Mais nous ne parlons pas de données, mais d'informations de haute qualité, avec lesquelles vous pouvez travailler de manière productive et atteindre vos objectifs. La collecte de données n'est pas directement liée au «data mining», avec leur analyse approfondie. La collecte de données est une étape de travail qui précède l'analyse.
Des données ouvertes qui peuvent être utilisées gratuitement peuvent être trouvées dans de nombreux endroits sur Internet. Parfois, les données dont vous avez besoin peuvent être collectées à partir de sites Web à l'aide de techniques de scraping Web. Le web scraping est une compétence très importante du data scientist, donc je demande vraiment à tous ceux qui vont travailler dans les domaines DS, AI et ML de maîtriser cette compétence. Voici un bon guide du web scraping.
Les données, en outre, peuvent être stockées dans des bases de données, de sorte que la connaissance initiale de l'administration des bases de données et la connaissance de l'interaction avec les bases de données vous seront très utiles. En particulier, la connaissance de SQL est ici très importante. Apprenez SQL ici .
Apprenez à traiter les données
Ce dont je vais parler ici est souvent appelé Data Wrangling. Ce processus comprend la suppression des données existantes. Il utilise une analyse exploratoire des données et la suppression de tout ce qui est inutile. Ce processus comprend également la structuration des données, leur apportant une forme avec laquelle vous pouvez travailler. Cette étape du travail avec les données est la plus difficile et la plus épuisante. Les données que vous rencontrez au cours du processus d'apprentissage seront déjà préparées pour l'analyse. Mais les données que vous rencontrez dans le monde réel peuvent être complètement brutes. Si vous voulez vraiment devenir un data scientist, vous devez trouver les vraies données et trouver des moyens de leur donner un aspect décent.
Des données réelles peuvent être trouvées presque partout. Par exemple - surKaggle . Cette formidable plate-forme contient des données provenant de nombreuses entreprises du monde entier. Le traitement primaire des données est une activité très fastidieuse, mais si vous le faites régulièrement et de manière persistante, vous vous rendrez progressivement compte que c'est aussi une activité très intéressante. Voici quelques bonnes conférences sur le traitement primaire des données.
Apprenez à visualiser les données
Si vous êtes un expert en DS, en IA ou en ML et que vous connaissez bien votre métier, vous ne devez pas oublier que ce qui vous semble évident peut être totalement incompréhensible pour les autres. Ne vous attendez pas à ce qu'ils soient capables, par exemple, de tirer des conclusions en regardant des colonnes de nombres. Apprendre à visualiser les données est nécessaire pour que les résultats de votre travail puissent être utilisés par des spécialistes d'autres domaines. La «visualisation de données» est communément appelée processus de présentation de données sous forme graphique. Une telle présentation des données permettra d'en tirer profit même pour ceux qui n'ont pas de connaissances particulières dans les domaines du DS, de l'IA et du ML.
Il existe de nombreuses façons de visualiser les données. Puisque nous sommes des programmeurs, notre principale méthode de visualisation des données doit être d'écrire le code approprié. Il est rapide et ne nécessite pas l'achat d'outils spécialisés. Lors de l'écriture de code pour la visualisation de données, vous pouvez utiliser de nombreuses bibliothèques gratuites et open source créées pour les langages de programmation que nous utilisons. Par exemple, il existe des bibliothèques de ce type pour Python. Ce sont Matplotlib, Seaborn et Bokeh. Voici un tutoriel vidéo sur Matplotlib.
Une autre façon de visualiser les données consiste à utiliser des outils à source fermée. Par exemple - Tableau... Il existe beaucoup de ces outils et ils peuvent vous donner de très bons résultats, mais ils ne sont pas gratuits. Tableau est l'un des outils les plus courants et je l'utilise beaucoup. Je conseillerais à toute personne impliquée dans l'analyse et la visualisation de données d'apprendre Tableau. Voici un bon guide de cet outil.
Intelligence artificielle et apprentissage automatique
L'IA et le ML peuvent être considérés comme des sous-sections de DS car ils sont basés sur les données. L'IA et le ML sont des technologies basées sur des machines d'enseignement pour se comporter de manière similaire au comportement humain. Pour cela, des données spécialement préparées sont utilisées, transmises aux machines. Les modèles informatiques peuvent en apprendre beaucoup sur ce dont les humains sont capables. Pour ce faire, ils sont formés et guidés vers le résultat souhaité. Dans ce cas, les «machines» peuvent être perçues comme de petits enfants sans aucune connaissance. Ces enfants apprennent progressivement à identifier des objets, à parler. Ils apprennent de leurs erreurs et, à mesure qu'ils apprennent, commencent à mieux résoudre les tâches qui leur sont assignées. C'est le cas des voitures.
Les technologies AI et ML donnent vie aux machines à l'aide d'une variété d'algorithmes mathématiques. L'humanité ne connaît toujours pas les limites des capacités de ces technologies en constante amélioration. De nos jours, les technologies d'IA et de ML sont largement utilisées pour résoudre les problèmes cognitifs. Ce sont la détection et la reconnaissance d'objets, la reconnaissance faciale et vocale, le traitement du langage naturel, la détection de spam et la détection de fraude. Cette liste peut être poursuivie pendant très longtemps.
Une histoire plus détaillée sur l'IA et le ML mérite une publication séparée. En attendant, je peux recommander cette vidéo concernant des questions générales sur l'application de ces technologies. Mais ici- Heures de tutoriel vidéo sur l'apprentissage automatique. En travaillant sur ces vidéos, vous pouvez acquérir des connaissances en ML qui correspondent au niveau débutant ou même intermédiaire. Vous découvrirez les nombreux algorithmes d'apprentissage automatique existants, leur fonctionnement et leur utilisation. Après cela, vous devriez avoir suffisamment de connaissances pour commencer à créer vos propres modèles ML simples. Vous pouvez lire comment procéder ici .
Explorez les moyens de publier des modèles ML en ligne
Il existe des outils qui vous permettent de publier des modèles de ML sur Internet. Cela vous permet de leur donner accès à tout le monde. Pour publier des modèles sur Internet, vous devez avoir une bonne compréhension des processus de développement Web. Le fait est que «publier un modèle» signifie créer une page Web (ou un groupe de pages) qui vous permet de travailler avec le modèle dans un navigateur. De plus, il faut garder à l'esprit que le frontend du projet, son interface, doit échanger des données avec le backend, avec la partie serveur du projet, où se trouve le modèle lui-même. Pour créer des projets comme celui-ci, vous devez être en mesure de créer des API côté serveur et d'utiliser ces API dans le front-end des applications.
Dans le cas où vous envisagez de publier des modèles dans le cloud, si vous comptez utiliser la technologie Docker, vous aurez besoin d'une bonne connaissance du domaine du cloud computing et du DevOps.
En fait, il existe de nombreuses façons de déployer des modèles sur Internet. Je suggérerais de commencer par apprendre à faire cela en utilisant le framework Web Flask basé sur Python. Voici un bon tutoriel à ce sujet.
Trouvez un mentor
L'auto-apprentissage est formidable, mais rien ne vaut l'apprentissage de professionnels. Le fait est qu'avec cette approche, ce qui est utilisé dans la réalité est assimilé, et que c'est ainsi que l'apprentissage passe par la pratique. Beaucoup de choses ne peuvent être apprises que par la pratique. Le coaching possède de nombreux atouts, mais il ne faut pas oublier que tous les mentors ne peuvent pas avoir un impact significatif sur votre carrière ou votre vie. C'est pourquoi il est très important de trouver un bon mentor.
Par exemple, vous pouvez essayer de résoudre ce problème en utilisant la plateforme Notitia AI .... Ici, les étudiants se voient attribuer des mentors personnels qui apportent des contributions personnelles et professionnelles au développement des étudiants. Les mentors prennent ceux qui veulent apprendre du niveau débutant au niveau expert dans les domaines de la DS, de l'IA et du ML. Notia AI est également la plateforme la plus abordable du genre.
Résultat
Gardez à l'esprit qu'étudier des cours, lire des articles et regarder des vidéos ne fera pas de vous un scientifique des données. Vous devrez être certifié par une institution spécialisée. En outre, certains postes vacants exigent certaines qualifications scolaires. Investissez du temps dans l'auto-apprentissage, obtenez une certification ou obtenez vos diplômes et vous serez prêt pour un vrai travail.
Que pensez-vous qu'il faut savoir et être capable d'aspirer pour devenir un expert précieux dans les domaines de l'intelligence artificielle ou de l'apprentissage automatique?