Parfois, j'aime explorer les ensembles de données qui m'intéressent. Si je construis un modÚle réussi sur les données de Kaggle, pour lesquels d'innombrables modÚles ont déjà été créés, il n'y aura aucune valeur pratique, mais cela me permettra au moins d'apprendre quelque chose de nouveau. Mais les data scientists sont des personnes qui s'efforcent de créer quelque chose de nouveau, d'unique, quelque chose qui peut apporter un réel avantage au monde.
Comment gĂ©nĂ©rez-vous de nouvelles idĂ©es? Afin de trouver la rĂ©ponse Ă cette question, j'ai combinĂ© ma propre expĂ©rience et les rĂ©sultats de recherches sur la crĂ©ativitĂ©. Cela a conduit au fait que j'ai pu former 5 questions, dont les rĂ©ponses aident Ă trouver de nouvelles idĂ©es. Ici, je vais Ă©galement donner des exemples d'idĂ©es trouvĂ©es grĂące Ă la mĂ©thodologie que j'ai proposĂ©e. En cherchant des rĂ©ponses aux questions prĂ©sentĂ©es ici, vous suivrez la voie de la gĂ©nĂ©ration de nouvelles idĂ©es et pourrez utiliser votre potentiel crĂ©atif au maximum. En consĂ©quence, vous aurez de nouvelles idĂ©es uniques que vous pourrez mettre en Ćuvre dans vos projets Data Science.
1. Pourquoi est-ce que je veux commencer Ă travailler sur un nouveau projet?
Lorsque vous pensez dĂ©marrer un nouveau projet, vous avez une intention ou un objectif en tĂȘte. Tout d'abord, vous devez trouver la rĂ©ponse Ă la question de savoir pourquoi vous souhaitez crĂ©er un autre projet dans le domaine de la science des donnĂ©es. Avoir un aperçu du type d'objectif que vous visez vous aidera Ă vous concentrer sur la recherche d'une idĂ©e. Alors pensez Ă ce pour quoi vous allez crĂ©er un projet. Voici quelques options:
- Il s'agit d'un projet de portefeuille que vous allez présenter à des employeurs potentiels.
- Ceci est une ébauche d'article sur des concepts, des modÚles ou une analyse exploratoire des données.
- C'est un projet qui vous permettra de pratiquer quelque chose. Par exemple, nous pouvons parler du traitement du langage naturel, de la visualisation des données, du traitement des données primaires, d'un algorithme d'apprentissage automatique spécifique.
- Il s'agit d'un projet trÚs spécial qui n'est pas décrit dans cette liste.
2. Quels sont mes intĂ©rĂȘts et mon expĂ©rience?
Il y a trois raisons principales de réfléchir à cette question.
- Tout d'abord, rappelez - vous les diagrammes de Venn utilisés en science des données pour décrire les compétences requises dans ce domaine. La connaissance dans un domaine spécifique est un atout important que tout spécialiste des données devrait posséder. Il est possible de résoudre certains problÚmes en traitant des données uniquement si le domaine auquel ces données appartiennent est clair. Sinon, des algorithmes seront appliqués, des visualisations et des prédictions seront créées qui semblent inadéquates à tout praticien du profil approprié. Et si ce que vous faites n'a pas de sens, alors pourquoi se donner la peine de le faire?
- -, , , , . , . , . , , .
- -, , , . , , - .
Laisse moi te donner un exemple. Les domaines de connaissances qui m'intĂ©ressent et dans lesquels j'ai de l'expĂ©rience incluent la durabilitĂ© environnementale et socio-Ă©conomique des systĂšmes, la finance, la culture populaire, le traitement du langage naturel. Me concentrer sur ces sujets m'aide Ă puiser dans ce que j'ai dĂ©jĂ . GrĂące Ă ces connaissances, je dĂ©termine si je peux, inspirĂ© par quelque chose, proposer une nouvelle idĂ©e qui peut ĂȘtre mise en Ćuvre.
3. Comment trouvez-vous l'inspiration?
La principale source d'inspiration est la lecture. Lorsque vous recherchez une idée, vous pouvez trouver des sujets intéressants en lisant divers documents:
- , , . , , . , WIRED , , Google . , . , Google.
- . , . , GPT-2 , , , , , , . - ?
- . , , Data Science, , . , NLP- «», , , . - ? , ? GPT-2.
Si nous parlons d'autres sources d'inspiration, alors l'inspiration, sans se fermer aux idĂ©es nouvelles, se retrouve dans la vie de tous les jours. Chaque fois que vous ĂȘtes intĂ©ressĂ© par une question, demandez-vous si vous pouvez rĂ©pondre Ă cette question en utilisant des techniques de manipulation de donnĂ©es. Par exemple, je suis rĂ©cemment tombĂ© sur une bande-annonce de Boys et j'ai trouvĂ© de nombreuses critiques positives Ă ce sujet sur IMDb. «Y a-t-il une confirmation que le nombre de scĂšnes violentes dans les Ă©missions de tĂ©lĂ©vision augmente avec le temps ?» Me suis-je demandĂ©. «Y a-t-il un public toujours plus nombreux qui aime les Ă©missions de tĂ©lĂ©vision violentes?» Ai-je continuĂ©. Si quelque chose vous intĂ©resse, saisissez le moment et Ă©tudiez les donnĂ©es pertinentes.
Comment générez-vous des idées de projet basées sur les sources d'inspiration ci-dessus? Les neuroscientifiques ont identifié trois processus psychologiques distincts associés à la génération d'idées:
- Vous pouvez combiner des idées existantes pour en créer de nouvelles (créativité combinatoire). Par exemple, divers projets ont analysé les offres de location publiées sur Airbnb. Il existe des projets visant à analyser le marché immobilier. Si vous combinez ces idées, vous pouvez chercher une réponse à la question de savoir si les prix des logements dans une certaine ville augmentent grùce à Airbnb.
- , ( ). , -, , , . , , - .
- - , ( ). â . . . : , , .
4. ?
Une fois que vous aurez dĂ©cidĂ© de l'orientation gĂ©nĂ©rale de la recherche, vous devrez rechercher des donnĂ©es qui vous permettront de comprendre comment mettre en Ćuvre votre idĂ©e sous la forme d'un projet Data Science. Ceci est extrĂȘmement important pour dĂ©terminer si une idĂ©e rĂ©ussira. En rĂ©ponse Ă la question dans le titre de cette section, vous devriez envisager la possibilitĂ© d'avoir ce dont vous avez besoin dans les magasins de donnĂ©es existants. Vous devrez peut-ĂȘtre collecter vous-mĂȘme les donnĂ©es nĂ©cessaires, ce qui complique la tĂąche. Voici donc un aperçu des sources de donnĂ©es:
- : Kaggle, Google Datasets, FiveThirtyEight, BuzzFeed, AWS, UCI Machine Learning Repository, data.world, Data.gov , Google.
- , -. Google Google Scholar. , - , . ? , Our World in Data , .
- DonnĂ©es dont vous avez besoin pour collecter vous-mĂȘme. Pour collecter ces donnĂ©es, vous pouvez recourir au scraping Web, Ă l'analyse de texte, Ă diverses API, au suivi des Ă©vĂ©nements et Ă l'utilisation de fichiers journaux .
Si vous ne parvenez pas Ă trouver des donnĂ©es susceptibles de vous aider Ă mettre en Ćuvre votre idĂ©e de projet, reformulez l'idĂ©e. Essayez de vous faire une idĂ©e de l'idĂ©e originale qui peut ĂȘtre mise en Ćuvre Ă l'aide des donnĂ©es dont vous disposez. En attendant, demandez-vous pourquoi vous ne trouvez pas les donnĂ©es souhaitĂ©es. Quel est le problĂšme avec le domaine qui vous intĂ©resse? Que peux-tu y faire? Les rĂ©ponses Ă ces seules questions peuvent conduire Ă l'Ă©mergence d'un nouveau projet de Data Science.
5. L'idée trouvée est-elle réalisable?
Vous avez donc une idĂ©e fantastique! Mais peut-il ĂȘtre mis en Ćuvre? Reprenez les Ă©tapes du processus de gĂ©nĂ©ration d'idĂ©es. Pensez Ă ce que vous voulez rĂ©aliser (question numĂ©ro 1), ĂȘtes-vous intĂ©ressĂ© par le domaine choisi, si vous en avez l'expĂ©rience (question numĂ©ro 2), avez-vous les donnĂ©es nĂ©cessaires pour mettre en Ćuvre l'idĂ©e (question numĂ©ro 4). Vous devez maintenant dĂ©terminer ce qui suit: avez-vous les compĂ©tences nĂ©cessaires pour mettre en Ćuvre l'idĂ©e et atteindre l'objectif.
Il est important de prendre en compte un facteur tel que le temps que vous prĂ©voyez de consacrer Ă ce projet. Vous n'allez probablement pas rĂ©diger une thĂšse de doctorat sur le sujet choisi. Par consĂ©quent, le projet que vous ferez dans le cadre de l'idĂ©e trouvĂ©e n'affectera peut-ĂȘtre qu'une certaine partie de celle-ci. Peut-ĂȘtre que cela consistera uniquement Ă apprendre quelque chose de nouveau, vous devrez mettre en Ćuvre l'idĂ©e Ă l'avenir.
AprĂšs avoir suivi les 5 Ă©tapes ci-dessus pour gĂ©nĂ©rer une idĂ©e, vous devriez avoir une question Ă laquelle vous pouvez et voulez rĂ©pondre, en y consacrant autant de temps que vous ĂȘtes prĂȘt Ă passer pour atteindre votre objectif.
RĂ©sultat
- . , , , . â , , , . â . , , .
- - . . , - , . , . , , , , .
- N'ayez pas peur de recommencer. Quoi que vous fassiez, vous apprenez toujours quelque chose de nouveau. Chaque fois que vous Ă©crivez une ligne de code, vous pratiquez et dĂ©veloppez vos connaissances et vos compĂ©tences. Si vous vous rendez compte que la mise en Ćuvre de l'idĂ©e trouvĂ©e ne vous rapprochera pas de votre objectif, ou s'il s'avĂšre que l'idĂ©e n'est pas rĂ©alisable, n'ayez pas peur de la quitter et de passer Ă autre chose. Le temps que vous avez passĂ© Ă chercher cette idĂ©e n'est pas perdu pour vous. Il est nĂ©cessaire d'Ă©valuer raisonnablement les avantages qui peuvent ĂȘtre obtenus de la mise en Ćuvre de l'idĂ©e.
En utilisant la méthode décrite ici, je trouve constamment des idées originales pour mes projets Data Science. J'espÚre que cette technique vous sera également utile.
Comment recherchez-vous de nouvelles idées pour vos projets Data Science?