Développement ML - en interne ou sous-traitance?

C'est une question qui concerne tout type de développement et l'apprentissage automatique (ML) ne fait pas exception. Mais en même temps, bien sûr, beaucoup se demanderont - pourquoi cet article est-il nécessaire, en quoi votre ML diffère-t-il autant du développement standard, selon quels articles ont déjà été écrits dans un wagon - lisez, analysez et choisissez le bon chemin . 





D'une part, tel quel - et il y a beaucoup d'articles à analyser et à analyser. D'un autre côté, il y a une spécificité - et la mise en scène du développement ML est quelque peu différente de celle standard et le travail ne va pas seulement (et pas tellement) avec le code, mais avec les données.





Mais prenons tout étape par étape - passons en revue les différences en un mot, puis nous déterminerons s'il y a une place pour l'externalisation dans le développement du ML et de quoi il s'agit.





Au lieu d'une introduction, quelques mots sur les différences

En fait, la principale spécificité du développement ML est que ce n'est pas le code qui régit, mais les données. Bien sûr, il y a aussi une spécificité que nous n'écrivons pas d'algorithmes de ML, mais n'utilisons que (train), mais cela, encore une fois, concerne en grande partie les données. Et qu'avons-nous? C'est vrai - les données sont avant tout un actif stratégique d'une entreprise. Et dans l'ensemble, le ML n'est rien de plus que le processus de monétisation de cet actif très stratégique. Et combien sont prêts à donner la monétisation de leur actif «à côté»? 





Une analogie drôle m'est venue à l'esprit ... il y a une phrase célèbre - "Les données sont le pétrole du 21e siècle". Donc, si nous continuons cette analogie, alors ML est une raffinerie de pétrole. Et bien sûr, vous pouvez trouver des producteurs de pétrole qui vendent du pétrole brut, mais la plupart raffine et vend toujours le produit déjà raffiné.





De plus, bien sûr, n'oubliez pas que les données dans de nombreuses entreprises sont des informations contenant des secrets commerciaux / personnels / médicaux (souligner ou supprimer les informations nécessaires) et cela impose également un certain nombre de restrictions ou du moins nécessite une attention accrue.





, “ , , !”. . , , ML - . , .





1 -

, ML , ? , , , - . , , - - . , , . , "" ( ).





“ ?” - .  , . . , , ( ), . .





- ML . - - PoC (Proof of Concept). ( CRISP-DM):





  • 0 - . . - .





  • 1 - . , . - , , , .. , .





  • 2 - . . , . .





  • 3 - . - . ML, “ ”.





  • 4 - . :





    • ML





    • .





- ML DSaaS (DataScience as a Service), . - - . … .





,   -  , ML . - ( ). - , .





2 - -

. ML , ? - . , “ ” , . ( ), . , ML - . . , . -, , , , , :









  • ( )









  • , -













ML , . , - - .





, , , . . - - . , :





, :





  • - , ?





  • - - ,





  • - - , , ( )





  • - - , , , . 





, . :





  • - . ?





  • ( ) , .





  • - - - . ?





  • - //





  • , ,





/ , “ ” “”, “ .. ”, . - ML , “ ”, " " “ ” ( , , ..) .





, - :





  1. - , . ML - , “ ”.





  2. - , . ML - . .





  3. , :





    1. ML,





    2. - PoC , -





    3. -








All Articles