EPAM travaille avec les données depuis longtemps, les premiers grands clients avec des projets Big Data sont apparus en 2001. à l'époque, les sociétés d'analyse bien connues Gartner et Forrester, ainsi que les principaux fournisseurs Oracle, Microsoft et IBM, ont noté que les entreprises devraient s'orienter vers le Big Data, car ces technologies sont indispensables dans tous les domaines liés au traitement de grandes quantités de données. Depuis, l'équipe d'experts d'EPAM n'a cessé de s'agrandir, travaillant sur des projets de plus en plus complexes et offrant des solutions éprouvées et des produits de qualité pour travailler avec le Big Data. Aujourd'hui, uniquement dans l'EPAM russe, plus de 500 personnes travaillent dans la pratique des données. Comment tout a commencé, quels projets nous avons rencontrés, quels échecs se sont produits, ce à quoi les spécialistes des données devraient se préparer et quel type de spécialistes des données il existe,J'ai parlé avec le responsable de l'EPAM Data Practice en Russie -Ilya Gerasimov .
CarriĂšre
Dites-nous comment vous en ĂȘtes arrivĂ© Ă la direction des donnĂ©es
J'ai rejoint EPAM en 2006 en tant que dĂ©veloppeur junior sur .NET et MS SQL Server, avant cela j'ai travaillĂ© dans une sociĂ©tĂ© de produits et occupĂ© le poste de chef d'Ă©quipe, dĂ©veloppant des logiciels d'automatisation d'hĂŽtels et de restaurants. Mais Ă EPAM, j'ai commencĂ© ma carriĂšre Ă partir de zĂ©ro. En 2013, j'Ă©tais devenu un chef d'Ă©quipe et j'Ă©tais Ă la recherche de nouvelles opportunitĂ©s pour mon dĂ©veloppement en EPAM, et c'est Ă ce moment-lĂ que j'ai rencontrĂ© Ă la SEC Ă Minsk le responsable du centre de compĂ©tences Big Data, et nous avons convenu que ce domaine devrait ĂȘtre dĂ©veloppĂ© en Russie.
Ensuite, nous étions deux ou trois. Des collÚgues d'autres pays nous ont aidés, nous ont donné des cours et nous ont impliqués dans diverses activités liées à ce domaine. J'ai dû beaucoup étudier, puis diffuser les connaissances acquises.
Pourquoi travaillez-vous pour l'entreprise depuis si longtemps?
Data , - . , , . - â , .
Data?
â Data, Data. :)
Data-?
Data-: Data Science, Machine Learning, Business Intelligence, Enterprise Search, DevOps in Data, Data Quality, Business Data Analysis. 500 â .
. «» , «» .
Data- Data governance, .. , , , . , , , ..
â .
, , . , â , , , Data Science .
, , ,
2013-2014 , - , , , , Data Science.
, Scala , DevOps, , . , , , .
?
. , . Java, Python, DevOps- .
« », , . , 2012 â , . , , , . , . , , , , -, EPAM.
â Data Analytics, , Data Engineering, Data Science , â EPAM.
, , . â , .
? ?
, - , - , - , . , . , . . Cadence, , , , , , .
, Reinforcement Learning. . 2- , . , . , , Reinforcement Learning. , , , .
« », Data-. . , , «» . , « » â . , , , . , , Theano, TensorFlow, Theano - .
Apache , , â Spark, Cassandra, Elasticsearch .
Yarn, HDFS, MapReduce, Hive, Kafka, ZooKeeper â , . Hadoop , , , , .
â Amazon, Microsoft Azure, GCP â Hadoop, .
, Kerberos, Knox, Ranger.
, NoSQL NewSQL â Cassandra, ( ), Snowflake, Amazon Redshift, HBase, MongoDB, Teradata.
DevOps â Kubernetes, Docker, Jenkins.
: Power BI, Tableau, QlikView.
Data Science , TensorFlow Google BERT ( « », ), PyTorch, Keras.
Streaming. Streaming Data, â Spark Streaming, Kafka Streams, Apache Flink, Apache Storm.
.
SQL ( ), DWH ( â , , Data Vault, ..), ( , , , ), , DWH, Data Mart, Data Lake.
, . , AWS, Azure, GCP.
, ETL ( ) ETL ELT, , , slowly changed dimension. ETL (PL/SQL, T-SQL, pgSQL, Python, Spark), (, Airflow), , , (Talend, Informatica Power Center, Pentaho, etc.).
(Data Analytics and Visualization), 2- (Power BI, Tableau, TIBCO Spotfire, MicroStrategy, Pentaho, ..) (, Storytelling).
- ?
Apache â Spark, NiFi, Elasticsearch . . , , â - Open Source .
, Open Source , , Open Data Analytics Hub (ODAHU) , ML .
?
- , Data â , . (blueprint) . , , . , , , , .
blueprint - , , , , Data Scientists, , ..
?
, , , e-commerce, , , Life Science â , -. , , blueprints , .
, , , . , , .
2020 ?
, , XXI . 2020 , (late majority), , .
, : , ?
, , , . , , , .
, , Data, Java, Scala Python.
- EPAM , Data Engineering, Data Science, BI, Python , .
, Data EPAM?
. , Data â Java, Scala Python (, ), SQL, , , , DevOps- , Machine Learning .