Comment nous avons automatisé les téléchargements et autres tâches d'analystes ad hoc avec Zeppelin

Au moment d'écrire ces lignes, Cardsmobile, qui développe l'application mobile Wallet, emploie 195 personnes: 8 analystes et 187 clients analystes potentiels. Nous créons une application pour les utilisateurs finaux et travaillons avec des détaillants, des banques, des marques et d'autres partenaires. Pendant longtemps, le travail d'un analyste dans le Wallet a consisté non seulement en études du comportement des utilisateurs, mais aussi en divers déchargements, analyses typiques pour les partenaires et prévisions pour les clients potentiels. Bien sûr, les tableaux de bord ont été une bouée de sauvetage énorme et ont permis à toute l'entreprise de suivre les performances des produits. Mais nous perdions encore du temps sur le reste de la routine, et avec la croissance de l'équipe (clients) et de l'entreprise, nous nous sommes retrouvés bloqués: il y avait trop de tâches ad hoc, et la recherche, l'envie de se développer et un avenir radieux restaient inactifs en l'absence de temps.







Il y a tellement de conférences sympas autour, d'articles intéressants sur diverses recherches analytiques, science des données, data-driven, data-bonheur. Et nous avons regardé toute cette beauté et ne savions pas où trouver du temps pour des expériences parmi tout le courant de la routine. Beaucoup parlent de la façon de le rendre cool, mais peu parlent de COMMENT surmonter le chiffre d'affaires croissant et libérer des ressources pour des tâches intéressantes et créatives. Dans cet article, je vais vous parler de notre expérience pour entrer dans un avenir meilleur. Vous trouverez ci-dessous des exemples de la façon dont nous automatisons les tâches ad hoc des analystes dans Zeppelin .







image







Qu'est-ce que Zeppelin



Zeppelin est un bloc-notes OpenSource d'Apache qui vous permet d'accéder à différentes bases de données dans différents langages (Python, R, SQL, Spark). Mais ce qui le rend particulièrement cool, c'est l'ensemble des éléments visuels - des formes dynamiques .







api Amplitude, Clickhouse, MSSQL Python. Excel html-, .







notebook, . Zeppelin , : , – ! , . , . Zeppelin, . , !









Input – . , . , , .







image







Select – . . . , .







image







Checkbox – . , , , . , . , .







image







Zeppelin



, , , .







-. , , . . , .







:







  • , . Zeppelin . , . , , , .
  • . , . : , . , , «». - — , , - .
  • . «» , -. , , .


, . . .







image







, . , . , - , .







. - . , . , , . notebook Zeppelin, , . notebook .







/B-, base-line . , , , . 4 base-line :









Zeppelin , , , , .







image







Amplitude . - (, , ). : . — — . . , . , , :







  • , …
  • 5 10
  • ,
  • 2
  • ,


, . . - , .







, , Clickhouse, Amplitude api. , , . Amplitude, , , , .







:







  • - Amplitude. .
  • id ,
  • notebook Zeppelin
  • , Amplitude
  • sub_id notebook


:







  • id api Amplitude
  • DataFrame Python
  • /
  • , ( )
  • csv-,


-, , : . Amplitude . , , .







image









, , , – . , . , , . , , , , . slack , :







  • , , Retention.
  • , . support. . , , .
  • . , .
  • , - , Zeppelin , . , .


Success. ,



– ! Ad-hoc . 10%. , , . , . , .







: . , , . , , . . , .







Data- , , .








All Articles