Sim sim ouvre! - Comment nous avons lancé le projet Open Data



salut! Je m'appelle Sergey Folimonov, chez DomClik je suis responsable du marketing direct et de la communication client. Récemment, j'agis également en tant que PO du projet Open Data , et je veux vous raconter l'histoire de la création de ce produit, en me concentrant sur les problèmes auxquels nous avons dû faire face, sur les erreurs que nous avons commises, et sur le résultat final et ses variantes. utilisation.



La culture axée sur les données au sein de l'entreprise est, bien sûr, bonne, mais dans un monde où les concepts de contenu ouvert, de solutions open source et de données ouvertes en général gagnent de plus en plus en popularité, on veut non seulement utiliser l'information, mais aussi partager l'information. C'est ce qui a poussé DomClick à créer des "Open Data".



Commençons!



J'ai rejoint le développement produit très tôt. Eh bien, très tôt. Disons simplement que nous avons eu deux paquets de maquettes tra 2 d'un concepteur UX sur fond de carte de la Fédération de Russie et un délai de 2 semaines indiqué par la direction avant que le MVP ne soit mis en production. En quelques heures, un groupe de passionnés (développeurs, analystes, concepteurs, ingénieurs de données) a été constitué d'employés d'équipes complètement différentes, prêts à tout mettre en œuvre pour lancer un produit.







Les deux semaines suivantes, sur un vrai disque, nous avons développé le projet à partir de zéro, en essayant d'éviter tout processus compliqué, en insérant des béquilles lorsque cela est possible, afin de ne pas retarder le MVP et vérifier: "Que pouvons-nous faire?"



Le résultat du premier sprint: toutes les données promises ventilées par jours / semaines / mois sont disponibles aussi bien sur la carte (statistiques pour les régions et grandes villes) que sur les graphiques (notes des villes, dynamiques). Mais, comme vous pouvez le deviner, il ne reste plus que des captures d'écran de cette version: il







y avait beaucoup de données ici, le site fonctionnait parfaitement, mais l'UX n'était pas du tout pensé. Et du coup: les yeux s'écarquillent, le chemin client n'est pas clair et ce que l'on peut généralement apprendre de ce projet. Pour l'avenir, je dirai que rien de la première version du projet n'a été réutilisé dans le développement ultérieur.



Il semblerait que deux semaines plus tard ... Cependant, c'est le regard sur le concept rapide prêt à l'emploi et la compréhension de ses lacunes qui nous ont permis de définir les exigences et les souhaits finaux pour le service. Sans entrer dans les détails, nous avons décidé dans un premier temps de présenter les données sous forme de tableau, à l'étape suivante de fournir aux utilisateurs des graphiques dynamiques, puis de travailler la visualisation sur la carte et l'utilisation de modèles prédictifs pour construire des prévisions.



On peut se demander si les deux premières semaines étaient une erreur, s'il était possible d'éviter de perdre du temps et de fabriquer immédiatement un produit qui pourrait être montré aux clients. Oui, nous pourrions probablement consacrer les premiers jours à l'élaboration de l'UX, mener plusieurs entretiens et enquêtes, et éliminer non pas 2 semaines, mais 2 mois pour le développement. Mais la morale de mon histoire est que vous ne devriez pas avoir peur de faire des MVP rapides. Travailler à un rythme accéléré et avec un grand enthousiasme nous a fortement ralliés pour créer un très bon produit. Et oui, n'ayez pas peur de jeter les premiers croquis à la poubelle: c'est bien mieux que de transformer la version brute en monolithe.



MVP de la vie après la mort



Au cours des travaux ultérieurs sur le projet, nous avons rencontré un certain nombre de problèmes extraordinaires. Je ferai de mon mieux pour en parler afin de ne pas surcharger les lecteurs avec les détails de l'activité hypothécaire.



Apprendre à appeler les choses par leurs noms propres



Au stade de la collecte de données sur diverses métriques, j'ai été confronté au fait que différentes personnes dans notre entreprise peuvent appeler différentes choses de la même manière, et les mêmes choses - différemment. Par exemple, deux personnes différentes m'ont donné des données sur le nombre de transactions par région, et les chiffres ne se sont pas du tout battus parce que plusieurs entités commerciales peuvent être appelées transactions à la fois. Il s'est avéré que, d'une part, j'avais des transactions pour l'enregistrement électronique d'objets immobiliers et, d'autre part, des transactions hypothécaires. Et les données pour la même région dans un délai d'un mois peuvent ne pas coïncider. De plus, dans les deux sens: il peut y avoir autant d'enregistrements que de transactions hypothécaires (si du coup beaucoup de clients se mettent à acheter un bien immobilier sans hypothèque et se contentent d'acheter une inscription électronique)et moins (si le service d'enregistrement électronique n'est pas très demandé dans la région et que l'hypothèque est prise sans lui).



De tels cas nous ont conduit à la nécessité de créer un livre de référence, afin de ne pas nous confondre dans les définitions, et d'expliquer toutes les métriques à l'utilisateur sur le portail avec le plus de détails possible.







Nous agrégons différentes données par intervalles de temps



En ce qui concerne les métriques additives (et les premières métriques que nous avions justement), l'agrégation ne nous a pas posé de questions. Nombre de transactions hypothécaires en août: nous prenons et comptons toutes les transactions émises du 1er août au 30 août. Nous avons fait de même avec la période "30 derniers jours", qui donne l'image la plus pertinente pour chaque métrique.



Cependant, l'émergence de métriques non additives nous a fait réfléchir. Par exemple, le nombre d'annonces de vente d'appartements publiées à un moment donné ne peut pas être compté «en août». Si le 1er août, dans une région, 1 000 annonces ont été publiées sur la vitrine, et le 30 août - 1 200 annonces, quel nombre doit être affiché? Moyenne quotidienne? Médiane mensuelle? Valeur au milieu du mois? Nous avons décidé qu'il est plus facile pour nous et pour les utilisateurs de mieux comprendre si nous affichons de telles mesures non pas pour une période, mais le dernier jour de la période. Si août est sélectionné, les données concernent le 30 août; si "30 derniers jours" est sélectionné, les données sont pour hier. Et les informations à ce sujet sont également placées dans le répertoire.







Déterminer le degré de notre ouverture



Dans les premières étapes de la préparation des données, nous voulions montrer autant d'informations que possible. Si nous savons que 65 transactions d'enregistrement électronique ont été effectuées dans la ville de H en juillet 2020, alors parlons-en aux utilisateurs! Cependant, à un moment donné, nous avons réfléchi à la manière dont nos concurrents pourraient en profiter. Après tout, la divulgation de valeurs absolues dans le contexte des villes, et même avec des dynamiques par semaine, peut conduire au fait que les données seront utilisées pour tester diverses hypothèses au sein de localités spécifiques. Nos données sont mises à jour quotidiennement, ce qui signifie que les acteurs du marché ont la possibilité de suivre au quotidien presque toutes les principales métriques de notre activité, de mener diverses campagnes et d'évaluer instantanément leur effet sur nos résultats. De plus, la divulgation de deux paramètres (par ex.le nombre de demandes et le nombre de demandes approuvées) peuvent en fait révéler une autre métrique (par exemple, le taux d'approbation) que vous ne voulez pas du tout afficher.



Pour éviter les situations désagréables, nous avons décidé de «fermer» les métriques critiques pour les régions et les villes avec des intervalles. De plus, la construction et le tri des notes dans le tableau ont toujours lieu en fonction des valeurs absolues réelles des métriques, elles ne sont tout simplement pas affichées à l'avant pour l'utilisateur final.







Pour qui et pourquoi ouvrons-nous des données



Désormais, le portail comporte quatre sections (flux), chacune contenant 5 à 6 mesures sous forme de tableau avec une évaluation régionale. Lorsque vous cliquez sur une région, vous pouvez y tomber et voir le classement des villes de cette région. Un choix d'intervalle de temps est disponible (tous les mois à partir de janvier 2019 et "les 30 derniers jours"), ainsi qu'une recherche par région et par ville.



Cette granularité permet aux données d'être utilisées comme matériaux pour les études de marché. Par exemple, l' analyse du marché immobilier , qui a été réalisée par nous avec SberIndex, basée sur l'Open Data. Un merci spécial à Nikolai Korzhenevsky, directeur du laboratoire SberIndex, pour sa position proactive sur la recherche.



Copier-coller Extrait de l'analyse:



  • Les prix de l'offre immobilière dans le pays en moyenne au cours des deux derniers mois ont augmenté de 3,0% en glissement annuel, selon DomClick. Sur le marché primaire, la croissance des cotations atteint 6,2% a / a.
  • Parmi les leaders de l'augmentation des prix de l'offre figurent les régions touristiques:

    • Territoire de Khabarovsk (18,9% sur un an),
    • Région de Kaliningrad (18,0% sur un an),
    • République de l'Altaï (17,6% sur un an).
  • La dynamique des prêts émis en juillet-août est également restée proche des valeurs record dans un contexte de chute rapide des taux hypothécaires. Le nombre de prêts hypothécaires émis, selon nos estimations, augmente de 44% en glissement annuel.
  • Depuis la pandémie, près de la moitié des demandes de prêt hypothécaire approuvées par DomClick ont ​​été déposées en ligne, selon Open Data.


Outre l'analyse et la recherche de marché, «Open Data» peut être utile à plusieurs publics à la fois:



  • , / , ..
  • , .
  • Excel .
  • , / , .
  • // . , :)


Et après?



  • Dans un proche avenir, nous prévoyons de nous concentrer sur la création de graphiques pour un suivi plus pratique de la dynamique des changements de métriques par mois et par semaines. Les maquettes sont déjà prêtes, les données sont là, le travail bat son plein.
  • En même temps, nous sélectionnons et commençons à collecter des données pour de nouvelles sections, en essayant de comprendre ce qui sera le plus intéressant pour les utilisateurs.
  • Nous voulons rendre plus pratique l'exportation des données agrégées vers Excel.
  • Et en parallèle, nous travaillons sur des options de visualisation des métriques sur la carte RF (avec une carte thermique ou des points). C'est-à-dire que, dans une certaine mesure, nous revenons à l'idée de la toute première version du produit, mais déjà avec l'expérience derrière nous, une équipe sympathique et un projet travaillant en production.


Si vous avez des commentaires / questions sur le portail, ou des idées sur des données qu'il serait intéressant «d'ouvrir», alors écrivez dans les commentaires, je vais essayer de répondre à tout le monde.



All Articles