Caractéristiques de la classe considérée de problèmes d'analyse des données
Il est nécessaire d'étudier une série chronologique multidimensionnelle dans les conditions suivantes:
- La complexité du processus enregistré et (ou) l'unicité des tâches de recherche ne permettent pas de réduire le travail à l'utilisation d'un algorithme prêt à l'emploi. Il devient nécessaire de diviser le processus en étapes et d'analyser la dynamique complexe au sein de chacune d'elles. Les critères de délimitation des étapes ne sont pas si évidents qu'ils peuvent être appliqués sans visualisation des données.
- Les paramètres sont de nature physique différente et sont mesurés dans différentes unités. Chaque courbe de série chronologique a besoin de sa propre échelle ordonnée.
Caractéristiques du travail du point de vue de l'environnement de visualisation des données
La division d'une série chronologique en étapes peut être triviale ou assez complexe. Il existe des cas où les limites des étapes du processus peuvent être déterminées, par exemple, par la valeur de la variable d'état. Une telle tâche peut être résolue sans visualisation, par exemple à l'aide de filtres de données dans MS Excel .
L'identification des frontières dans des cas plus complexes est associée à une recherche visuelle sur les graphes de signes plus ou moins objectifs du passage du système à un nouvel état. Dans le même temps, le choix des critères peut nécessiter un spécialiste pour comprendre le domaine et effectuer des calculs supplémentaires.
Il convient de noter que même avec la division la plus simple de la série chronologique en étapes, une connaissance préliminaire des graphiques a une signification pratique. Au minimum, cette action vous permet de vérifier qu'il n'y a pas de défauts évidents dans l'enregistrement avant de commencer le travail.
Nous n'aborderons même pas superficiellement les méthodes utilisées pour analyser la dynamique du processus dans les limites d'une étape distincte. Il est important que, pour de nombreux problèmes, l'analyse nécessite une division supplémentaire de la série et la prise en compte d'intervalles de temps plus petits au sein des étapes principales. De plus, les intervalles de temps des transitions entre les étapes peuvent être intéressants.
Ainsi, lors de la résolution de problèmes de la classe considérée, il est généralement nécessaire de changer l'intervalle de temps sur les graphiques plusieurs fois (le décompte peut aller jusqu'à des centaines). La qualité de la mise en œuvre de cette action dans l'interface utilisateur de l'environnement de traitement des données affecte considérablement l'efficacité du travail.
Systèmes existants
MS Excel vous permet de créer une série chronologique multidimensionnelle avec deux échelles le long de l'axe des ordonnées («axe auxiliaire»). Dans ce cas, le changement des limites gauche et droite sur l'axe des abscisses est effectué par un ensemble impressionnant d'actions, y compris la saisie de nombres à partir du clavier.
Après avoir confirmé les modifications, aucune des échelles de l'axe y ne modifie ses paramètres. Pour l'intervalle de temps modifié, les échelles précédentes sur l'axe des ordonnées ne sont souvent pas satisfaisantes. Dans notre exemple, une mise à l'échelle verticale supplémentaire est requise pour une meilleure visualisation.
Une telle interface utilisateur peut difficilement être qualifiée d’optimale pour les tâches envisagées.
Une expérience utilisateur nettement plus efficace est construite grâce à la mise en œuvre du principe WYSIWYGen travaillant avec la zone de construction. L'animation suivante montre l'interaction de l'utilisateur avec une telle interface.
Un exemple est enregistré dans l'application Advanced Grapher , mais de nombreux autres systèmes prennent en charge une option similaire, par exemple la bibliothèque MetricsGraphics.js .
Le gain de vitesse par rapport à MS Excel est ici évident. L'ensemble de la tâche de mise à l'échelle est résolu en un clic:
- le bouton gauche de la souris est enfoncé au point correspondant au coin de la nouvelle zone rectangulaire;
- le curseur est déplacé vers le coin opposé de la nouvelle zone;
- le bouton gauche de la souris est relâché.
Mais cette option n'est pas sans inconvénients. Le premier est le fardeau supplémentaire imposé à l'utilisateur. Avec une action combinée, il lui est demandé de saisir les valeurs de quatre paramètres (coordonnées des limites de la surface rectangulaire tmin , tmax , Pmin , Pmax ), ce qui nécessite leur évaluation préalable «dans l'esprit». Avec l'expérience, la tâche présente une difficulté acceptable. Néanmoins, comme l'utilisateur s'intéresse principalement à l'intervalle de temps, tmin et tmax , il est logique de travailler sur le transfert de la mise à l'échelle verticale vers la machine.
Le deuxième inconvénient est également lié à la mise à l'échelle verticale. Elle consiste en l'impossibilité d'implémenter cette interface pour les tâches de la classe considérée. Le problème est qu'en un seul clic dans notre cas, l'utilisateur saisit non pas 4, mais 6, 8 valeurs ou plus, selon le nombre d'échelles en ordonnée. Chaque échelle de l'ordonnée sur le graphique reçoit de nouvelles valeurs pour les limites supérieure et inférieure, mais en fait toutes ces limites, quel qu'en soit le nombre, sont déterminées par deux nombres. Ces nombres sont les ordonnées de la position du curseur de la souris au début et à la fin du clic. La tâche de l'utilisateur n'est pas seulement plus compliquée par rapport au cas d'une série unidimensionnelle. Il cesse également d'être résoluble: l'intervalle général qui fournit une échelle acceptable pour chaque ligne n'existe pas toujours.
Par exemple, la figure montre l'un des résultats pratiques d'une telle mise à l'échelle.
Les deux lignes représentent des oscillations harmoniques, trois périodes chacune dans l'intervalle de temps considéré. Cela ne peut être déterminé visuellement qu'après un ajustement individuel supplémentaire des échelles, car les amplitudes de vibration sont négligeables par rapport aux intervalles des deux échelles. Une réduction supplémentaire des intervalles affichés par la méthode considérée entraînera un décalage de l'une des courbes en dehors de la zone de construction.
Amélioration de l'interface utilisateur
Comme indiqué ci-dessus, la tâche de mise à l'échelle verticale doit être affectée à un ordinateur. Pour ce faire, considérez comment l'utilisateur le résout en utilisant l'exemple d'une série unidimensionnelle.
En règle générale, après avoir décidé d'un intervalle de temps, l'utilisateur détermine les extrema locaux afin de représenter au mieux la plage de valeurs. La solution optimale dans la plupart des cas est de combiner la plage de valeurs et l'échelon affiché (des algorithmes avec une logique plus subtile sont également possibles, lorsque la zone affichée a une petite marge au-dessus et en dessous de la plage de valeurs; les différences entre ces algorithmes ne sont pas fondamentales).
La logique ci-dessus a une implémentation assez simple. Le schéma d'interface pour une série chronologique unidimensionnelle est illustré dans la figure.
La coordonnée verticale du clic n'a pas d'importance ici: l'action de contrôle combinée de l'utilisateur détermine uniquement les limites gauche et droite de la nouvelle zone d'affichage.
La mise à l'échelle d'une série multidimensionnelle avec une nouvelle interface utilisateur est illustrée par l'animation suivante.
Les données d'origine et le nouvel intervalle de temps dans cet exemple correspondent à l'exemple du début de l'article. Le problème a été résolu par l'action la plus simple avec une qualité maximale. La diminution du temps nécessaire et de l'effort intellectuel de l'utilisateur semble évidente.
Limitation d'applicabilité
Une autre approche de la mise à l'échelle verticale est également possible: dans certains problèmes pratiques, la visualisation est justifiée dans une plage de valeurs prédéterminée qui ne dépend pas des extrema locaux. Dans ce cas, il suffit de ne pas modifier les paramètres d'échelle verticale, car il est implémenté dans MS Excel .