Alpha-mineur. Analyse de la construction d'un modĂšle pour le Process Mining





L'algorithme alpha est la premiÚre technologie d'analyse de processus qui a permis de trouver les réseaux dits de flux de travail à partir des journaux de processus. L'algorithme a été développé en 2013 par le fondateur de la méthodologie Process Mining, le professeur Will MP van der Aalst.



Qu'est-ce que les réseaux Workflow (ci-aprÚs WF) est un réseau construit sur la base de réseaux Petri. Surtout, WF basé sur les réseaux Petri vous permet de présenter et d'analyser davantage les flux de travail.



Les caractéristiques distinctives de WF sont:



  1. Un départ clair. (Une action unique qui ne déclenche que toutes les chaßnes d'actions)
  2. Clear End (action unique qui ne termine que toutes les chaĂźnes d'actions)
  3. Chaque action individuelle se situe entre l'élément 1. et le point 2.


Jetons un coup d'Ɠil à quelques exemples:











Ces schémas ne sont pas WF. Pourquoi? Dans le premier cas, nous n'avons pas le début et la fin de la chaßne (ils sont indiqués par un cercle). Dans le second cas, l'action d n'a pas de fin.



Ci-dessous, j'ai donné un exemple d'un réseau WF correct - il y a un début et une fin, et toutes les actions sont situées entre eux et sont terminées.







AprÚs avoir clarifié un peu ce qu'est WF, passons à l'algorithme alpha:



afin d'obtenir WF en utilisant l'algorithme alpha, nous devons mettre les choses en ordre dans notre journal. Pour ce faire, nous définirons les relations suivantes entre les transitions dans le journal des événements (plus tard, elles seront nécessaires pour construire un modÚle):



1. SĂ©quence directe.

ÉvĂ©nement A> ÉvĂ©nement B.

Dans un vrai journal d'événements, cela ressemblerait à ceci:







2. Relation causale.

ÉvĂ©nement A → ÉvĂ©nement B. Cela

signifie qu'il y a de telles transitions dans le journal des événements







Mais il n'y a pas de telles transitions :







Par conséquent, sur le diagramme, nous mettons le symbole







  1. ÉvĂ©nements parallĂšles.

    Le journal contient les deux transitions ÉvĂ©nement A → ÉvĂ©nement B et ÉvĂ©nement B → ÉvĂ©nement A.
  2. Manque de cohérence.

    ÉvĂ©nement A # ÉvĂ©nement B et vice versa. Ces Ă©vĂ©nements n'apparaissent pas dans le journal.


L'ensemble de données commun à toutes les transitions s'appelle l'ensemble L.



Prenons un petit exemple. Voici un journal de trois cas.







Écrivons les liens de notre journal qui sont utilisĂ©s dans l'algorithme alpha:



  1. > ,

    > ,

    > ,

    > ,

    > ,

    > ,

    >
  2. → ,

    → ,

    → ,

    → ,

    → ,

    →
  3. ||


Sur la base des relations résultantes, nous dessinons WF.







Le modÚle résultant couvre toutes les actions de notre journal et est facile à analyser.



Limitations de l'algorithme alpha.



Si votre journal contient des boucles simples ou doubles (répétitions d'actions), l'algorithme interprÚte mal et peut générer un modÚle différent de ce qui est attendu. Revenons à notre journal plus tÎt et ajoutons-y des répétitions:







Le modĂšle attendu ressemblera Ă  ceci:







Mais l'algorithme alpha nous donnera une image complÚtement différente:







Quelle est la raison? L'action "Traitement d'une demande" n'a ni dĂ©but ni fin. Dans le processus de gĂ©nĂ©ration du modĂšle, un ensemble A (oĂč se trouvent tous les dĂ©buts) et un ensemble B (oĂč se terminent les processus) sont crĂ©Ă©s. Étant donnĂ© qu'avec plusieurs rĂ©pĂ©titions, les ensembles de donnĂ©es disparaissent de nous, l'algorithme ne peut pas les trouver. En consĂ©quence, cette action sort du modĂšle gĂ©nĂ©ral.



La mĂȘme situation se produit avec deux actions rĂ©pĂ©tĂ©es d'affilĂ©e. L'algorithme Alpha n'en laissera qu'un seul, le second abandonnera et nous ne pourrons pas interprĂ©ter le modĂšle.



Comment résoudre ce problÚme? Il est nécessaire de prendre en compte autant que possible les caractéristiques du systÚme que vous analysez. Si votre systÚme écrit dans le journal non seulement les points principaux, mais également les actions générées automatiquement (par exemple, dans le cas d'une saisie manuscrite, le systÚme peut effectuer une sauvegarde automatique toutes les 5 secondes et l'écrire dans le journal), il est alors logique de combiner ces actions en un seul élément.



All Articles