Partendo dai dati registrati dai (o nei) sistemi informativi durante la regolare attività quotidiana, si acquisisce una conoscenza oggettiva del reale modo di lavorare di un'organizzazione.
A seconda dei dati disponibili, è possibile estrarre con facilità rappresentazioni dettagliate dei processi, della struttura organizzativa, delle regole in atto. In altre parole, è possibile scoprire (per questo parliamo di Discovery) con il livello di dettaglio richiesto la situazione attuale (as-is), obbligato punto di partenza per la maggior parte delle attività rivolte all'automazione, al miglioramento e semplicemente alla comprensione del proprio modo di operare.
Poiché non è necessaria alcuna conoscenza a-priori, può essere applicata, senza difficoltà, in situazioni di cui non si conosce nulla. Ma può risultare estremamente utile, anche nei casi in cui si abbiano già delle informazioni, pure se parziali o incomplete, che si desideri completare o rifinire.
Permette inoltre di valutare i modelli estratti oppure di effettuare dettagliati benchmarks tra modelli diversi.
[Figura - Process Itelligence Process Discovery or Process Mining]
Si utilizzano metodologie diverse, a seconda delle prospettive indagate (flusso di attività, organizzazione, regole) e della conoscenza richiesta (per esempio: diagrammi di processo, pattern, classification o clustering delle sequenze, ruoli e relazioni, decision tree, ecc.). Alcune di queste sono derivate dai campi del machine learning, del data mining, della sequence analysis oppure della social network analysis; altre sono algoritmi sviluppati ad hoc (alcuni dei quali spesso raccolti sotto il process mining, ombrello in continua espansione).
Tutte implementate in linguaggi di programmazione comunemente utilizzati (soprattutto R, il noto ambiente di calcolo statistico ) o utilizzando strumenti di analisi open source (ad esempio, Weka e Pajek).