Il significato della governance dei dati nell'analisi digitale

Pubblicato: 2023-04-17

Nell'analisi digitale, le organizzazioni dedicano molto tempo alla raccolta, all'interpretazione e al reporting dei dati. L'obiettivo generale è sfruttare i dati come vantaggio competitivo. È possibile utilizzare i dati per migliorare l'efficacia della pubblicità digitale o migliorare i prodotti digitali. Ma prima di poter sfruttare i tuoi dati, devi essere sicuro di avere i dati corretti. Prendere decisioni basate su dati imprecisi non è molto meglio che prendere decisioni basate su dati inesatti. È facile ignorare l'importanza di una buona governance dei dati. La governance dei dati è spesso vista come un'attività laboriosa che può essere deprioritizzata, ma si tratta di un errore. In questo post, illustrerò alcune funzionalità di governance dei dati essenziali per il successo a lungo termine nell'analisi digitale.

La governance dei dati va oltre l'implementazione iniziale

Il modo migliore per avere buoni dati di analisi digitale è avere una buona implementazione. Le ore che le organizzazioni impiegano per pianificare e implementare eventi e proprietà di analisi digitale sono essenziali per disporre di dati affidabili. Durante l'implementazione iniziale si verificano spesso diversi livelli di garanzia della qualità e test per verificare la qualità dei dati. Ma dopo l'implementazione iniziale, molte organizzazioni scoprono che la qualità dei loro dati di analisi digitale peggiora. Il degrado della qualità dei dati è spesso dovuto alla necessità di una maggiore governance dei dati. Mentre le distribuzioni iniziali possono essere di alto profilo all'interno dell'organizzazione, la governance dei dati è meno affascinante. Anche se l'implementazione e la governance dei dati hanno gli stessi obiettivi di buona qualità dei dati, molte organizzazioni si concentrano maggiormente sulla prima piuttosto che sulla seconda.

Uno dei motivi per cui le organizzazioni non svolgono un ottimo lavoro con la governance dei dati è che i prodotti di analisi digitale che utilizzano non hanno investito abbastanza nelle funzionalità di governance dei dati. Molti dei principali prodotti di analisi digitale sul mercato non dispongono di funzionalità di base per la governance dei dati. Questa mancanza di funzionalità di governance è un peccato perché la governance dei dati è alla base di tutto ciò che riguarda il programma di analisi digitale.

Progettazione della soluzione di implementazione

Comprendere quali dati raccogli nell'implementazione dell'analisi digitale è essenziale. Semplicemente identificando e comunicando gli eventi e le proprietà che la tua organizzazione ha scelto di raccogliere è la posta in gioco. Sfortunatamente, molti fornitori di analisi digitali utilizzano fogli di calcolo per condividere ciò che è nella soluzione di analisi. Il monitoraggio delle soluzioni di implementazione nei fogli di calcolo presenta i seguenti svantaggi:

  • Le informazioni sono separate dal prodotto e dai report di analisi digitale
  • Più versioni della progettazione della soluzione possono diffondersi all'interno dell'organizzazione, rendendo difficile sapere qual è la versione corrente
  • I fogli di calcolo non possono dirti lo stato di ogni elemento di progettazione della soluzione (ad esempio, sta attualmente raccogliendo dati?)

È preferibile disporre di tutte le informazioni sulla soluzione direttamente nell'interfaccia del prodotto di analisi digitale in modo da poter visualizzare sempre le informazioni più aggiornate:

Eventi

È anche vantaggioso se più persone possono iterare sulla progettazione della soluzione, possibilmente anche contemporaneamente. Idealmente, puoi gestire le iterazioni di progettazione della soluzione tramite "rami" come faresti se utilizzi GitHub:

Ramo

Convalida dello schema dei dati

Un altro aspetto critico della governance dei dati è la convalida dello schema dei dati. Un componente della convalida dello schema è la verifica automatica, che garantisce che i dati raccolti siano quelli previsti. Questo è importante perché i membri del team di analisi digitale sono spesso occupati e non hanno il tempo di monitorare in modo proattivo quando nuovi eventi o proprietà vengono inviati all'implementazione. Il monitoraggio degli eventi imprevisti viene gestito meglio dal prodotto di analisi digitale, che è a conoscenza della progettazione della soluzione. L'automazione consente al prodotto di analisi digitale di avvisare il team se vengono rilevati eventi o proprietà imprevisti. Questi articoli imprevisti vengono messi in quarantena fino a quando non vengono esaminati in modo da non contaminare i dati di produzione:

Inaspettato

Un'altra caratteristica della convalida dello schema dei dati è la possibilità di verificare che i valori dei dati raccolti corrispondano al formato previsto. Ad esempio, se si dispone di una proprietà di dati che dovrebbe essere un numero ma viene passata una stringa di testo, dovrebbe essere contrassegnata automaticamente. Se è necessario seguire un formato di codice postale specifico, ogni valore deve essere verificato in modo che i dati siano coerenti. Per quanto riguarda la convalida dello schema dei dati, "un'oncia di prevenzione vale una libbra di cura!"

Schema di proprietà

Officiazione dell'oggetto

Quando le persone nella tua organizzazione utilizzano il tuo prodotto di analisi digitale, può essere difficile sapere quali componenti di analisi sono corretti e quali no. Spesso gli utenti creano nuove coorti, metriche e così via per provare le cose, ma un proprietario dell'implementazione non le ha verificate.

L'officiazione degli oggetti è il processo di contrassegnare gli oggetti di analisi digitale come "ufficiali" all'interno dell'implementazione. Come mostrato di seguito, agli oggetti può essere assegnato un indicatore (ad esempio, un segno di spunta blu) per indicare che qualcuno con le credenziali appropriate ha sanzionato l'oggetto. Gli oggetti officiati possono essere considerati attendibili e ritenuti corretti.

Ufficio

L'officiazione degli oggetti elimina le congetture dalla selezione dei componenti di analisi digitale e aiuta a evitare che utenti diversi diffondano oggetti non ufficiali attraverso report e dashboard.

Deduplicazione degli oggetti

La deduplicazione degli oggetti è correlata tangenzialmente all'officiazione degli oggetti. Uno degli aspetti più fastidiosi dell'analisi digitale è la proliferazione di più versioni degli stessi oggetti di analisi. Questi oggetti possono essere metriche calcolate, coorti, ecc. Mentre l'officiazione degli oggetti può aiutare a minimizzare questo, è spesso ancora possibile per gli utenti di analisi creare numerose versioni di oggetti di analisi. Queste diverse versioni possono essere associate a più report o dashboard. Questo problema si aggrava quando viene rilevato un difetto nella definizione o nella formula dell'oggetto analitico. Invece di risolverlo in un unico posto, le organizzazioni devono trovare tutte le diverse versioni e correggerle separatamente, il che può essere un incubo per la governance!

I prodotti di analisi avanzata (come Amplitude!) hanno risolto direttamente questo problema di deduplicazione. Il modo migliore per evitare la deduplicazione è impedire agli utenti di creare oggetti duplicati. Come mostrato di seguito, se un utente tenta di creare un duplicato esatto, il prodotto di analisi digitale gli impedirà di salvarlo.

Deduplicazione

Uso dell'oggetto

Le organizzazioni che implementano l'analisi digitale spesso implementano molti eventi e proprietà diversi. Ogni squadra ha dati aggiuntivi che vuole raccogliere. Quando si dispone di molti punti dati, può essere complicato capire quali elementi di dati vengono utilizzati di più o di meno. Molti prodotti di analisi digitale peggiorano la situazione offuscando l'utilizzo degli oggetti. In alcuni prodotti di analisi digitale, capire quali oggetti vengono utilizzati, dove e da chi richiede agli amministratori di scaricare i dati sull'utilizzo tramite CSV e creare report.

I moderni prodotti di analisi digitale consentono di capire facilmente dove viene utilizzato ogni evento o proprietà di analisi digitale, come mostrato di seguito:

Utilizzo evento

Queste informazioni dovrebbero essere visibili anche a un livello più dettagliato per visualizzare le persone e gli oggetti specifici che utilizzano l'evento o la proprietà:

Utilizzo evento completo

La disponibilità di queste informazioni consente agli amministratori e ai responsabili dell'implementazione di:

  • Visualizza con quali eventi e proprietà gli utenti di analisi interagiscono
  • Determina se alcuni eventi e proprietà potrebbero richiedere una formazione aggiuntiva a causa della mancanza di utilizzo
  • Prendere in considerazione la rimozione di eventi e proprietà che non sono più necessari

Comprensione degli eventi di analisi

Un problema comune nelle implementazioni dell'analisi digitale è che gli utenti finali occasionali non sono del tutto sicuri del significato di ogni evento di analisi. Gli sviluppatori sono noti per la creazione di nomi di eventi incomprensibili (ad esempio, form_reaction). Molti utenti di analisi non sono coinvolti nel processo di implementazione e non hanno il retroscena su come e perché gli eventi di analisi sono stati nominati. Pertanto, qualsiasi cosa gli amministratori o i responsabili possano fare per aiutare gli utenti finali a garantire che utilizzino l'evento corretto per la loro analisi è molto apprezzata.

Un modo per risolvere questo problema è creare un dizionario di dati. Qui è dove gli utenti possono conoscere ogni evento di analisi e vedere dove si trova sul sito Web o sull'app mobile. I dizionari di dati possono essere archiviati in un documento o in uno spazio condiviso come Confluence o Miro.

Ad Amplitude, offriamo due modi interessanti per comunicare informazioni sulla tua implementazione e sui suoi eventi e proprietà. Uno è attraverso la nostra funzione Notebook. I taccuini di Amplitude sono tele a mano libera in cui puoi aggiungere testo, immagini, video, report di analisi, ecc. I taccuini sono un ottimo posto per documentare la tua implementazione e condividere il contesto intorno a eventi e proprietà di analisi.

Taccuino

L'altro modo in cui Amplitude aiuta gli amministratori a condividere le informazioni sugli eventi di implementazione è attraverso gli screenshot degli eventi. Gli amministratori possono allegare schermate agli eventi nel modulo Dati di Amplitude. Allegare uno screenshot del punto in cui è impostato l'evento di analisi a ciascun evento consentirà agli utenti finali di vedere tale screenshot mentre scorrono i vari eventi durante la creazione del report. Questi screenshot aiutano gli utenti finali a creare fiducia nell'utilizzo dell'evento corretto per le loro analisi.

Schermata dell'evento

Trasformazione dei dati

Non importa quanto ci provi, ci saranno momenti in cui dati errati vengono inviati al tuo prodotto di analisi digitale. Gli sviluppatori possono modificare un sito Web o un'app che attiva l'invio di dati errati. I clienti potrebbero inserire informazioni errate nei campi del modulo. Gli utenti possono aggiornare le pagine e creare dati duplicati. Indipendentemente da come accade, vengono raccolti dati imprecisi. Alcuni degli elementi di convalida dello schema precedenti possono aiutare a mitigare i dati errati. Tuttavia, il tuo prodotto di analisi digitale dovrebbe essere in grado di modificare/aggiornare/trasformare i dati se necessario.

Alcuni prodotti di analisi digitale non forniscono un modo per trasformare i dati e richiedono di apportare modifiche ai data warehouse. Ciò non è utile poiché gli utenti finali potrebbero utilizzare l'interfaccia del prodotto di analisi digitale in cui i dati non sono corretti. Gli amministratori dovrebbero avere la possibilità di trasformare i dati se necessario. Dovresti cercare le seguenti funzionalità di trasformazione dei dati nel tuo fornitore di analisi dei dati digitali.

Modifica del valore

Gli amministratori devono avere la possibilità di modificare valori di proprietà specifici, se necessario. Ad esempio, immagina il codice di una campagna di marketing inviato al prodotto di analisi senza la convenzione di denominazione desiderata. Gli amministratori dovrebbero essere in grado di modificare questi valori in modo che gli utenti finali vedano il valore corretto quando utilizzano report e dashboard.

Trasforma i valori

Oltre alle modifiche di valore una tantum, gli amministratori dovrebbero essere in grado di creare regole che modificano molti valori contemporaneamente. Queste regole possono utilizzare formule o funzioni per applicare le modifiche a tutti i valori delle proprietà interessate.

Regole di trasformazione

Offuscamento dei dati

Un'altra funzionalità di trasformazione dei dati desiderata è la capacità di nascondere o offuscare i dati errati. A volte è necessario correggere porzioni di dati e desideri nasconderle agli utenti. Un esempio potrebbe essere dato dai test inviati accidentalmente alla produzione. Questi dati non vengono eliminati ma nascosti a tutti gli utenti.

DropFilter

Cancellazione dei dati

In casi estremi, avrai dati di analisi che desideri rimuovere del tutto. Pertanto, il tuo prodotto di analisi digitale dovrebbe consentirti di selezionare porzioni specifiche di dati e rimuoverle.

Blocca filtro

Test automatizzato dei dati

Un altro strumento critico per la governance dei dati è il test automatizzato. Esistono prodotti disponibili sul mercato che controlleranno il tuo sito Web o la tua app per garantire che il codice di analisi funzioni correttamente. Questi prodotti possono anche essere configurati per agire come clienti e verificare che il monitoraggio delle analisi funzioni come previsto. I prodotti popolari in quest'area includono Observepoint e QA2L. Ci vorrebbe un intero post sul blog per spiegare le funzionalità avanzate di questi prodotti, quindi ti incoraggio a verificarli e considerare di aggiungerli al tuo stack di analisi digitale.

Conformità alla privacy dei dati degli utenti

Un altro aspetto della governance dei dati è onorare le richieste di cancellazione della privacy degli utenti. Le normative sulla privacy come GDPR e CCPA offrono ai consumatori la possibilità di richiedere che i dati raccolti su di loro vengano cancellati su richiesta. Pertanto, è fondamentale che i team di analisi digitale rispondano e agiscano in base a queste richieste come dettato dalle normative vigenti locali.

Riepilogo

Come puoi vedere, c'è molto di più di quanto sembri per quanto riguarda la governance dei dati. Garantire che i tuoi dati di analisi digitale siano accurati richiede un'enorme quantità di lavoro proattivo. Diversi fornitori di analisi digitali offrono diversi livelli di assistenza nella governance dei dati. Poiché tutte le analisi dipendono dalla qualità dei dati, le funzionalità di governance dei dati fornite dal tuo fornitore sono qualcosa da considerare.