Znaczenie zarządzania danymi w analityce cyfrowej
Opublikowany: 2023-04-17W analityce cyfrowej organizacje spędzają dużo czasu na gromadzeniu, interpretowaniu i raportowaniu danych. Nadrzędnym celem jest wykorzystanie danych jako przewagi konkurencyjnej. Możesz wykorzystać dane do poprawy skuteczności reklamy cyfrowej lub ulepszenia produktów cyfrowych. Ale zanim będziesz mógł wykorzystać swoje dane, musisz mieć pewność, że masz prawidłowe dane. Podejmowanie decyzji na podstawie niedokładnych danych nie jest dużo lepsze niż podejmowanie decyzji na podstawie braku danych. Łatwo jest zignorować znaczenie dobrego zarządzania danymi. Zarządzanie danymi jest często postrzegane jako pracochłonne zadanie, któremu można nadać priorytet, ale to błąd. W tym poście opiszę niektóre funkcje zarządzania danymi niezbędne do długoterminowego sukcesu w analityce cyfrowej.
Zarządzanie danymi wykracza poza początkową implementację
Najlepszym sposobem na uzyskanie dobrych cyfrowych danych analitycznych jest dobra implementacja. Godziny spędzone przez organizacje na planowaniu i wdrażaniu wydarzeń i właściwości związanych z analizą cyfrową są niezbędne do uzyskania wiarygodnych danych. Podczas początkowej implementacji często występuje kilka poziomów zapewniania jakości i testowania w celu sprawdzenia jakości danych. Jednak po wstępnym wdrożeniu wiele organizacji stwierdza, że jakość ich danych do analizy cyfrowej ulega pogorszeniu. Pogorszenie jakości danych jest często spowodowane potrzebą większego zarządzania danymi. Podczas gdy początkowe wdrożenia mogą być głośne w organizacji, zarządzanie danymi jest mniej efektowne. Mimo że wdrażanie i zarządzanie danymi mają te same cele, czyli dobrą jakość danych, wiele organizacji koncentruje się bardziej na tym pierwszym niż drugim.
Jednym z powodów, dla których organizacje nie radzą sobie dobrze z zarządzaniem danymi, jest to, że używane przez nie produkty do analizy cyfrowej nie inwestują wystarczająco dużo w funkcje zarządzania danymi. Wiele wiodących na rynku produktów do analityki cyfrowej nie ma podstawowych funkcji zarządzania danymi. Ten brak funkcji zarządzania to wstyd, ponieważ zarządzanie danymi leży u podstaw wszystkiego, co jest związane z programem analizy cyfrowej.
Projekt rozwiązania wdrożeniowego
Zrozumienie, jakie dane gromadzisz w ramach implementacji analityki cyfrowej, jest niezbędne. Samo identyfikowanie i komunikowanie zdarzeń i właściwości, które Twoja organizacja wybrała do zbierania, to stawka tabeli. Niestety wielu dostawców analityki cyfrowej używa arkuszy kalkulacyjnych do udostępniania zawartości rozwiązania analitycznego. Śledzenie rozwiązań wdrożeniowych w arkuszach kalkulacyjnych ma następujące wady:
- Informacje są oddzielone od produktu do analizy cyfrowej i raportów
- Wiele wersji projektu rozwiązania może rozprzestrzeniać się w organizacji, co utrudnia ustalenie, która wersja jest aktualna
- Arkusze kalkulacyjne nie mogą informować o stanie każdego elementu projektu rozwiązania (np. czy aktualnie gromadzą dane?)
Preferowane jest posiadanie wszystkich informacji o rozwiązaniu bezpośrednio w interfejsie produktu do analityki cyfrowej, aby zawsze mieć dostęp do najbardziej aktualnych informacji:

Korzystne jest również, jeśli wiele osób może iterować projekt rozwiązania, być może nawet jednocześnie. W idealnej sytuacji można zarządzać iteracjami projektu rozwiązania za pośrednictwem „gałęzi”, tak jak w przypadku korzystania z GitHub:

Walidacja schematu danych
Kolejnym krytycznym aspektem zarządzania danymi jest sprawdzanie poprawności schematu danych. Jednym z elementów sprawdzania poprawności schematu jest automatyczna weryfikacja, która gwarantuje, że gromadzone dane są zgodne z oczekiwaniami. Jest to ważne, ponieważ członkowie zespołu analityki cyfrowej są często zajęci i nie mają czasu na proaktywne monitorowanie, kiedy nowe zdarzenia lub właściwości są wysyłane do wdrożenia. Śledzenie nieoczekiwanych zdarzeń jest lepiej obsługiwane przez produkt do analizy cyfrowej, który jest świadomy projektu rozwiązania. Automatyzacja umożliwia cyfrowemu produktowi analitycznemu ostrzeganie zespołu w przypadku wykrycia nieoczekiwanych zdarzeń lub właściwości. Te nieoczekiwane elementy są poddawane kwarantannie, dopóki nie zostaną sprawdzone, aby nie zanieczyszczały danych produkcyjnych:

Kolejną cechą walidacji schematu danych jest możliwość sprawdzenia, czy zebrane wartości danych odpowiadają oczekiwanemu formatowi. Na przykład, jeśli masz właściwość danych, która ma być liczbą, ale przekazywany jest ciąg tekstowy, powinna ona zostać automatycznie oflagowana. Jeśli masz określony format kodu pocztowego, którego należy przestrzegać, każda wartość powinna zostać zweryfikowana, aby dane były spójne. Jeśli chodzi o walidację schematu danych, „uncja prewencji jest warta funta wyleczenia!”

Oficjalizacja obiektu
Kiedy ludzie w Twojej organizacji korzystają z Twojego produktu do analityki cyfrowej, ustalenie, które komponenty analityczne są prawidłowe, a które nie, może być trudne. Często użytkownicy tworzą nowe kohorty, metryki itp., aby wypróbować różne rozwiązania, ale właściciel implementacji ich nie zweryfikował.
Oficjalizacja obiektów to proces oznaczania obiektów analityki cyfrowej jako „oficjalnych” w ramach wdrożenia. Jak pokazano poniżej, obiektom można przypisać jakiś wskaźnik (np. niebieską kratkę), aby zaznaczyć, że ktoś z odpowiednimi uprawnieniami zatwierdził obiekt. Oficjalnym obiektom można ufać i zakładać, że są poprawne.

Urzędowanie obiektów eliminuje zgadywanie podczas wybierania komponentów do analizy cyfrowej i pomaga uniknąć rozpowszechniania przez różnych użytkowników nieoficjalnych obiektów w raportach i pulpitach nawigacyjnych.
Deduplikacja obiektów
Deduplikacja obiektów jest stycznie powiązana z oficjalizacją obiektów. Jednym z najbardziej irytujących aspektów analityki cyfrowej jest mnożenie się wielu wersji tych samych obiektów analitycznych. Tymi obiektami mogą być metryki obliczeniowe, kohorty itp. Chociaż zarządzanie obiektami może pomóc zminimalizować ten problem, często użytkownicy narzędzi analitycznych nadal mają możliwość tworzenia wielu wersji obiektów analitycznych. Te różne wersje można powiązać z wieloma raportami lub pulpitami nawigacyjnymi. Problem ten nasila się, gdy w definicji lub formule obiektu analitycznego zostanie wykryty błąd. Zamiast naprawiać to w jednym miejscu, organizacje muszą znaleźć wszystkie różne wersje i naprawić każdą z nich osobno, co może być koszmarem dla zarządzania!
Zaawansowane produkty analityczne (takie jak Amplitude!) bezpośrednio rozwiązały ten problem deduplikacji. Najlepszym sposobem uniknięcia deduplikacji jest uniemożliwienie użytkownikom tworzenia duplikatów obiektów. Jak pokazano poniżej, jeśli użytkownik spróbuje utworzyć dokładny duplikat, produkt do analizy cyfrowej uniemożliwi mu zapisanie go.

Użycie obiektu
Organizacje wdrażające analitykę cyfrową często wdrażają wiele różnych zdarzeń i właściwości. Każdy zespół ma dodatkowe dane, które chce zebrać. Gdy masz wiele punktów danych, zrozumienie, które elementy danych są używane najczęściej, a które najmniej, może być przytłaczające. Wiele cyfrowych produktów analitycznych pogarsza sytuację, zaciemniając użycie obiektów. W przypadku niektórych cyfrowych produktów analitycznych zrozumienie, które obiekty są używane, gdzie i przez kogo, wymaga od administratorów pobierania danych użytkowania za pośrednictwem pliku CSV i tworzenia raportów.

Nowoczesne produkty do analityki cyfrowej ułatwiają zrozumienie, gdzie wykorzystywane jest każde zdarzenie lub właściwość analityki cyfrowej, jak pokazano tutaj:

Informacje te powinny być również widoczne na bardziej szczegółowym poziomie, aby wyświetlić konkretne osoby i obiekty korzystające z wydarzenia lub nieruchomości:

Dysponując tymi informacjami, administratorzy i kierownicy wdrożeń mogą:
- Zobacz, z którymi zdarzeniami i analizami właściwości korzystają użytkownicy
- Określ, czy niektóre wydarzenia i właściwości mogą wymagać dodatkowego szkolenia z powodu braku użycia
- Rozważ usunięcie zdarzeń i właściwości, które nie są już potrzebne
Zrozumienie zdarzeń analitycznych
Częstym problemem w implementacjach analityki cyfrowej jest to, że przypadkowi użytkownicy końcowi nie są do końca pewni, co oznacza każde zdarzenie analityczne. Deweloperzy są znani z tworzenia niezrozumiałych nazw zdarzeń (np. form_reaction). Wielu użytkowników narzędzi analitycznych nie jest zaangażowanych w proces wdrażania i nie ma informacji o tym, jak i dlaczego zdarzenia analityczne zostały nazwane. Dlatego bardzo cenione jest wszystko, co administratorzy lub menedżerowie mogą zrobić, aby pomóc użytkownikom końcowym upewnić się, że używają właściwego zdarzenia do analizy.
Jednym ze sposobów rozwiązania tego problemu jest utworzenie słownika danych. Tutaj użytkownicy mogą dowiedzieć się o każdym zdarzeniu analitycznym i zobaczyć, gdzie się ono znajduje w witrynie lub aplikacji mobilnej. Słowniki danych można przechowywać w dokumencie lub w przestrzeni współdzielonej, takiej jak Confluence lub Miro.
W Amplitude oferujemy dwa interesujące sposoby przekazywania informacji o Twojej implementacji oraz jej zdarzeniach i właściwościach. Jednym z nich jest nasza funkcja Notatnika. Notatniki Amplitude to dowolne płótna, na których można dodawać tekst, obrazy, wideo, raporty analityczne itp. Notatniki to doskonałe miejsce do dokumentowania implementacji i udostępniania kontekstu dotyczącego zdarzeń i właściwości analitycznych.

Innym sposobem, w jaki Amplitude pomaga administratorom udostępniać informacje o zdarzeniach związanych z implementacją, są zrzuty ekranu zdarzeń. Administratorzy mogą dołączać zrzuty ekranu do zdarzeń w module danych Amplitude. Dołączenie zrzutu ekranu miejsca, w którym zdarzenie analityczne jest ustawione do każdego zdarzenia, umożliwi użytkownikom końcowym zobaczenie tego zrzutu ekranu podczas przewijania różnych zdarzeń podczas tworzenia raportu. Te zrzuty ekranu pomagają użytkownikom końcowym zyskać pewność, że użyją właściwego zdarzenia do swoich analiz.

Transformacja danych
Bez względu na to, jak bardzo się starasz, może się zdarzyć, że do Twojego produktu do analityki cyfrowej zostaną wysłane nieprawidłowe dane. Deweloperzy mogą zmienić witrynę lub aplikację, która powoduje wysłanie nieprawidłowych danych. Klienci mogli wprowadzić nieprawidłowe informacje w polach formularza. Użytkownicy mogą odświeżać strony i tworzyć duplikaty danych. Niezależnie od tego, jak to się dzieje, gromadzone są niedokładne dane. Niektóre z powyższych elementów sprawdzania poprawności schematu mogą pomóc złagodzić złe dane. Mimo to Twój produkt do analityki cyfrowej powinien być w stanie modyfikować/aktualizować/przekształcać dane w razie potrzeby.
Niektóre produkty do analizy cyfrowej nie zapewniają możliwości przekształcania danych i wymagają wprowadzania zmian w hurtowniach danych. Nie jest to pomocne, ponieważ użytkownicy końcowi mogą korzystać z interfejsu produktu do analizy cyfrowej, gdy dane są nieprawidłowe. Administratorzy powinni mieć możliwość przekształcania danych w razie potrzeby. Powinieneś szukać następujących funkcji przekształcania danych u swojego dostawcy analityki cyfrowej.
Modyfikacja wartości
Administratorzy powinni mieć możliwość zmiany określonych wartości właściwości w razie potrzeby. Wyobraź sobie na przykład kod kampanii marketingowej wysłany do produktu analitycznego bez pożądanej konwencji nazewnictwa. Administratorzy powinni mieć możliwość modyfikowania tych wartości, aby użytkownicy końcowi widzieli poprawną wartość podczas korzystania z raportów i pulpitów nawigacyjnych.

Oprócz jednorazowych zmian wartości administratorzy powinni mieć możliwość tworzenia reguł modyfikujących wiele wartości jednocześnie. Reguły te mogą wykorzystywać formuły lub funkcje do wprowadzania zmian do wszystkich wartości właściwości, na które mają wpływ.

Zaciemnianie danych
Inną pożądaną funkcją transformacji danych jest możliwość ukrywania lub zaciemniania nieprawidłowych danych. Czasami części danych muszą zostać naprawione i chcesz je ukryć przed użytkownikami. Przykładem mogą być dane testowe, które przypadkowo zostały wysłane do produkcji. Te dane nie są usuwane, ale ukrywane przed wszystkimi użytkownikami.

Usuwanie danych
W skrajnych przypadkach będziesz mieć dane analityczne, które chcesz całkowicie usunąć. Dlatego Twój produkt do analityki cyfrowej powinien umożliwiać wybranie określonych porcji danych i ich usunięcie.

Automatyczne testowanie danych
Kolejnym krytycznym narzędziem zarządzania danymi są testy automatyczne. Na rynku dostępne są produkty, które sprawdzą Twoją witrynę lub aplikację, aby upewnić się, że kod analityczny działa poprawnie. Produkty te można również skonfigurować tak, aby zachowywały się jak klienci i sprawdzały, czy śledzenie danych analitycznych działa zgodnie z założeniami. Popularne produkty w tym obszarze to Observepoint i QA2L. Wyjaśnienie zaawansowanych funkcji tych produktów zajęłoby cały post na blogu, dlatego zachęcam do ich sprawdzenia i rozważenia dodania ich do stosu analityki cyfrowej.
Zgodność w zakresie prywatności danych użytkownika
Innym aspektem zarządzania danymi jest honorowanie żądań usunięcia prywatności użytkowników. Przepisy dotyczące prywatności, takie jak RODO i CCPA, zapewniają konsumentom możliwość zażądania usunięcia zgromadzonych na ich temat danych na żądanie. Dlatego niezwykle ważne jest, aby zespoły ds. analityki cyfrowej reagowały na te żądania i podejmowały działania zgodnie z lokalnymi przepisami.
Streszczenie
Jak widać, zarządzania danymi jest znacznie więcej niż na pierwszy rzut oka. Zapewnienie dokładności cyfrowych danych analitycznych wymaga ogromnej ilości proaktywnej pracy. Różni dostawcy usług analityki cyfrowej oferują różne poziomy pomocy w zarządzaniu danymi. Ponieważ wszystkie analizy zależą od jakości danych, należy wziąć pod uwagę możliwości zarządzania danymi zapewniane przez dostawcę.
