數據治理在數字分析中的重要性
已發表: 2023-04-17在數字分析中,組織花費大量時間收集、解釋和報告數據。 總體目標是利用數據作為競爭優勢。 您可以使用數據來提高數字廣告效果或改進數字產品。 但在您可以利用您的數據之前,您需要確保您擁有正確的數據。 根據不准確的數據做出決策並不比根據沒有數據做出決策好多少。 人們很容易忽視良好數據治理的重要性。 數據治理通常被視為一項可以取消優先級的艱鉅任務,但這是一個錯誤。 在這篇文章中,我將概述一些對數字分析的長期成功至關重要的數據治理功能。
數據治理超越了最初的實施
擁有好的數字分析數據的最好方法是有一個好的實施。 組織花在計劃和實施數字分析事件和屬性上的時間對於獲得可靠的數據至關重要。 在最初的實施過程中,通常會出現幾個質量保證和測試級別,以驗證數據質量。 但在最初實施之後,許多組織發現他們的數字分析數據質量下降了。 數據質量下降通常是由於需要更多的數據治理。 雖然初始部署在組織內可能很引人注目,但數據治理就不那麼迷人了。 儘管實施和數據治理具有良好數據質量的相同目標,但許多組織更多地關注前者而不是後者。
組織在數據治理方面做得不好的原因之一是他們使用的數字分析產品沒有在數據治理功能方面投入足夠的資金。 市場上許多領先的數字分析產品都缺乏基本的數據治理功能。 缺乏治理功能是一種恥辱,因為數據治理支撐著與數字分析程序相關的一切。
實施方案設計
了解您在數字分析實施中收集的數據至關重要。 簡單地識別和傳達您的組織選擇收集的事件和屬性是籌碼。 不幸的是,許多數字分析供應商使用電子表格來共享分析解決方案中的內容。 在電子表格中跟踪實施解決方案具有以下缺點:
- 信息與數字分析產品和報告分離
- 解決方案設計的多個版本可能遍布整個組織,因此很難知道哪個是當前版本
- 電子表格無法告訴您每個解決方案設計元素的狀態(例如,它當前是否在收集數據?)
最好將所有解決方案信息直接放在數字分析產品界面中,以便您始終可以查看最新信息:

如果多個人可以迭代解決方案設計,甚至可能同時迭代,這也是有益的。 理想情況下,您可以像使用 GitHub 一樣通過“分支”管理解決方案設計迭代:

數據模式驗證
數據治理的另一個關鍵方面是數據模式驗證。 模式驗證的一個組成部分是自動驗證,它確保收集的數據符合預期。 這很重要,因為數字分析團隊成員通常很忙,沒有時間主動監控何時將新事件或屬性發送到實施。 跟踪意外事件最好由了解解決方案設計的數字分析產品處理。 自動化允許數字分析產品在發現意外事件或屬性時提醒團隊。 這些意外的項目在被審查之前被隔離,這樣它們就不會污染生產數據:

數據模式驗證的另一個功能是能夠驗證收集的數據值是否符合預期格式。 例如,如果您有一個數據屬性,它本來是一個數字,但傳遞的是一個文本字符串,那麼它應該被自動標記。 如果您有必須遵循的特定郵政編碼格式,則應驗證每個值以確保數據一致。 關於數據模式驗證,“一分預防勝於一分治療!”

客體主持
當您組織中的人員使用您的數字分析產品時,要知道哪些分析組件是正確的而哪些是錯誤的可能具有挑戰性。 用戶通常會創建新的同類群組、指標等來進行嘗試,但實施所有者尚未驗證它們。
對象授權是在實施中將數字分析對象標記為“官方”的過程。 如下所示,可以為對象分配一些指示符(例如,藍色勾號)以表示具有適當證書的人已經批准了該對象。 官方對象可以被信任並被認為是正確的。

對像管理消除了選擇數字分析組件時的猜測,並有助於避免不同用戶在報告和儀錶盤中散佈非官方對象。
對象去重
對象重複數據刪除與對象授權無關。 數字分析最煩人的方面之一是同一分析對象的多個版本激增。 這些對象可能是計算出的指標、群組等。雖然對象授權可以幫助最小化這種情況,但分析用戶通常仍然可以創建多個版本的分析對象。 這些不同的版本可以與多個報告或儀表板相關聯。 當在分析對象的定義或公式中發現缺陷時,這個問題會加劇。 組織必須找到所有不同的版本並分別修復每個版本,而不是在一個地方修復它,這可能是一場治理噩夢!
高級分析產品(如 Amplitude!)直接解決了這個重複數據刪除問題。 避免重複數據刪除的最佳方法是防止用戶創建重複對象。 如下所示,如果用戶試圖創建一個完全相同的副本,數字分析產品將禁止他們保存它。

對像用法
實施數字分析的組織通常實施許多不同的事件和屬性。 每個團隊都有他們想要收集的額外數據。 當您有很多數據點時,了解哪些數據元素使用最多或最少可能會讓人不知所措。 許多數字分析產品通過混淆對象的使用使情況變得更糟。 在一些數字分析產品中,了解哪些對像被使用、在何處以及由誰使用,需要管理員通過 CSV 下載使用數據並創建報告。
現代數字分析產品可以輕鬆了解每個數字分析事件或屬性的使用位置,如下所示:


此信息還應該在更詳細的級別上可見,以查看使用事件或屬性的特定人員和對象:

掌握此信息後,實施管理員和經理可以:
- 查看用戶參與的事件和屬性分析
- 確定某些事件和屬性是否由於缺乏使用而需要額外培訓
- 考慮刪除不再需要的事件和屬性
了解分析事件
數字分析實施中的一個常見問題是臨時最終用戶並不完全確定每個分析事件的含義。 開發人員因創建難以理解的事件名稱(例如,form_reaction)而臭名昭著。 許多分析用戶沒有參與實施過程,也不知道分析事件的命名方式和原因。 因此,非常感謝管理員或經理可以做的任何事情來幫助最終用戶確保他們使用正確的事件進行分析。
解決這個問題的一種方法是創建數據字典。 用戶可以在這裡了解每個分析事件並查看它在網站或移動應用程序中的位置。 數據字典可以存儲在文檔或共享空間(如 Confluence 或 Miro)中。
在 Amplitude,我們提供兩種有趣的方式來傳達有關您的實施及其事件和屬性的信息。 一種是通過我們的筆記本功能。 Amplitude Notebooks 是自由形式的畫布,您可以在其中添加文本、圖像、視頻、分析報告等。Notebooks 是記錄您的實施和共享分析事件和屬性的上下文的好地方。

Amplitude 幫助管理員共享實施事件信息的另一種方式是通過事件截圖。 管理員可以將屏幕截圖附加到 Amplitude 的數據模塊中的事件。 將分析事件設置位置的屏幕截圖附加到每個事件將使最終用戶能夠在報告創建期間滾動瀏覽各種事件時看到該屏幕截圖。 這些屏幕截圖幫助最終用戶建立信心,使用正確的事件進行分析。

數據轉換
無論您多麼努力,有時都會將不正確的數據發送到您的數字分析產品。 開發人員可能會更改觸發錯誤數據發送的網站或應用程序。 客戶可能會在表單字段中輸入不正確的信息。 用戶可以刷新頁面並創建重複數據。 不管它是如何發生的,都會收集到不准確的數據。 前面的一些模式驗證項可以幫助減少不良數據。 不過,如果需要,您的數字分析產品應該能夠修改/更新/轉換數據。
一些數字分析產品不提供轉換數據的方法,需要您在數據倉庫中進行更改。 這沒有幫助,因為最終用戶可能會在數據不正確的地方使用數字分析產品界面。 如果需要,管理員應該可以選擇轉換數據。 您應該在數字分析提供商中尋找以下數據轉換功能。
數值修改
如果需要,管理員應該能夠更改特定的屬性值。 例如,想像一下發送到分析產品的營銷活動代碼沒有所需的命名約定。 管理員應該能夠修改這些值,以便最終用戶在使用報告和儀表板時看到正確的值。

除了一次性更改值外,管理員還應該能夠創建一次修改多個值的規則。 這些規則可以使用公式或函數將更改應用於所有受影響的屬性值。

數據混淆
另一個所需的數據轉換功能是隱藏或混淆不正確數據的能力。 有時需要修復部分數據,而您想對用戶隱藏它們。 一個例子可能是意外發送到生產環境的測試數據。 此數據不會被刪除,但對所有用戶都是隱藏的。

數據刪除
在極端情況下,您將擁有想要完全刪除的分析數據。 因此,您的數字分析產品應該使您能夠選擇數據的特定部分並將其刪除。

自動化數據測試
另一個關鍵的數據治理工具是自動化測試。 市場上有一些產品可以檢查您的網站或應用程序,以確保分析代碼正常運行。 這些產品還可以配置為像客戶一樣行事,並驗證您的分析跟踪是否按設計工作。 該領域的熱門產品包括 Observepoint 和 QA2L。 解釋這些產品的高級功能需要一整篇博文,因此我鼓勵您檢查它們並考慮將它們添加到您的數字分析堆棧中。
用戶數據隱私合規
數據治理的另一個方面是尊重用戶隱私刪除請求。 GDPR 和 CCPA 等隱私法規為消費者提供了請求刪除收集到的關於他們的數據的能力。 因此,數字分析團隊必須按照當地管理法規的規定對這些請求做出響應並採取行動,這一點至關重要。
概括
如您所見,關於數據治理的內容遠不止這些。 確保您的數字分析數據準確需要大量的主動工作。 不同的數字分析提供商在數據治理方面提供不同程度的幫助。 由於所有分析都依賴於質量數據,因此需要考慮供應商提供的數據治理功能。
