數據科學可以加速您的社會影響工作的 9 種方式
已發表: 2022-03-16對於在慈善領域工作的人來說,數據科學可能是一個難以處理的話題。 你從哪裡開始? 哪些數據很重要? 它如何融入您的社區工作?
在深入了解雜草之前,有必要退一步了解什麼是數據科學以及它可以使您做什麼。
社會影響的數據科學是關於構建非結構化內容以幫助做出數據驅動的決策。 這不是要把你淹沒在你不需要的信息中。 這是關於戰略性地使用數據來產生更深層次的影響。
我們最近與 Chantal Forster 和資助者技術協會合作舉辦了一次網絡研討會。 三位在社會影響領域工作的數據科學家——Wellcome Trust 的 Antonio Campello、Impact Genome Project 的 Jonathan Hertel 和 Submittable 的 Andrew Spott——分享了數據科學和人工智能如何幫助他們完成任務。
重點介紹本次活動的見解和示例,我們列出了數據科學可以幫助您的組織做得更多的九種方式。
無論您擁有強大的數據科學背景,還是剛開始對數據感到好奇,我們都能為每個人提供一些有用的見解。

數據科學的一些快速定義
在開始之前,讓我們介紹一些術語。 對於剛接觸數據科學的人來說,有時語言本身可能會讓人不知所措,所以這裡有一個快速入門。
- 數據分析是分析原始數據以發現趨勢和回答問題的過程。
- 大多數組織都進行某種形式的數據分析。 例如,您可能會問,我們的受助人住在哪裡? 跟踪地理數據以確定您提供資金的主要州或國家是工作中的數據分析。
- 機器學習是利用算法使計算機能夠通過經驗和數據自動改進的過程。
- 圖像識別是機器學習的常見應用; 如果您已經看到您的手機或計算機能夠自行識別照片中的人物,那麼您已經看到了機器學習的實際應用。
- 數據科學是將機器學習算法應用於各種數據源(即數字、文本、圖像、視頻、音頻等),以生成可以執行通常需要人類智能的任務的人工智能係統。
- 即使你沒有在數據科學領域工作過,你也可能從中受益。 數據科學在各個部門(公共和私營部門)都得到了利用,包括醫療保健、交通運輸、公共安全等。 例如,數據科學現在用於幫助分析醫學成像和識別惡性腫瘤。
- 自然語言處理是人工智能的一個分支,專注於賦予計算機以與人類相同的方式理解和響應文本和口語的能力。
- 想想 Siri 或 Alexa。
- 分類法是用於對相似項目進行分組的分類或分類系統。
- 在慈善事業中,非營利組織可能按規模、使命、項目設計、位置或其他名稱進行分組。
了解衡量影響力的最佳問題
觀看我們的網絡研討會,了解如何讓您的報告植根於信任。
數據科學如何增強您的社會影響力工作
1. 更細緻地了解您的投資組合
對於資助者,利用數據和社會影響分析可以幫助您更清楚地了解您資助的對象和內容以及資助的結果。 您可以揭示資源分配方式的趨勢、重疊和差距。
為什麼這很重要?
更詳細地了解您的程序可以讓您識別和根除偏見並找到錯失的機會。 此外,它還可以為您提供擴展工作和構建有效的新計劃所需的見解。
您可能已經擁有大量所需的數據。 但是,如果這些數據沒有組織和可訪問,那並沒有多大意義。 很難從一大堆非結構化數據中看到模式或得出結論。
例如,Wellcome Trust(其項目主要關注健康)分析了其超過 100,000 筆贈款的投資組合。 使用自然語言處理,他們將 30,000 個疾病標籤應用到他們的投資組合中。 此標記是為分析和分割準備數據的重要步驟。 它允許撥款經理輕鬆搜索過去的撥款計劃。 假設該組織正在考慮資助圍繞特定疾病的研究,他們現在可以回顧他們以前是否資助過該重點領域以及該工作的成果。
即使您不是在處理 100,000 筆撥款的投資組合,對您的項目有更細緻的了解也很重要。
自動標記是開始組織您擁有的數據的一種方式。 例如,Submittable 啟用自動標記,以便在收到授權申請時,您可以根據特定問題的答案應用標記。 這使您能夠跟踪、分類和分析對您的團隊很重要的數據,無論是人口統計、地理、任務重點、組織規模還是其他方面。
您可以根據這些標籤對申請人和受助人進行排序,以幫助您分析如何分配資源以及是否需要改變策略。
2. 創建更清晰的標準和分類法
在社會影響的世界裡,我們經常談論同樣的事情,但使用不同的語言。 這可能使我們很難看到我們的工作與其他人的工作在哪裡重疊,並在類似的程序之間進行比較。
例如,當資助者、非營利組織和研究人員都使用不同的語言來討論相同的問題時,很難在他們的工作之間建立聯繫。

這種脫節阻礙了每個人開發有效解決方案和做出明智預測的能力。 把它想像成房子的地基。 如果我們在這個基礎級別上沒有一個強大的結構,那麼建立在它之上的一切都將是不穩定的。
Mission Measurement 中的 Impact Genome Project 正在努力將這些標準化系統化。 例如,他們創建了一個影響註冊表,這是一個可搜索的數據庫,其中包含美國和加拿大超過 200 萬個非營利項目的影響和受益人數據。 這種工具可以幫助鞏固這一基礎,使慈善部門可以更有效地建立數據驅動的解決方案。
3. 更清楚地跟踪產出和結果
慈善工作就是影響力。 你運行的程序是否創造了你想要的結果? 不管你的預算是多少,如果你不知道這一點,你就不會知道你的計劃是否正在產生有意義的改變。
數據分析可以幫助您更準確地跟踪您的工作效果。 您可以在您為項目投入的資源、項目創造的短期產出和取得的長期成果之間建立聯繫。
例如,威康信託基金資助了大量的研究和臨床試驗。 他們的團隊想要跟踪他們的資助的學術成果。 換句話說,他們想知道有多少學術文章來自他們資助的項目。
使用數據科學技術,Wellcome Trust 團隊能夠創建一個自動管道來匯總與他們資助的項目相關的研究文章。 然後,他們能夠將這項工作與特定的贈款聯繫起來,以確定哪些項目的學術產出數量最多。
考慮您的計劃以及對您的組織最重要的輸出和結果。 您是否獲得了有關它們如何連接的清晰、詳細的數據? 您知道哪些程序始終能產生最佳結果嗎? 利用數據科學造福社會可以幫助您更清楚地了解這一切是如何結合在一起的。

4. 尋找資金缺口
分析數據可以幫助資助者發現他們的資金缺口。 您是否為某些人群提供了資金不足? 您是否忽略了工作的某些組成部分? 挖掘數據可以幫助您找到做更多事情的機會。

資助者有時很容易專注於社區工作中更個人化或更情緒化的方面。 為有需要的人提供幫助在個人層面上感覺很好。 然而,這種善解人意的反應有時會扭曲組織如何構建他們的項目。 社會影響工作依賴於強大的基礎設施。 支持這些不太令人興奮但必不可少的框架通常可以讓組織做得更多。
使用數據科學,您可以確定投資組合或整個慈善部門的資金缺口。 預防和基礎設施往往沒有得到應有的重視。
例如,Wellcome Trust 使用數據科學來分析他們的投資組合,並確定他們在項目中資助技術的頻率。 利用這些見解,他們改變了優先事項,為軟件基礎設施提供更多資助,這是許多研究人員的關鍵工具。
5. 建立新的聯繫
很容易忽略主題和身份重疊和交叉的所有方式。 但是這些見解可以對您設計程序的方式產生巨大影響。
使用數據科學,資助者可以發現連接不同主題或項目的機會。 使用數據可視化工具,您可以查看已經存在連接的位置,並且可以找到應該存在但尚未存在連接的位置。
如果我們不了解這些交叉點,就很難為大問題找到有效的解決方案。 以氣候變化為例。 氣候變化的影響以復雜的方式與貧困和種族不公正的影響重疊和交叉。 如果您的組織尋求解決氣候變化而不考慮這一點,您的計劃可能會產生有限的影響。
想看看這是什麼樣子嗎? Wellcome Trust 與他們的神經科學團隊進行了一個主題建模項目,以提取數據驅動的主題以獲得研究資金。 使用數據科學分析文本文檔,他們創建了一張地圖,以便他們可以可視化主題之間的聯繫和差距。
6. 將您的計劃置於更廣闊的領域
許多組織和個人都在努力解決同樣的問題。 聯合國可持續發展目標等框架可以幫助您從高層次了解您的工作如何融入更廣泛的變革努力。 但它不會為您提供所需的詳細信息。
您想清楚地了解您的程序如何為更大範圍的進步做出貢獻。 你在幫忙搬針嗎? 您的計劃是否複製了其他努力,或者您是否正在履行一個獨特的角色?
數據科學可以幫助您獲得這些答案,並讓您在分配資源時更具戰略性。
例如,Wellcome Trust 結合使用 API 搜索、網絡抓取和自然語言處理來評估他們的工作如何適應更廣泛的抗擊 COVID 的努力。 為了評估他們資助的研究的有效性,他們測量了該研究在政府機構的科學證據中被提及並在 COVID 相關的一般文獻中得到承認的頻率。 這讓他們清楚地知道他們支持的項目是否在更廣泛的努力中發揮了作用。
獲得正確的工具來支持您的工作
了解 Submittable 如何幫助您更快地行動並產生更深遠的影響。
7. 評估計劃的有效性和成本
作為資助者的一部分是平衡計劃成本和有效性。 您想知道您的資源正在做出您希望看到的更改,而且他們正在盡可能高效地進行更改。
賭注很高。 我們不是在談論一些底線或股東股息。 您的計劃成本通常決定了您可以支持多少人或社區組織。
數據科學使資助者能夠更深入地分析產出和結果是如何联繫起來的,以及它們如何與成本進行比較。 如果您沒有這些信息,就不可能知道您是否在進行明智的投資。

例如,Impact Genome 專注於財務健康。 他們使用數據科學來衡量項目的有效性以及項目成本與其產生的結果的比較。 他們使用機器學習評估了所有美國非營利組織的 990 條稅務記錄。 從這裡,他們可以將預算規模與所取得的成果進行比較。
當然,有很多不同的策略和計劃設計來解決財務健康問題。 例如,您可以幫助某人支付緊急費用或提供財務諮詢。 這些可能有不同的成本和結果。
Impact Genome 的團隊進行了元分析,以分解代表財務狀況的結果,然後列出相關成本。
想想這些信息對從事財務健康工作的非營利組織有多大幫助。 他們可以將他們的成本和結果與這些平均值進行比較。 他們是否花費更多而沒有取得更好的結果? 還是他們與其他非營利組織相提並論? 這是他們塑造未來計劃的重要信息。
8.自動化你的審查過程
對於希望審查大量申請的資助者來說,數據科學可以提供幫助。 為了乾淨的數據(數據經過處理和格式化以消除不准確和不一致),一些組織用多項選擇代替了開放式回答問題。 這對人們來說可能更容易審查,但是當你剝奪了申請人按照自己的條件解釋他們的工作的能力時,就會失去很多。
通過利用機器學習,您可以保留這些開放式回答問題,並減少手動審查應用程序的時間。 您還可以獲得更少的偏見和更一致的結果。 這是如何運作的?
Submittable 的 Accelerated Review 功能將數據科學付諸實踐。 使用機器學習,Submittable 根據您的團隊執行的評論構建模型。 簡而言之,您正在訓練計算機以與您的團隊相同的方式幫助審查應用程序。
這個過程是什麼樣的?
您的團隊審查了大約 200 個應用程序的樣本。 該模型圍繞該過程構建,了解您的審閱者如何對申請人進行評分和評分。 在完全應用模型之前,會在小批量應用程序上對其準確性進行評估。 如有必要,可以重新訓練模型。
以這種方式自動化您的審核過程意味著您可以以驚人的速度和驚人的準確性審核數千甚至數百萬個應用程序。 這大大減少了疲勞和人為錯誤。 簡而言之,通過利用機器學習來幫助突出關鍵信息,自動化審查使您的團隊能夠以更少的員工完成更多的工作。
9. 減輕受助者的負擔
隨著人們越來越意識到受助人經常承擔的管理負擔,數據科學可以成為一個令人難以置信的工具,為資助者提供減輕負擔的機會。
例如,資助者技術協會最近使用機器學習和相似性分析來確定隨機資助表與任何其他資助表的相似度為 39%。
為什麼這很重要?
這意味著許多組織在申請不同的贈款時,經常會一遍又一遍地重做相同的工作。 如果資助者聚集在一起並標準化他們的撥款申請部分以確保每個人都以相同的格式要求相同的信息怎麼辦? 想想這將為受助者節省多少時間。 39%!
將洞察轉化為行動
數據科學是關於使用技術從你所擁有的信息中提供洞察力和結構。 但創造變革需要人們將這些見解轉化為行動。
您可能沒有資源或能力來建立自己的內部數據科學團隊。 沒關係——Submittable 已經涵蓋了。 作為一個旨在幫助各種規模的組織的社會影響平台,我們可以以極少的成本提供數據科學團隊的所有優勢。 今天了解更多。
