数据科学可以加速您的社会影响工作的 9 种方式
已发表: 2022-03-16对于在慈善领域工作的人来说,数据科学可能是一个难以处理的话题。 你从哪里开始? 哪些数据很重要? 它如何融入您的社区工作?
在深入了解杂草之前,有必要退一步了解什么是数据科学以及它可以使您做什么。
社会影响的数据科学是关于构建非结构化内容以帮助做出数据驱动的决策。 这不是要把你淹没在你不需要的信息中。 这是关于战略性地使用数据来产生更深层次的影响。
我们最近与 Chantal Forster 和资助者技术协会合作举办了一次网络研讨会。 三位在社会影响领域工作的数据科学家——Wellcome Trust 的 Antonio Campello、Impact Genome Project 的 Jonathan Hertel 和 Submittable 的 Andrew Spott——分享了数据科学和人工智能如何帮助他们完成任务。
重点介绍本次活动的见解和示例,我们列出了数据科学可以帮助您的组织做得更多的九种方式。
无论您拥有强大的数据科学背景,还是刚开始对数据感到好奇,我们都能为每个人提供一些有用的见解。

数据科学的一些快速定义
在开始之前,让我们介绍一些术语。 对于刚接触数据科学的人来说,有时语言本身可能会让人不知所措,所以这里有一个快速入门。
- 数据分析是分析原始数据以发现趋势和回答问题的过程。
- 大多数组织都进行某种形式的数据分析。 例如,您可能会问,我们的受助人住在哪里? 跟踪地理数据以确定您提供资金的主要州或国家是工作中的数据分析。
- 机器学习是利用算法使计算机能够通过经验和数据自动改进的过程。
- 图像识别是机器学习的常见应用; 如果您已经看到您的手机或计算机能够自行识别照片中的人物,那么您已经看到了机器学习的实际应用。
- 数据科学是将机器学习算法应用于各种数据源(即数字、文本、图像、视频、音频等),以生成可以执行通常需要人类智能的任务的人工智能系统。
- 即使你没有在数据科学领域工作过,你也可能从中受益。 数据科学在各个部门(公共和私营部门)都得到了利用,包括医疗保健、交通运输、公共安全等。 例如,数据科学现在用于帮助分析医学成像和识别恶性肿瘤。
- 自然语言处理是人工智能的一个分支,专注于赋予计算机以与人类相同的方式理解和响应文本和口语的能力。
- 想想 Siri 或 Alexa。
- 分类法是用于对相似项目进行分组的分类或分类系统。
- 在慈善事业中,非营利组织可能按规模、使命、项目设计、位置或其他名称进行分组。
了解衡量影响力的最佳问题
观看我们的网络研讨会,了解如何让您的报告植根于信任。
数据科学如何增强您的社会影响力工作
1. 更细致地了解您的投资组合
对于资助者,利用数据和社会影响分析可以帮助您更清楚地了解您资助的对象和内容以及资助的结果。 您可以揭示资源分配方式的趋势、重叠和差距。
为什么这很重要?
更详细地了解您的程序可以让您识别和根除偏见并找到错失的机会。 此外,它还可以为您提供扩展工作和构建有效的新计划所需的见解。
您可能已经拥有大量所需的数据。 但是,如果这些数据没有组织和可访问,那并没有多大意义。 很难从一大堆非结构化数据中看到模式或得出结论。
例如,Wellcome Trust(其项目主要关注健康)分析了其超过 100,000 笔赠款的投资组合。 使用自然语言处理,他们将 30,000 个疾病标签应用到他们的投资组合中。 此标记是为分析和分割准备数据的重要步骤。 它允许拨款经理轻松搜索过去的拨款计划。 假设该组织正在考虑资助围绕特定疾病的研究,他们现在可以回顾他们以前是否资助过该重点领域以及该工作的成果。
即使您不是在处理 100,000 笔拨款的投资组合,对您的项目有更细致的了解也很重要。
自动标记是开始组织您拥有的数据的一种方式。 例如,Submittable 启用自动标记,以便在收到授权申请时,您可以根据特定问题的答案应用标记。 这使您能够跟踪、分类和分析对您的团队很重要的数据,无论是人口统计、地理、任务重点、组织规模还是其他方面。
您可以根据这些标签对申请人和受助人进行排序,以帮助您分析如何分配资源以及是否需要改变策略。
2. 创建更清晰的标准和分类法
在社会影响的世界里,我们经常谈论同样的事情,但使用不同的语言。 这可能使我们很难看到我们的工作与其他人的工作在哪里重叠,并在类似的程序之间进行比较。
例如,当资助者、非营利组织和研究人员都使用不同的语言来讨论相同的问题时,很难在他们的工作之间建立联系。

这种脱节阻碍了每个人开发有效解决方案和做出明智预测的能力。 把它想象成房子的地基。 如果我们在这个基础级别上没有一个强大的结构,那么建立在它之上的一切都将是不稳定的。
Mission Measurement 中的 Impact Genome Project 正在努力将这些标准化系统化。 例如,他们创建了一个影响注册表,这是一个可搜索的数据库,其中包含美国和加拿大超过 200 万个非营利项目的影响和受益人数据。 这种工具可以帮助巩固这一基础,使慈善部门可以更有效地建立数据驱动的解决方案。
3. 更清楚地跟踪产出和结果
慈善工作就是影响力。 你运行的程序是否创造了你想要的结果? 不管你的预算是多少,如果你不知道这一点,你就不会知道你的计划是否正在产生有意义的改变。
数据分析可以帮助您更准确地跟踪您的工作效果。 您可以在您为项目投入的资源、项目创造的短期产出和取得的长期成果之间建立联系。
例如,威康信托基金资助了大量的研究和临床试验。 他们的团队想要跟踪他们的资助的学术成果。 换句话说,他们想知道有多少学术文章来自他们资助的项目。
使用数据科学技术,Wellcome Trust 团队能够创建一个自动管道来汇总与他们资助的项目相关的研究文章。 然后,他们能够将这项工作与特定的赠款联系起来,以确定哪些项目的学术产出数量最多。
考虑您的计划以及对您的组织最重要的输出和结果。 您是否获得了有关它们如何连接的清晰、详细的数据? 您知道哪些程序始终能产生最佳结果吗? 利用数据科学造福社会可以帮助您更清楚地了解这一切是如何结合在一起的。

4. 寻找资金缺口
分析数据可以帮助资助者发现他们的资金缺口。 您是否为某些人群提供了资金不足? 您是否忽略了工作的某些组成部分? 挖掘数据可以帮助您找到做更多事情的机会。

资助者有时很容易专注于社区工作中更个人化或更情绪化的方面。 为有需要的人提供帮助在个人层面上感觉很好。 然而,这种善解人意的反应有时会扭曲组织如何构建他们的项目。 社会影响工作依赖于强大的基础设施。 支持这些不太令人兴奋但必不可少的框架通常可以让组织做得更多。
使用数据科学,您可以确定投资组合或整个慈善部门的资金缺口。 预防和基础设施往往没有得到应有的重视。
例如,Wellcome Trust 使用数据科学来分析他们的投资组合,并确定他们在项目中资助技术的频率。 利用这些见解,他们改变了优先事项,为软件基础设施提供更多资助,这是许多研究人员的关键工具。
5. 建立新的联系
很容易忽略主题和身份重叠和交叉的所有方式。 但是这些见解可以对您设计程序的方式产生巨大影响。
使用数据科学,资助者可以发现连接不同主题或项目的机会。 使用数据可视化工具,您可以查看已经存在连接的位置,并且可以找到应该存在但尚未存在连接的位置。
如果我们不了解这些交叉点,就很难为大问题找到有效的解决方案。 以气候变化为例。 气候变化的影响以复杂的方式与贫困和种族不公正的影响重叠和交叉。 如果您的组织寻求解决气候变化而不考虑这一点,您的计划可能会产生有限的影响。
想看看这是什么样子吗? Wellcome Trust 与他们的神经科学团队进行了一个主题建模项目,以提取数据驱动的主题以获得研究资金。 使用数据科学分析文本文档,他们创建了一张地图,以便他们可以可视化主题之间的联系和差距。
6. 将您的计划置于更广阔的领域
许多组织和个人都在努力解决同样的问题。 联合国可持续发展目标等框架可以帮助您从高层次了解您的工作如何融入更广泛的变革努力。 但它不会为您提供所需的详细信息。
您想清楚地了解您的程序如何为更大范围的进步做出贡献。 你在帮忙搬针吗? 您的计划是否复制了其他努力,或者您是否正在履行一个独特的角色?
数据科学可以帮助您获得这些答案,并让您在分配资源时更具战略性。
例如,Wellcome Trust 结合使用 API 搜索、网络抓取和自然语言处理来评估他们的工作如何适应更广泛的抗击 COVID 的努力。 为了评估他们资助的研究的有效性,他们测量了该研究在政府机构的科学证据中被提及并在 COVID 相关的一般文献中得到承认的频率。 这让他们清楚地知道他们支持的项目是否在更广泛的努力中发挥了作用。
获得正确的工具来支持您的工作
了解 Submittable 如何帮助您更快地行动并产生更深远的影响。
7. 评估计划的有效性和成本
作为资助者的一部分是平衡计划成本和有效性。 您想知道您的资源正在做出您希望看到的更改,而且他们正在尽可能高效地进行更改。
赌注很高。 我们不是在谈论一些底线或股东股息。 您的计划成本通常决定了您可以支持多少人或社区组织。
数据科学使资助者能够更深入地分析产出和结果是如何联系起来的,以及它们如何与成本进行比较。 如果您没有这些信息,就不可能知道您是否在进行明智的投资。

例如,Impact Genome 专注于财务健康。 他们使用数据科学来衡量项目的有效性以及项目成本与其产生的结果的比较。 他们使用机器学习评估了所有美国非营利组织的 990 条税务记录。 从这里,他们可以将预算规模与所取得的成果进行比较。
当然,有很多不同的策略和计划设计来解决财务健康问题。 例如,您可以帮助某人支付紧急费用或提供财务咨询。 这些可能有不同的成本和结果。
Impact Genome 的团队进行了元分析,以分解代表财务状况的结果,然后列出相关成本。
想想这些信息对从事财务健康工作的非营利组织有多大帮助。 他们可以将他们的成本和结果与这些平均值进行比较。 他们是否花费更多而没有取得更好的结果? 还是他们与其他非营利组织相提并论? 这是他们塑造未来计划的重要信息。
8.自动化你的审查过程
对于希望审查大量申请的资助者来说,数据科学可以提供帮助。 为了干净的数据(数据经过处理和格式化以消除不准确和不一致),一些组织用多项选择代替了开放式回答问题。 这对人们来说可能更容易审查,但是当你剥夺了申请人按照自己的条件解释他们的工作的能力时,就会失去很多。
通过利用机器学习,您可以保留这些开放式回答问题,并减少手动审查应用程序的时间。 您还可以获得更少的偏见和更一致的结果。 这是如何运作的?
Submittable 的 Accelerated Review 功能将数据科学付诸实践。 使用机器学习,Submittable 根据您的团队执行的评论构建模型。 简而言之,您正在训练计算机以与您的团队相同的方式帮助审查应用程序。
这个过程是什么样的?
您的团队审查了大约 200 个应用程序的样本。 该模型围绕该过程构建,了解您的审阅者如何对申请人进行评分和评分。 在完全应用模型之前,会在小批量应用程序上对其准确性进行评估。 如有必要,可以重新训练模型。
以这种方式自动化您的审核过程意味着您可以以惊人的速度和惊人的准确性审核数千甚至数百万个应用程序。 这大大减少了疲劳和人为错误。 简而言之,通过利用机器学习来帮助突出关键信息,自动化审查使您的团队能够以更少的员工完成更多的工作。
9. 减轻受助者的负担
随着人们越来越意识到受助人经常承担的管理负担,数据科学可以成为一个令人难以置信的工具,为资助者提供减轻负担的机会。
例如,资助者技术协会最近使用机器学习和相似性分析来确定随机资助表与任何其他资助表的相似度为 39%。
为什么这很重要?
这意味着许多组织在申请不同的赠款时,经常会一遍又一遍地重做相同的工作。 如果资助者聚集在一起并标准化他们的拨款申请部分以确保每个人都以相同的格式要求相同的信息怎么办? 想想这将为受助者节省多少时间。 39%!
将洞察转化为行动
数据科学是关于使用技术从你所拥有的信息中提供洞察力和结构。 但创造变革需要人们将这些见解转化为行动。
您可能没有资源或能力来建立自己的内部数据科学团队。 没关系——Submittable 已经涵盖了。 作为一个旨在帮助各种规模的组织的社会影响平台,我们可以以极少的成本提供数据科学团队的所有优势。 今天了解更多。
