下一代反腐败工具:大数据、开放数据和人工智能
引言:腐败作为一个普遍存在的全球问题,其超越了国界和政治体系,影响着治理的各个方面。有效的反腐败措施是全球普遍需要的。随着越来越多的政府将反腐败措施运作数字化,开发下一代反腐败工具的机会不断增加。具体来说,数字化是利用大数据、开放数据和人工智能防止腐败的技术基础。根据国际货币基金组织估计,每年大约有1万亿美元的全球政府收入因腐败而损失。腐败是一种复杂而多样的现象,基于人工智能等技术的反腐败工具江有助于大幅减少因腐败而损失的公共资金。
观点
1.使用开放数据进行反腐败
除了运作良好的制裁、起诉制度和强大的新闻自由,政府透明度对减少腐败也起着至关重要的功能,其中开放数据已成为实现透明度的最重要方法之一。一个国家的腐败程度与可获得的开放数据量之间呈现负相关的联系。因此,近年来旨在帮助政府便利、高效发布数据的指南和标准数量大幅增加。
2.在反腐败中起作用的数据类型
(1)采购数据(Procurement Data)
采购数据具有可访问性和结构化格式。揭示腐败的采购数据包括夸大的项目成本、将合同授予同为官员的同事等等。采购数据的实际价值在于,它能够为反腐当局提供明确的审计线索。
(2)受益所有权数据(Beneficial Ownership Data)
受益所有权数据可以揭示涉及腐败的公司的真正所有者。这些数据对于追踪具有复杂公司结构的腐败资金流动至关重要。收益所有权数据的理论和实践价值在于,它有可能提高商业交易的透明度和问责制。
(3)政府支付数据(Government Payments Data)
由于安全、法律或政治原因,反腐败当局可能还能获得更多无法公开获取的数据,例如政府支付数据。政府支付数据的稀缺性和潜力可以为公共资金的使用方式提供更多拓展的可能性,例如政府支出的详细信息能够揭示其中的违规行为和财政漏洞等。
3.实用价值最高的数据:公共采购数据
公共采购数据、受益所有权数据和政府支付数据中,公开采购数据可能是目前最容易获取且具有较高实用价值的数据。通过系统地公布合同金额、奖项和投标人数量等信息,可以打击那些试图进行腐败活动的人。
(1)开放式承包数据标准(OCDS)
OCDS作为一个结构化框架,用于指导政府在合同过程的所有阶段发布采购数据,包括规划、招标、授予、合同最终确定和实施五个阶段。通过公开采购数据,更容易发现不公平的合同授予或成本膨胀等违规行为。这种透明度对腐败行为构成了威慑,为采购过程中的腐败提供了一个切实可行的解决办法。
(2)乌克兰:ProZorro电子采购平台
所有与供应商、合同价值、招标通知和结果相关的数据都可以通过该在线控制台访问。通过ProZorro,乌克兰在透明国际腐败印象指数排名中上升了10位。
(3)欧洲联盟:数字惠斯特(Digiwhist)
Digiwhist旨在对大型开放数据集进行分析,以确定欧洲联盟招标中可能存在的腐败情况,从而发挥机器学习在反腐败中的作用。该项目的一个关键组成部分是opentender.eu平台,它允许用户检查数百万欧盟的投标信息。该平台还创新地使用数据爬行算法来构建和分析投标信息,增强了监测和评估公共合同完整性的能力。
4.人工智能:反腐败的下一步计划
(1)理论基础
人工智能在反腐败应用方面的理论潜力在于,它能够在大型数据集中检测出腐败活动的复杂模式和关系。机器学习是人工智能的一个子集,它可以识别这些模式,而不需要为每种可能的情况进行显式编程。
(2)数据收集和标签
人工智能在反腐败工作中的实际应用需要广泛和高质量的数据。反腐败算法的运行需要从收集和清理大量数据开始,包括采购数据、公司所有权数据和注册信息数据等。其中一个关键的步骤是将输出,如合同授予,标记为腐败或非腐败,这也为机器学习算法提供了训练数据。
(3)机器学习算法的选择和训练
机器学习可以确定多个事务状态(例如,输入,包括向离岸注册的公司支付的款项,或以不寻常的账户代码向个人支付的类似款项),满足程序员对腐败定义的输出之间关系的复杂函数。
(4)实施和预测性监测
经过培训的人工智能系统可以作为一种腐败预测或监控工具,即标记符合已学习到的腐败模式的交易或合同,以供人类的进一步调查。
总结
正如ProZorro、Digiwhist所证明的那样,在大数据和开放数据发展的基础上,使用机器学习工具来打击腐败不仅是可行的,而且很有可能在未来几年在多个国家进入常规使用。未来对数据、人工智能和反腐败的进一步研究应该超越哪些数据集和算法最有用的问题,更应回答是权威、沟通、关系和权力的问题。