强大的数据治理是实现人工智能 (AI) 治理的基础。开发或部署负责任的 AI 的公司必须从强大的数据治理开始,为当前或即将出台的法规做好准备,并打造可解释、透明且公平的 AI。
对于任何使用数据来推动决策或制定业务战略的组织来说,数据透明度都至关重要。通过使数据及其治理流程易于访问和理解,它有助于建立信任、问责制和可信度。然而,这种透明度可能会受到数据集元数据不完整或不明确的阻碍,通常需要耗时的手动调查才能解决。
为了解决这一问题,IBM 与数据与信任联盟和其他 18 家企业合作,共同创建并测试了数据来源标准,这是第一个跨行业的元数据标准,用于描述数据来源、谱系和适用性。我们的案例研究 “利用数据与信任联盟数据来源标准优化数据治理” 描述我们的测试方法和观察到的结果。
利用数据来源标准提高信任度和数据质量
在测试数据来源标准的过程中,我们发现总体数据清理审核时间有所改善。我们的初步结果还表明,数据来源标准可以提高总体数据质量。
由于这些早期成果的前景看好,我们正在适当地将我们的内部数据标准与数据来源标准进行协调。这种协调有助于我们高效地应对快速增长的数据清除请求量,同时保持我们对负责任的数据获取的高标准。这一点至关重要,因为作为一家运营超过 110 年的公司,我们知道信任是我们长盛不衰的关键原因。
对于 IBM 而言,构建值得信赖的 AI 意味着拥有明确的信任和透明度原则,将这些原则付诸实践,并将道德规范融入 AI 生命周期的方方面面。例如,IBM® Granite™ 基础模型是世界上最透明的模型之一,这在一定程度上要归功于它们遵守通过我们现有的数据清理审查流程实现的数据治理和风险标准。
这些新的跨行业数据来源标准有助于填补关键空白,提高数据来源的透明度,促进所有行业可信且负责任的人工智能的发展。我们欢迎整个数据生态系统采用这些标准,并随时准备支持客户实施自己的数据治理框架。
探索研究 了解 IBM 负责任的 AI
本文是否有帮助?
是的不