盖世汽车讯 尽管机器学习应用广泛,例如图像识别、自动驾驶汽车和电子邮件过滤,但人们仍然十分担忧模型预测和精确度的完整性和安全性。为解决上述问题,得克萨斯农工大学(Texas A&M University)计算机科学与工程系教授Yupeng Zhang博士及其团队将名为零知识证明协议的密码算法应用于机器学习领域。

Zhang表示:“这些协议将使机器学习模型的所有者向其他人证明,该模型可以在公共数据集上实现高精度,且不会泄漏有关机器学习模型本身的任何信息。”

前瞻技术,得克萨斯农工大学,新协议,机器学习模型,公共数据集

(图片来源:得克萨斯农工大学)

机器学习是一种人工智能形式,会重点关注使计算机系统能够从数据中学习并随着时间提高准确性的算法。这些算法可构建模型,从而在大量数据中心找到模式,进而无需编程就可做出决策和预测。

过去几年,机器学习模型取得了长足的发展,在数据挖掘和自然语言处理等多个研究领域都取得了重大进展。一些公司和研究小组声称已开发出机器学习模型,可在公共测试数据样本上实现超高准确性。然而对于研究人员而言,再现结果以验证上述说法非常具有挑战性。因为无法确定他们是否能够达到该精度,且很难进行验证。

网络安全和密码学的理论基础是一门科学,能够通过一系列代码保护信息和通信,仅允许发件人和预期的收件人查看和理解信息。该理论基础常用于开发工具,例如数据加密、网络文本、数字签名和哈希函数。除密码学外,还可使用很多方法进行开发,其中一种方法涉及将模型发布给公众。 但是,由于机器学习模型已成为许多公司的关键知识产权,包含了很多业务相关敏感信息,因此无法公布。

Zhang称:“这种方法也存在问题。因为如果公布了该模型,任何人都可以在线使用软件工具进行验证。最近的研究还表明,该模型的信息可用于对其进行重构,并用于他们的所有需求。”

作为密码学的一种应用,零知识证明协议是一种数学方法,允许机器学习模型的所有者提供简洁证明,且无需其他相关信息,以压倒性的可能性证明事件真实性。尽管通用零知识证明方案的使用在过去十年中已有显着改进,但由于生成证明需要花费大量时间,因此构建有效的机器学习预测和准确性测试仍然极具挑战。

Zhang表示:“当把这些通用技术应用于常见的机器学习模型时,我们发现公司可能需要几天或几个月的时间才能向公众证明其模型可以满足要求。”

为了获得更有效的方法,Zhang及其团队设计了几种新的零知识证明技术和优化方法,专门用于将决策树模型(最常用的机器学习算法之一)的计算指令转换为零知识证明陈述。使用该决策树计算方法,他们发现只需不到300秒即可生成证明,从而证明该模型可以在数据集上实现高精度。

由于其开发的新方法仅能解决为决策树模型生成证明的问题,因此研究人员希望扩展其方法,以有效地支持不同类型的机器学习模型。