最近两年,人工智能技术发展一日千里,现阶段,AI已不是博人眼球的噱头了,包括文心一言、豆包和通义千问等在内的各种国产AI工具,已经切切实实地成为了大家生活、工作的得力助手。
不过,凡事有利就有弊,目前世界各国有关人工智能的监管法规并不完善,而人工智能需要基于大模型运行,需要收集海量数据用于训练,从而会涉及到非常复杂、敏感的内容所有权、数据安全和隐私问题。
俗话说“萝卜快了不洗泥”,现阶段很多AI公司都非常“不讲武德”,在未经内容所有者授权的情况下,直接通过各种渠道收集各种数据(包含图片、文字和音频等内容)用于训练AI模型,引发了广泛的争议和多种维权诉讼,请参阅上图。
看到这里有些朋友可能会认为:AI公司只会收集那些名人的作品或者在网络上公开发布的作品,和广大普通人没有什么关系,这种观点是错误的。
以下小编举几个例子:
比如说你用文字和图片编辑软件创作的作品,即使是保存在本地计算机上,对应的软件也是有访问权限的,理论上可以自动上传至厂商的服务器,厂商可以用来训练AI模型。
另外,现在网盘盛行,很多用户会把自己的文档或者作品存储到网盘上,理论上这些内容对网盘运营商来说是透明的,访问这些数据用于AI训练在技术上毫无难度。
因此,实际情况并没有大家想的那么乐观,即使是对广大普通人来说,内容所有权、安全和隐私保护问题也非常严峻。
言归正传,最近一段时间,有网络知名科技博主爆料,声称微软会抓取用户的Office文档用于训练其AI模型,请参阅上图。这个传闻很“炸裂”,立即在用户中引发了一定程度的恐慌。
该博主声称,虽然用户可以选择拒绝,但是相关拒绝选项非常多,操作起来非常复杂,故意使用户难以退出,该博主还列举了截图证据,请参阅下图。
美国时间11月26日,微软通过其Microsoft 365 X平台社交账号正式回应了该传闻,内容非常简短,全文如下:
“在Microsoft 365应用中,我们不使用任何来源于客户的数据用于训练LLM(大语言模型)。相关设置仅针对、适用于某些软件中必须启用互联网访问的功能,例如(多人)共同创作文档(,而不是针对训练AI模型)。”
有些朋友可能不理解“必须启用互联网访问的功能”是指什么?其实很好理解,除了微软方面明确说明的(多人)共同创作文档之外,还包括云字体、模板、日历上的天气、共同创作等等,这些功能必须联网才能正常使用。
也就是说,该博主所提出的指控是不成立的,微软不会将用户的Office文档用于AI模型训练,考虑到微软一向良好的信誉,它的承诺是可信的。
所以,对于这个问题大家不用杯弓蛇影、草木皆兵,完全可以放心,事实上,之前国产文字编辑软件WPS Office也经历过类似的事件,官方后来也出来辟谣。
小编将在第一时间分享更多相关最新动态和爆料,敬请关注。