昕搜 7 月 4 日消息,搜索引擎巨头谷歌近期更新了其隐私政策,将使用互联网上的公开信息训练 AI 模型。
政策中提到,谷歌现可通过收集网络上的公开信息或来自其他公共来源的信息,以帮助训练谷歌的 AI 模型并打造实用功能,如谷歌翻译、Bard(昕搜注:谷歌旗下的聊天机器人,与 ChatGPT、微软 Bing Chat 类似)和谷歌云 AI。此外,谷歌将原本的“语言模型”更改为“AI 模型”。
这意味着谷歌将能够使用互联网上公开可用的信息来构建更完整的自家 AI 产品,而非以往的单一功能。
不过截至目前,中文版的隐私政策规定暂未作出相应调整。
外媒 Engadget 对此评论称,“谷歌将会让人们明确知道,他们在网上公开发布的任何信息都可以用来训练 Bard,以及谷歌开发的任何其他生成式 AI 产品。”
一直以来,包括 ChatGPT 在内的 AIGC 系统都会根据互联网上的数据来训练内容,因此受到大量版权、隐私方面的争议。
昕搜此前报道,两名作家在美国旧金山联邦法院起诉 OpenAI,他们认为 OpenAI 滥用其作品,用作品训练 ChatGPT。诉状估计,OpenAI 的训练数据包含了至少 30 万本图书,当中有许多是没有获得许可、非法获取的有版权图书。
相关阅读:
《版权问题难解,OpenAI 被控非法使用图书数据训练 AI 系统》
《OpenAI 确认通过 API 收集的数据不会用于训练 ChatGPT》
《谷歌澄清:训练聊天机器人 Bard 的数据集并不包含 Gmail 数据》 |