近日,网络内容平台Tumblr与WordPress的母公司Automattic正与OpenAI、Midjourney等AI企业洽谈出售其平台上部分内容,用于训练人工智能模型。据消息人士透露,双方即将达成一项内容授权协议。
在相关报导中援引了一份来自Tumblr产品经理的内部文件显示,在整理准备提供给Midjourney和OpenAI的一批平台内容时,出现了一项疏漏:该批次内容中包含了本不应被收集的数据,如公开博客的私密贴文、已删除或暂停账户的贴文、未公开的问题回答、标记为“露骨”或“成熟”的贴文,以及诸如苹果音乐论坛等顶级合作伙伴的相关贴文。
然而,目前尚无确凿证据表明这些包含敏感信息的内容已经被发送出去或是及时得到了拦截。针对这一内部文件泄露事件,Automattic公司在回应中并未直接证实或否认文件的存在,而是重申了Tumblr及WordPress上的隐私设置及其对用户隐私权的保护措施。该公司强调,Tumblr和WordPress.com已经预设了禁止搜索引擎索引内容的选项,并对主要AI平台的爬虫机器人实施了类似的阻挡策略。
值得注意的是,尽管当前法律尚未强制网络爬虫遵循用户的偏好设定,但正在立法进程中的欧洲AI法案(AI Act)有望在未来改变这一现状。Automattic表示将致力于赋予用户更大的隐私控制权限,并计划仅与特定AI公司合作分享那些在Wordpress.com和Tumblr上没有选择退出(opt-out)的内容,不涉及托管在其他平台上的数据,即使这些平台使用了诸如Jetpack或WooCommerce等Automattic提供的插件。该公司承诺,其合作伙伴计划将严格遵守opt-out设定,并会定期更新新增采取相同设定的合作伙伴名单。
0条评论