目前人工智能的热潮导致大量公司需要通过互联网抓取海量数据进行训练,尽管最终需要使用数据都是文本,但 YouTube 这个视频内容宝库也在抓取范围内。
AI 公司可以抓取 YouTube 视频后将其音频抽出并转录为文本内容,这些文本内容也就是成了训练数据集,当然这种操作也是违反 YouTube 使用协议的。
对于未经谷歌授权的情况下擅自抓取 YouTube 视频并进行各种用户都是违反使用协议的,不知道谷歌出于哪方面的考虑,现在为视频创作者 / 内容发布者提供新选项可设置允许 AI 公司抓取数据进行训练。
理论上说这个选项没有太大的实际意义,因为默认情况下不是允许抓取的,而大多数视频创作者 / 内容发布者不太可能会主动去设置允许 AI 公司抓取数据。
不过 AI 抓取控制选项也有限制:
满足以上条件后创作者可以授权包括 xAI、Apple、Amazon、Anthropic、Meta、Microsoft、Nvidia、OpenAI 等公司使用这些视频训练 AI 模型。
未来这类视频或其他数据可能也会发展成专门的交易,比如 OpenAI 向创作者支付相关费用后,创作者再授权 OpenAI 抓取数据进行训练,或许谷歌现在提供这个功能也是在为未来做准备吧。
更多相关技术内容咨询欢迎前往并持续关注好学星城论坛了解详情。
想高效系统的学习Python编程语言,推荐大家关注一个微信公众号:Python编程学习圈。每天分享行业资讯、技术干货供大家阅读,关注即可免费领取整套Python入门到进阶的学习资料以及教程,感兴趣的小伙伴赶紧行动起来吧。
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!