page contents

谷歌YouTube为视频创作者/发布者提供选项 可设置允许AI公司抓取进行训练

目前人工智能的热潮导致大量公司需要通过互联网抓取海量数据进行训练,尽管最终需要使用数据都是文本,但 YouTube 这个视频内容宝库也在抓取范围内。

attachments-2025-01-e5fYJZWX677741507f789.png目前人工智能的热潮导致大量公司需要通过互联网抓取海量数据进行训练,尽管最终需要使用数据都是文本,但 YouTube 这个视频内容宝库也在抓取范围内。

AI 公司可以抓取 YouTube 视频后将其音频抽出并转录为文本内容,这些文本内容也就是成了训练数据集,当然这种操作也是违反 YouTube 使用协议的。

对于未经谷歌授权的情况下擅自抓取 YouTube 视频并进行各种用户都是违反使用协议的,不知道谷歌出于哪方面的考虑,现在为视频创作者 / 内容发布者提供新选项可设置允许 AI 公司抓取数据进行训练。

理论上说这个选项没有太大的实际意义,因为默认情况下不是允许抓取的,而大多数视频创作者 / 内容发布者不太可能会主动去设置允许 AI 公司抓取数据。

不过 AI 抓取控制选项也有限制:

  • 视频的版权所有者主动允许第三方进行抓取训练
  • 视频的隐私设置为公开,即可以公开访问
  • 视频符合 YouTube 的服务条款和社区准则

满足以上条件后创作者可以授权包括 xAI、Apple、Amazon、Anthropic、Meta、Microsoft、Nvidia、OpenAI 等公司使用这些视频训练 AI 模型。

未来这类视频或其他数据可能也会发展成专门的交易,比如 OpenAI 向创作者支付相关费用后,创作者再授权 OpenAI 抓取数据进行训练,或许谷歌现在提供这个功能也是在为未来做准备吧。

更多相关技术内容咨询欢迎前往并持续关注好学星城论坛了解详情。

想高效系统的学习Python编程语言,推荐大家关注一个微信公众号:Python编程学习圈。每天分享行业资讯、技术干货供大家阅读,关注即可免费领取整套Python入门到进阶的学习资料以及教程,感兴趣的小伙伴赶紧行动起来吧。

attachments-2022-05-rLS4AIF8628ee5f3b7e12.jpg

  • 发表于 2025-01-03 09:46
  • 阅读 ( 117 )
  • 分类:行业资讯

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
小柒
小柒

1795 篇文章

作家榜 »

  1. 轩辕小不懂 2403 文章
  2. 小柒 1795 文章
  3. Pack 1135 文章
  4. Nen 576 文章
  5. 王昭君 209 文章
  6. 文双 71 文章
  7. 小威 64 文章
  8. Cara 36 文章