人工智能（ArtificialIntelligence）在著作权方面的问题_艾萨博睿知识产权

个人资料

微博

正文字体大小：大中小

人工智能（ArtificialIntelligence）在著作权方面的问题

(2023-02-03 13:26:31)

标签：

近期针对Github，Microsoft，OpenAI和Open AI Codex的案值高达90亿美元的集体诉讼，暴露出人工智能方面一直存在的棘手问题：其发展过程有可能侵犯著作权，必须谨慎处理。

该诉讼质疑使用GitHub的存储数据库训练GitHub Copilot的合法性。GitHub Copilot提供的服务是使用人工智能自动完成编程代码工作。起诉方是Matthew Butterick，诉称其11个开源许可证和著作权受到侵犯。

人工智能系统的工作原理是什么？

训练人工智能系统，需要为它们提供庞大的数据库（例如GitHub的数据库），用以开发为该技术提供动力的大型语言模型（large language models，简称LLMs）。

本案涉及的是一个大型开源代码（open-source code）数据库。用以训练人工智能系统的代码，除完全开源的以外，有些本身存在copyleft许可证（viral licenses）或者宽松许可证（permissive licenses）。但不管怎样，都需要尊重他人的著作权。

因此，这可能迫使使用开源代码的用户有义务声明使用代码的行为、指示源作者和遵守许可证条款，除此之外，还可能要求其代码开放许可他人进行后续扩展或修改，或嵌入该代码的代码也必须保持开源，等等。

侵犯著作权的内容

GitHub Copilot的服务不属于上述情况，其不仅违反了此类权利和规范条款，而且加剧了用户之间相互侵犯著作权的情况，因为用户并不知道使用该服务自动完成的代码片段实际是受他人权利保护的。因此，对于用户使用GitHub Copilot提供的代码制作的商业代码，他们甚至并不享有真正的使用权。

谷歌和脸书等其他公司的人工智能系统也基于同样原理开发，技术发展的燃料不仅包括编程代码，还包括受著作权保护的其他作品，如文学作品、新闻、音乐等等。

因此，很多专家质疑使用这类作品支撑人工智能技术发展的合法性，以及应采取哪些措施确保其持续合法。当然，人类的灵感总有源头而非空穴来风，人工智能也是如此，但应当采取什么措施来确保人工智能读取这些来源后，不会生产出侵犯著作权的内容呢？

至少，这一诉讼将迫使使用GitHub Copilot和其他类似工具的公司进行频繁的代码审计，否则，除其他风险外，他们还要冒着所有制作出的内容都无法进行商业利用的巨大风险。

编译：刘丹，艾萨博睿法律顾问

来源：艾萨博睿（ELZABURU）知识产权

联络我们：beijing@elzaburu.es, 3107429780（QQ）, ELZABURU-BJ（微信）

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report