APP下载
APP二维码
联系我们
APP二维码
返回

DeepSeek与生成式AI的崛起:行业影响、个人生活变革与法律纠纷解析

来源:网络   作者:   日期:2025-02-11 09:06:07  

但是,随着生成性AI如火如荼,也将发生许多法律纠纷。例如,在过去两年中,许多著名的国际生成AI公司经常遇到版权纠纷。从这些争端和法律判断中,我们不仅可以理解生成AI对法律的影响,而且还可以分析成熟市场经济中法院对生成AI争议的判断思想和态度。这些对于我国AI行业的发展具有很大的参考意义。

生成式人工智能公司官司不断 技术创新与法律如何再平衡_生成式人工智能公司官司不断 技术创新与法律如何再平衡_

在生成AI的版权纠纷中,原告的主张和被告的辩护

如果用专业语言描述,生成AI的工作过程基本包括三个步骤,即培训数据,交互式数据和生成数据。

如果以流行语言描述,上述三个步骤大致类似:生成AI通过输入大量数据来训练这些数据,并将受过训练的数据存储在其自己的“数据仓库”中。

然后,生成的AI面对各种用户并与客户进行沟通。当用户提出问题时,生成型AI将问题与其自己的“数据仓库”中的数据进行了比较,并通过模型的操作向用户输出答案。

答案可以以各种形式表达。例如,有些答案是音乐,有些答案是图片,有些答案是文字。

生成AI操作过程的所有三个步骤都可能导致版权纠纷。在这些版权纠纷中,原告基本上提起了诉讼,援引了传统版权侵权的基本法律要求。也就是说,被告未经许可使用原告的受版权保护作品,造成了原告的损失。

例如,不久前,印度的亚洲新闻国际新闻社(ANI)提起了针对印度德里法院的Openai侵权的诉讼。 ANI指责Openai未经许可使用其新闻内容并侵犯其版权。 ANI要求法院命令OpenAI弥补损失,并永久禁止OpenAI使用其内容。

显然,根据ANI的指控,OpenAI可能在培训数据中使用了ANI创建的内容。作为媒体媒体,ANI及其员工在新闻制作过程中收集了很多信息,并且经过处理后,他们构成了文章或新闻报道。这些文章或新闻报道已成为OpenAI等生成AI培训数据的重要来源。

ANI不是第一个起诉Openai的媒体。此前,《纽约时报》和《原始故事媒体》等媒体公司还提起了针对Openai的版权侵权诉讼。

《纽约时报》指责Openai使用数据来培训其发表的文章构成侵犯版权的文章。原始故事媒体和另一家公司共同起诉Openai。他们起诉的原因略有不同。他们认为Openai在培训数据时使用了他们的文章和其他内容,但是“刮擦”作者,文章名称,版权保护标记等。

一些原告声称,生成的Openai的生成数据具有“相似性”,如版权法所规定的作品。因为它符合版权法中的“相似性”,因此可以证明被告窃或窃了原告的工作。

例如,在2023年1月,几位视觉艺术家对包括稳定AI和Midjourney在内的四家公司提起了集体诉讼,指责被告侵犯了其版权。原告认为,这四家公司的人工智能生成的作品与其原始作品非常相似,因此指责被告未经他的允许使用其受版权保护的作品,这构成了侵犯版权的侵犯。

例如,在2023年7月,一位名叫Richard Kadrey的作家起诉Meta,指责Meta使用人工智能来生成与其作品极为相似的内容,因此指责后者侵犯其版权和归因权并损害其创造者。名声。

面对这些指控,人工智能公司作为被告经常援引版权法中“合理使用”的原则。如何证明自己的行为构成“合理使用”,特定情况有不同的原因。

例如,在回应ANI的指控时,Openai认为它使用的数据是公共领域数据。从公共领域和培训模型中获取数据是合理的用途。

例如,为了回应理查德·卡德里(Richard Kadrey)的指控,即巧合的是,其人工智能的作品与原告的作品相似,并且两者之间没有直接复制关系,因此它并不构成侵权。此外,与许多方面的原始作品相比,生成性Openai创作的作品经历了变革性的变化,因此它们是合理使用的。

在这里,有必要简要解释转换变化。所谓的变革性更改意味着原始作品的使用不仅是简单的副本或复制品,而且还通过添加新的表达式,含义,目的或功能,以便原始工作具有新的价值或用途。

此外,当生成AI服务跨越边界时,国际诉讼还有另一个值得注意的问题。被告在国际诉讼中经常引用的另一种辩护是管辖权。

例如,Openai在对ANI的上述诉讼中提出,OpenAI的服务器不在印度,并且数据处理和使用不在印度。根据侵权法的基本原则,《侵权法》对侵权纠纷具有管辖权。印度法院不是犯下侵权的法院,因此没有管辖权。

在《生成AI》版权纠纷中,法院的判决思想和态度

面对生成的AI版权纠纷总体而言,法院倾向于保护技术创新,并防止过度频繁的诉讼成本阻碍生成AI的发展。

例如,在Raw Story Mediav。Openai的情况下,原告认为OpenAI用于培训的许多数据来自Internet上的数据。在互联网上的这些数据中,有来自原告的文章,新闻报道等。

原告指控在培训数据中,OpenAI删除了作者姓名,文章标题,版权信息等。在这些文章和新闻报道中,并将其放入培训模型中。最后,在生成的数据中没有作者名称,文章标题,版权信息等,这类似于传统版权侵权中的窃,窃等行为。

基于上述事实,原告要求法院命令被告弥补损失并制止侵权。

法院的理由是,原告必须证明遭受的损害是具体的,而不是抽象的。原告仅指控被告在培训数据中删除了作者的姓名,文章标题,版权信息等,但没有提供证据证明他们遭受了特定的损失。

法院裁定,如果某些指控不是基于特定损失,则原告没有资格提起诉讼。

法官进一步辩称,原告没有资格提起赔偿诉讼,也没有有资格要求被告停止侵权。

作者认为,在这种情况下,法官的判断构想和法律态度是通过判决来遏制生成AI的起诉。也就是说,原告不能提供证据证明遭受一定的损害,只指责被告损害了他的版权。

如果法官没有做出这样的判断,我们可以想象,越来越多的公司,尤其是个人,会声称生成的AI公司在未经允许寻求损害的情况下使用了工作。这种诉讼成本不仅可以被生成人工智能行业难以忍受,而且给司法机构造成了太大负担。

在其他类似的诉讼中,例如理查德·卡德里(Richard Kadrey)针对梅塔(Meta)的案件,法官还做出了有利于被告的判决。

生成AI通过法律发挥的技术创新如何?

Generative AI不仅给传统的知识产权(例如版权)带来了法律挑战,而且实际上,其影响超过了法律本身,并且对传统市场模式产生了影响。

例如,在上述《纽约时报》中,起诉Openai和Microsoft侵犯了版权,原告不仅指责被告侵犯了版权,而且还指出,被告不仅使用了《纽约时报》中受版权法保护的内容,而且使用还造成了大量纽约时报。读者迷路了。这些读者不再访问《纽约时报》在线频道,而是阅读OpenAI的内容输出。

换句话说,生成AI的出现也对传统的媒体市场结构产生了深远的影响。

即使法律解决了知识产权所有权的问题,生成AI的创造性行为也为市场交易及其福利分配带来了新的挑战。这可以从本文以前的许多原告的指控中看出。

例如,即使Generative AI合理地使用了其他公司或个人的数据,合理使用的结果是,数据创建者和所有者最初享受的市场份额受到了侵蚀,并且将市场份额重新分布。

这给传统媒体带来了不公平性,甚至遇到了生存危机:在生成人工智能使用其自己的数据(即使合理使用)之后,它会产生更多流行的数据(内容),其自己的客户(读者)是转移失去市场份额。

显然,生成AI带来的法律影响是市场交易模型的影响。如果法律无法解决该市场交易模型的影响,并合理地分配了生成AI及其数据源主题之间的市场兴趣分布,则没有人会动机创建第一手数据。

如果立法或司法判断仅在传统的思想上“保护谁”法律,而不是考虑生成AI对市场结构的变化,保护创新的立法或司法判断最终可能会破坏生成AI发展的存在它依赖高质量的“数据生态系统”。

想象一下,传统媒体中的调查记者必须花钱来调查市场,分析市场,形成第一手信息并从中获得回报。如果以此为基础处理人工智能,它将形成更方便使用消费者使用的信息。如果法律无法解决生成人工智能与第一手信息所有者之间的市场分配问题,谁将激励市场调查,分析市场并形成第一手有价值的信息?没有亲笔的宝贵信息,生成人工智能的高质量数据的来源在哪里?如何保持信息市场的正常生态?

作者认为,在确认生成AI带来的社会益处(例如信息包容性和创造民主化)以及鼓励技术创新,立法和正义也应具有更高的观点,并且对“维持高质量数据生态学”的看法也有更大的看法。 “社会利益”的观点是考虑法律与技术创新之间的游戏。

由于空间的限制,本文只提出了一个宏观想法,即,法律应鼓励所有者或原始数据的创建者之间的自由交易,例如传统媒体格式和生成性AI。通过自由交易找到最佳的资源分配安排,以形成帕累托的改进效果。也就是说,通过原始数据的所有者或创建者之间的合作,创建价值的增量,从而使每个参与者的情况都可以从生成人工智能的运作中变得更好。这样,越来越多的市场实体(个人)有动机来创建更好的数据,而生成的AI受益于更好的培训数据,生产更好的产品,形成良性周期,并在整个社会中形成高质量的数据生态系统。 。

(作者Wang Zuofa是西南科学技术大学法学院的副教授)

分类: 股市
责任编辑: admin
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。

发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。