您的位置 首页 国际

美国爆发“数据起义”:好莱坞文学界新闻界和社交媒体反抗AI

·国外圣克拉拉高校法学院教授埃里克·戈德曼觉得,起诉的浪潮刚刚开始,“第二波和第三波”即将来临,然而这将界定人工智能的未来。 ·独角兽公司辩驳称,应用受版权法作品来学习培训人工智能…

·国外圣克拉拉高校法学院教授埃里克·戈德曼觉得,起诉的浪潮刚刚开始,“第二波和第三波”即将来临,然而这将界定人工智能的未来。

·独角兽公司辩驳称,应用受版权法作品来学习培训人工智能技术是合理的——这借鉴了美国版权法中“转换性使用”这个概念,假如原材料以一种“前沿性”的形式更改,便会创造一个除外。

国外已经暴发一场“数据信息造反”,美国好莱坞、艺术大师、文学家、社交网络公司与媒体机构全是反抗者。

一切的导火索都指向ChatGPT和Stable Diffusion等生成式人工智能技术专用工具,它被所指未经同意许可或者提供赔偿前提下,违法运用内容生产者作品练习大中型语言模型。

这一场“数据信息造反”的关键在于一种全新的认识,即线上信息内容——经典故事、工艺品、新闻文章、互联网贴子和相片很有可能具有重要未开发设计使用价值。在网络上爬取公布视频的作法古已有之,大部分采用这种行为的企业和非营利性组织都是会公布披露。但ChatGPT公布以前,数据信息使用者对于此事并不是很了解,都不认为这是一个特别棘手的问题。如今,当群众了解到了想要了解更多关于AI练习的基本知识后,这样的事情发生了转变。

“它是数据价值的全局性重构。”Nomic企业创始人首席执行官布兰登·杜德斯塔特(Brandon Duderstadt)在接受采访时说,“之前,用户通过让大家都能浏览数据信息并推广产品来获取数据价值。而如今,人们普遍认为要好好保护自己数据信息。”

的浪潮跌起

近期好多个月,Reddit和推特级社交网络企业、《纽约时报》和美国全国广播公司(NBC)等媒体机构、科幻作家韦德·特伦阿尔弗(Paul Tremblay)和女演员珍妮弗·西尔弗曼(Sarah Silverman)等纷纷发付诸行动,抵制这些作品和数据被人工智能技术私自搜集。这一系列行为被美媒称之为“数据信息造反(Data Revolt)”。

上星期,西尔弗曼向OpenAI和Meta企业提出诉讼,控告这些人在训练样本时使用其经典著作的盗用具体内容,由于这两家公司的对话机器人能够清晰地汇总其书里面的内容。除此之外,包含乔迪·皮科特(Jodi Picoult)、马格丽特·阿特伍德(Margaret Atwood)和阮越清(Viet Thanh Nguyen)等在内的5000多位文学家签订了一份求助信,规定科技有限公司使用他的书做为训练样本时,要征求他的批准,并予以她们落款和赔偿。

为了维护自己的视频,文学家和艺术家实施了不一样的抗议方法。有些挑选锁住著作,不许人工智能技术获得;有些挑选遏制公布人工智能技术形成具体内容网站;有些则挑选撰写一些突破性的具体内容,来影响人工智能学习培训。

7月13日,具有16万VIP的好莱坞三大公会之一SAG-AFTRA公布出故障,在这以前,国外导演公会早已出故障70来天。《纽约时报》称,此次罢工使使用价值1340亿美元国外电影行业深陷间断,SAG-AFTRA公会规定流媒体播放大佬为其提供更公平公正的股东分红和理想的工作标准,同时要求制片公司确保不容易以AI和手机形成脸孔和声音取代艺人。

此外,一些媒体机构还在遏制人工智能技术。6月,在有关应用形成型人工智能内部结构记事本中,《纽约时报》表明,“独角兽公司应当尊重我们的专利权。”同月,在意味着线上出版公司权益的国际贸易组织Digital Content Next公布的一份公告中,《纽约时报》和《华盛顿邮报》等线上出版公司觉得,应用受著作权保护的新闻文章做为人工智能训练样本具备潜在性风险和法律风险,他们号召独角兽公司重视出版公司的专利权和写作工作。

社交网络企业都纷纷表明立场。在今年的4月,社交媒体新闻媒体Reddit表示,它希望能对浏览其应用程序编程接口(API)的第三方收费标准。RedditCEO史提夫·费舍(Steve Hoffman)表明,它的企业“不用将所有使用价值都提供给世界最大的一些公司。”7月,推文使用者埃隆·埃隆马斯克(Elon Musk)还表示,一些公司和管理“违法”很多爬取推文的信息,为应对“极端数据收集及系统控制”,推文确定限定个人帐户可以看一下的文章数目。

这一场“数据信息造反”也包含“起诉的浪潮”,一些独角兽公司因为数据隐私保护难题遭受数次提起诉讼。上年11月,一群程序猿对微软公司和OpenAI进行集体诉讼,称这两家公司使用其编码练习人工智能编程小助手,侵害了她们的版权。在今年的6月,公司总部洛杉矶市的亨弗里斯法律事务所向OpenAI和微软公司进行民事起诉书将近151页的集体诉讼,强调OpenAI怎样从未成年那边收集信息,合称互联网爬取侵害了出版法,形成了“偷盗”。自此,该公司也对谷歌搜索发起了相似的起诉。

国外圣克拉拉高校法学院教授埃里克·戈德曼(Eric Goldman)在接受采访时说,这宗诉讼论点论据过度广泛,不大可能被依法接纳。但在他看来,起诉的浪潮刚刚开始,“第二波和第三波”即将来临,然而这将界定人工智能的未来。

法律法规异议

OpenAI的ChatGPT和Dall-E、谷歌的Bard、Stability AI的Stable Diffusion等生成式AI都是围绕从网络上爬取的海量新闻文章、书本、照片、视频音频网络文章进行练习的,其中不少公布内容都受版权法。

在今年的3月,OpenAI发布了一份对这家机构关键语言模型的数据分析报告,表明训练样本的文字一部分采用了来源于新闻媒体、wiki百科和一个盗用书本数据库系统(LibGen)的信息,现阶段,该盗用书本数据库系统已经被美司法部被查封。

7月13日,美国联邦贸易委员会(FTC)向OpenAI发送了一份20页的文档,规定OpenAI提供相关其人工智能模型的风险管控、网络信息安全和资料审核记录,以调研它是否侵害了消费者权益。

但公开露面与对诉讼回复中,独角兽公司辩驳称,应用受版权法作品来学习培训人工智能技术是合理的——这借鉴了美国版权法中“转换性使用”这个概念,假如原材料以一种“前沿性”的形式更改,便会创造一个除外。

“人工智能模型大部分要在从每一个信息内容中学到。这就像一个同学们在图书馆读书,随后学习培训怎样写好文章与阅读。”谷歌搜索全世界事务管理首席总裁肯特·维泽(Kent Walker)在一次访谈上说,“此外,你必须保证并没有拷贝其他人著作,也没做一些侵犯著作权的事。”

谷歌的总法律顾问哈利玛·德莱恩·丰田普拉多(Halimah DeLaine Prado)向媒体表示:“多年以来,每个人都清楚,大家会用来源于公共性信息的来源数据信息——例如分享到开放网络和云计算平台集的信息内容,来练习谷歌在线翻译等业务其背后的人工智能模型。”她指出,“美国的法律适用运用公共资源来创造更多有利主要用途,大家期盼着反驳这种凭空捏造这样的说法。”

迈阿密大学科学研究知识产权法的专家教授达尼埃尔·索维基百科(Andres Sawicki)接受采访时说,有一些很有可能有益于科技公司例子,例如1992年国外上诉法院的裁定,容许企业对其他企业的软件代码开展反向工程设计制作市场竞争商品。但很多人表明,针对大型企业运用创始者工作来制作一个新的赚钱机器,判断力上这是不公平的。“有关生成式人工智能难题很难揭晓答案。”他说道。

迈阿密大学出版法专家教授洁西卡·D·利纳伊斯·索维基百科(Jessica D. Litman Sawicki)表明,规范使用标准(Fair use)应该是独角兽公司的一种强有力辩解,由于人工智能模型的大部分导出具体内容并不是确切地类似某一特定人类著作。但在她看来,假如提起诉讼独角兽公司的原创者可以展现充足多和她们著作十分相似人工智能技术的导出的事例,他们便会有理由去觉得,她们的版权已经遭到侵害。

独角兽公司逐渐解决

索维基百科表明,独角兽公司能通过在商品中组装过滤装置(filters)来预防这样的事情,以保证他们不容易形成一切与当前著作太相近的具体内容。比如,视频平台YouTube已经用有关技术,检验并直接删除上传至其页面的受版权法作品。从理论上来说,独角兽公司也可以形成优化算法,发觉与当前造型艺术、歌曲或创作著作相对高度类似输出。

这一场“数据信息造反”从长远来看可能不能掀起波澜。像谷歌和微软这种互联网巨头已经拥有大量的特有数据信息,而且有水平获得更多的数据信息。可是,伴随着具体内容获得变得更加艰难,人工智能经营规模还在变小。这些需要和大企业对抗的新兴公司和非营利机构很有可能不能得到充足的数据来练习他的系统软件。

就在那7月初,加州大学伯克利分校电子信息科学专家教授、《人工智能——现代方法》创作者布兰切特·罗素(Stuart Russell)发出警告称,ChatGPT等人工智能技术推动的人工智能很有可能很快就“耗光宇宙中的文字”,根据搜集大量文原本练习机器人技术性“逐渐碰到困难”。

一些公司也在以协作心态解决那股的浪潮。OpenAI在一份声明中表示,“大家重视艺术创意人员及创作者的权力,并期待继续与她们协作,以保障他的权益。”7月14日,路透社同意将1985年之后的新闻档案资料授权给OpenAI,同时还将运用OpenAI的技术和产品。

谷歌搜索还在一份声明中表示,它参加了有关出版公司未来会怎么样管理方法内容的商谈。该公司认为:“我们坚信,每一个人都能从一个朝气蓬勃的具体内容生态系统中的获益。”

独角兽公司HuggingFace的首席伦理道德专家马格丽特·拉塞尔(Margaret Mitchell)在接受媒体采访时表示,“全部数据采集系统软件都要更改,遗憾的是,它必须通过起诉来达到,但是这通常是促进科技有限公司开展更改的形式。”她讲,假如OpenAI由于起诉或新规但在年内彻底下线在其中一款产品,她也不会感到意外。

见习生 陈晓锐 澎湃新闻记者 方晓


本文来自网络,不代表热点新闻立场,转载请注明出处:http://www.redianxinwen.cn/6421.html

作者: admin

为您推荐

发表评论

邮箱地址不会被公开。 必填项已用*标注

联系我们

联系我们

13000001211

在线咨询: QQ交谈

邮箱: 2562541511@qq.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部