Nature内幕:大量论文正在被高价出售训练AI,而作者毫不知情

标签:
ai英语润色论文润色埃米编辑 |
分类: 论文润色 |
以下内容首发于微信公众号:【埃米编辑SCI论文润色】。关注微信公众号,写作投稿更容易~如有论文润色需求,可以联系我们哦~
“万万没想到,当我在用AI工具用的正嗨的时候,我的已发表论文可能已经被拿去投喂AI训练了。”目前已有出版商与AI科技公司展开了合作。此举一出,学术界大部分教授感到震惊和愤怒,认为自己的工作内容存在被泄露的风险,尤其是作者们可能对此还一无所知。
2024年7月,学术出版商Taylor & Francis与微软签署了一项价值1000万美元的协议,允许这家美国技术公司访问出版商的数据,以改善其人工智能系统。6月,出版商Wiley通过允许一家未具名的公司在其内容上训练生成性人工智能模型,获得了2300万美元。这些合作能够让微软公司访问其学术内容和其他数据,以训练人工智能模型。
专家说,如果一篇研究论文还没有被用来训练大型语言模型(LLM),那么很快它就会被拿去训练了。而研究人员正在探索让作者发现他们的内容是否被使用的技术方法。
华盛顿大学的 AI 研究员 Lucy Lu Wang 表示:“一篇一旦论文被用于训练模型,就无法在模型训练后将其移除。”
这种合作对于三家公司来说,肯定是利大于弊的,但是对于我们科研er来讲,到底意味着什么呢?是利还是弊?
1 有利之处
1) 使研究变得更容易
Taylor & Francis的发言人在给《纪事报》的邮件中说:“和很多人一样,我们也在探索新应用,想要让研究变得更简单,比如更方便地分析数据、生成假设、自动化任务,甚至跨学科合作。” 这次合作也是为了借助微软的AI助手Copilot,帮学术界找到更有效的科研方式。Wiley也同意这个观点,觉得这次合作可以真正造福学术界。
确实,AI技术能让一部分科研步骤变得又快又准,大大提高了科研人员的产出,在一定程度上,帮助了科研er的产出。
2) 打造无边界的科研环境
过去,要获取论文只能通过出版商,而一项研究的文献准备也往往需要多家出版商的资源。但现在,和科技公司合作后,来自不同出版商或期刊的数据和研究材料,可以通过同一渠道获取。这不仅节省了准备时间,还提高了效率,为论文的早日发表争取了先机。毕竟,谁也不想和别人做同样的课题吧?
这种合作打破了过去对出版商或期刊“学阀”的固有印象,通过科技公司共享数据库,科研人员可以通过AI途径获取所需的论文和数据。这一举措改善了学界的研究氛围,真正实现了科研无边界。
3) 打造一站式科研平台
这次合作,几家公司希望借助AI技术,从文献查找到数据分析,全程为科研人员提供帮助。这样一来,以往需要多个软件才能完成的研究,现在可以一站式搞定,特别是在文献综述部分,更加全面和准确。虽然这个AI模型不一定完美,但至少提供了一个新选择。而且,如果AI的分析结果和传统方法不一致,这不正是一个新的研究发现的契机吗?
一站式的科研平台大大方便了学术研究,在这个“内卷”的时代,任何高效、方便的科研工具都能为科研人员提供不少助力。
2 不利之处
1) 作者的知识产权存在风险
这次合作意味着,出版商旗下所有数据都会共享给科技公司,也包括一些作者的隐私和知识产权信息。虽然Taylor & Francis承诺会保护知识产权,并限制了逐字文本的复制,内容使用也将受到严格控制,权利持有人会获得合同中的版税。但这些解释并没有得到学术界的广泛认可。
新不伦瑞克大学的社会学助理教授Kalman Lamb认为,这实际上就是学术界的无偿劳动。很多学者觉得,虽然他们说会保护科研人员的知识产权,但这种商业活动一直存在,不过是换了个新说法而已。
2) 作者可能得不到补偿
Wiley的发言人表示:“我们致力于确保作者和社会受益,并会根据现有合同协议提供补偿和权利保护。”但并未明确说明受益者是谁。因此,学术界有理由质疑,作为论文生产主力的科研人员,以及投入大量劳动的编辑、同行评审等,可能无法从中获利。最终的最大受益者还是那些大公司。
但在当前环境下,科研人员别无选择,他们需要在期刊上发表文章,尤其是那些影响因子较高的期刊。因此,他们只能把文章交给这些出版商,而这次合作并没有为他们带来任何补偿。锡拉丘兹大学的地理和环境教授Sultana在一封邮件中告诉《纪事报》:“所有这些都发生在我们没有得到补偿的情况下,私营公司滥用了我们免费的智力劳动,每年从出售我们的书籍中获得数十亿美元的利润。”
3) 论文可能会被AI断章取义
AI模型的运作依赖大量初始资料,而其底层逻辑往往以关键词为引子,提取数据,辅助分析,最终生成结果。在出版商提供的大量数据下,AI通过关键词提取内容,无法百分百还原原作者的意图。可能关键词是对的,但意思却完全相反。
这种情况下,AI很可能会断章取义,导致错误引用前人文献,最终的研究结果也可能与客观事实不符。这完全违背了科研的初衷,而且就算文章发表了,也有可能因为被原作者发现错误而被举报,最终导致撤稿。
总的来说,虽然这次合作引发了广泛关注,但不同的人有不同看法。对科研人员来说,当然是利弊兼有。
那么你认为这次合作对科研人员还有什么影响呢?