通信世界网消息(CWW)生成式人工智能诞生以来,科研人员普遍感受到新一代人工智能工具在提高写作与研究效率方面的显著作用。与此同时,学术期刊编辑频频反映,投稿系统中涌入了大量语言流畅但学术价值有限的平庸论文。
美国康奈尔大学研究人员近期发表在《科学》期刊上的一项研究显示,这类现象反映的并非个别案例,而是学术写作方式正在发生转变。研究发现,使用ChatGPT等大型语言模型能够显著提高论文产出数量,对非英语母语的科研人员的帮助更为明显。然而,人工智能生成论文的数量激增,也使得审稿人、科研资助机构以及政策制定者越来越难以区分真正具有学术贡献的研究成果与人工智能生成的低质量、同质化论文。
论文产出效率显著提升
“从社会科学、物理学、计算机科学到生物科学,这种现象普遍存在。”康奈尔大学信息科学系助理教授殷裔安(Yian Yin)表示,“当前科研生态系统正在发生重大转变,所有人都应当重视,那些决定科研支持与资源配置方向的决策者尤其应该给予高度关注”。
研究团队收集并分析了2018年1月至2024年6月发布在三个主要预印本平台上的200多万篇论文,系统考察了大型语言模型对科学出版的影响。这三个平台分别是arXiv、bioRxiv和SSRN,涵盖物理科学、生命科学和社会科学领域,发布的论文均尚未经过同行评议。
研究人员将2023年之前发表的、被普遍认为是由人类撰写的论文与人工智能生成的文本相比较,进而训练并构建了用于识别“可能由大型语言模型撰写的论文”的人工智能检测模型。借助该模型,研究人员能够识别哪些科研人员可能开始使用人工智能进行写作,统计其在使用人工智能前后的论文产出变化,并进一步追踪这些论文是否最终被学术期刊接收和发表。分析结果显示,人工智能显著提升了论文产出效率。在arXiv平台上,使用大型语言模型辅助写作的科研人员的论文数量较未使用人工智能者高出约三分之一;而在bioRxiv和SSRN平台上,这一增幅超过50%。
研究同时发现,非英语母语的科研人员因长期面临语言障碍,从大型语言模型使用中获益最为明显。亚洲科研机构的研究人员在开始使用大型语言模型后,其论文产出相较于未使用该技术的同类科研人员,增加幅度在43.0%—89.3%。由此,殷裔安推测,全球科研生产力的地区分布会发生变化,此前因语言障碍而处于相对不利地位的地区将获得新的竞争优势。
研究还揭示了人工智能在论文准备阶段的另一项积极作用。在科研人员进行文献检索、选择引用文献时发现,Bing Chat在搜索最新研究成果和相关学术书籍方面整体优于传统检索工具,传统工具倾向于提供年代较早、引用频次较高的文献。研究人员表示,使用人工智能工具的研究人员能够接触到更多元的知识结构,这可能有助于激发更具创造性的研究思路。
增加学术评价难度
研究显示,人工智能在提升论文写作便利性的同时,也显著增加了学术评价的难度。对于由人类撰写的传统论文而言,结构清晰、语言较为复杂通常预示着较好的研究质量。在三个预印本平台上,那些被判定为由人类撰写且在写作复杂性测试中得分较高的论文,最有可能被学术期刊接收。相比之下,尽管部分由大型语言模型生成的论文在语言复杂性测试中同样得分较高,但其被期刊接收的概率明显偏低。这表明,审稿人往往认为此类论文虽然表述流畅,却缺乏学术价值。
对于这一现象,俄罗斯科技经济、政治和法律研究所研究员丹尼斯·科西亚科夫(Denis V. Kosyakov)在接受本报记者采访时表示,人工智能更适用于能够由算法处理的环节,即重复性强、结构清晰且规则可描述的工作过程。这类似于历史上一些著名学者需要无名助手完成资料整理、计算或初步写作等基础性工作。但这一过程无法突破预设数据的范围,难以出现创造性、突破性的内容,学术贡献通常不大。
随着人工智能逐渐参与到科研写作、程序编写甚至研究构思等环节,在某种意义上成为“协作科学家”,其影响范围正在不断扩大。在殷裔安看来,写作质量与学术质量之间的“脱钩”现象,可能会对科研评价体系产生深远影响。例如,编辑、审稿人难以准确识别有价值的论文,对于科研管理机构而言,产量也不再是可靠的评估标准。他呼吁,政策制定者应及时制定相应的规则与规范,以应对快速发展的技术环境。“当下的问题已经不再是‘是否使用过人工智能’,而是‘如何使用人工智能’,以及它是否真正对科研产生了积极作用。”他说道。
人工智能不仅是技术工具,更是一种正在重塑知识生产方式的社会与文化现象。“它促使我们重新思考什么是创造、如何评价科学贡献,以及人类在知识体系中的角色和能动性。”随着人工智能承担了越来越多的基础性研究任务,人类研究者更应专注于自身难以被替代的能力,例如,提出新的研究议程、实现出乎意料的概念突破以及开展深入的跨学科综合研究。从这一角度看,人工智能并没有降低科研门槛,而是在倒逼学术界重新界定“卓越”的标准。未来的科学进步,或将更多地来自人类与人工智能的协同合作,双方在各自优势的基础上共同推动知识边界的拓展。


