据教育部统计,中国2023届全国普通高校毕业生规模预计将达到1158万人,而绝大部分人都要经历毕业论文这一关。当前正值毕业季,在社交平台上,“用写论文”“用给论文降重”等经验分享帖比比皆是。在电商平台上,也有相关账号在售卖。
在孙菁参加的最近一次论文会上,系里强调,禁止学生在论文中使用AI生成的内容,也不允许学生先用母语写完论文,再用翻译软件进行翻译。
一开始,冯曼只是用完成课程小作业。平时老师会布置一些问题,让学生写出四五百字的回答。冯曼尝试让生成答案,直接复制交了上去,这些作业会在这门课最终的成绩中占据一定比重。冯曼并不担心被发现,“老师也不可能这样一个小小的课程作业,还去帮你查一下重”。
每次写作期末论文前,孙菁会向课程老师提交论文计划,老师给出批注建议,帮忙捋思路,或是提供文献资料。
冯曼把论文主题定为AI对法律领域的影响,接着,她向提问,它以这个主题列出了论文大纲。
“如果学校或者任课老师明确禁止使用,那就坚决不能用做任何和论文内容相关的事情。”吴飞告诉南方周末记者。
除了很多“车轱辘话”,的表述很机械,信息也并非完全准确。当南方周末记者请它“结合诗句分析李白诗歌中的浪漫主义色彩”时,它给出的四个诗句均与诗名不符,比如将王之涣《登鹳雀楼》中的“欲穷千里目,更上一层楼”,错误地对应为李白的《望庐山瀑布》。
不仅可以用于查询信息和润色语言,它也具备提出观点的能力。李悦的毕业论文主题是某产品的营销传播分析,她让分析该产品遇到的挑战和策略,它条分缕析地细细阐述,四千多字的内容用一小时就完成了,李悦觉得“比自己写得好”,这些内容自己也“能想出来,但不想组织语言”。
“论文最忌讳的就是主要观点不是自己的。”他对南方周末记者说。
当南方周末记者在的聊天框里输入以上内容后,停顿几秒,屏幕上慢慢出现一个个字符,连缀成标题“粤语的语言学特点及其在语言接触中的角色”,还有一百字左右的摘要:“……本论文旨在探讨粤语的语音、语法、词汇等方面的特点,并分析其在语言接触中的影响……”它条理清晰地生成了六个章节的框架,包括引言、语音特点、词汇特点、语法特点、在语言接触中的作用以及结论。
结果成绩出来,冯曼获得了88分。这个分数在班上属于中等偏上,她很意外。老师详细写了上百字的点评,夸赞部分内容分析得很好,还给出了改进建议。冯曼有些愧疚,自己只是大段复制粘贴,都没认真看写了什么,连参考文献都不知道是否存在。
在此之前,她看见过会编造文献的说法,但她知道,“老师不可能闲到把参考文献一条条都查一遍”,因此也没有特意检查。南方周末记者查询发现,冯曼这篇论文的10条参考文献中,有7条搜索无果,其余3条存在不同形式的错漏,或是书籍版本不存在,或是期号错误、标题不全。
后来,她干脆用写期中论文,她觉得老师不会认真看,“那个课每次点名都不齐的”。这篇论文只花了她两三个小时,她估计如果要全靠自己写,至少得用一两天,“一是它比较快,二是老师要求不是很高”。她抱着随便交个作业、混个及格的心态,提交了这篇论文。
如果你觉得不够详细,只要再次输入指令,比如“请将粤语的语音特点扩充一下”,短暂的停顿后,就可以继续拓展这部分内容,详细至声韵调系统及音变现象的分析。
李悦将毕业论文初稿提交后,导师评价写得一般,让她改了两遍,但主要是修改格式,内容的改动很少。当时她的重复率高达30%,不过其中用写的部分很少标红。她用前述翻译成外语再翻回来的方法,将标红的部分重新处理一遍,重复率降到了11%。
重复输入几次后,南方周末记者得到了一篇五千字左右的完整论文,全程不超过30分钟。虽然论证较为简单,但结构思路清晰。如果有更多耐心,还可以继续输入指令训练它,要求它将语言变得更学术化,或列出相关参考文献。
未来,陈心童打算考研,继续学画画。她知道硕士毕业时仍然需要完成论文,现在她认为这不是问题了,“因为我现在知道它怎么写了,我觉得写论文确实不是什么问题,无非多改几次”。她相信,即使没有帮助,自己也能写出来。知网上有很多论文,她可以参考别人的论文慢慢改、慢慢写。
作为美术生,陈心童毕业前需要提交毕业设计作品,还有一份创作心得,对作品的创作目的、背景、过程进行阐述,相当于毕业论文,学校查重以及将来论文抽查的对象都是这份创作心得。
吴飞提到,国外很多大学会在学生入学时介绍学术不端的情况,每个国家的学术规范不尽相同,但大多有专门的课程帮助留学生了解学术不端的标准,通常也会开设选修课,专门教学生写论文。
生成每一部分内容时,都会列出四五条参考来源。冯曼从中挑了10条作为论文参考文献列在最后。最开始,列出了很多外文文献,“明显就是我这个水平不可能看得懂的文献”,冯曼只好再次指定生成中文文献。
很适合“凑字数”,只要发出指令,一句观点便能扩充至几百字。但字数一多,它也会暴露出不足,很多受访者都反映它会重复说“车轱辘话”,“它废话是真的很多,有可能会一句话翻来覆去地讲”,赵铭说,这时又需要手动加工,适当再删掉一些。
“没有最懒,只有更懒。”在他的经验里,很多留学生外语不佳,连上课听讲都费力,如果课程太多,完成论文的压力就会很大,“之前没有的时候,有些人会找代写”,如今,成了新宠。
冯曼打算就这样提交期末论文。“我感觉用它的话比较省事,而且写出来的文章比我现在的水平要高一点。”她对南方周末记者说,“我花功夫可能还没有它的得分高。”
“这就是一个bug(漏洞)存在”。从事留学服务工作的吴飞这样形容在大学生群体中的使用。出现后,吴飞增设了一项业务,专门帮助不当使用的留学生进行申诉。
在他看来,更像是一个工具,他认为用工具不能算学术不端,学术不端更多指的是抄袭,比如直接复制别人的文章内容,“如果用它生成的话还好吧,要说抄袭的话,它又是抄谁的呢?都是它自己生成的”。赵铭提到,他一位同学写完论文后发给导师,导师主动建议,用润色一下。
“抄就是很快啊。”中国国内某二本院校新闻专业的大四毕业生李悦告诉南方周末记者,在她的毕业论文初稿中,大约40%的内容由生成。
陈心童用完成了毕业论文,学校规定查重率低于10%,而初稿过后,她的查重率仅有1.6%,在同学中显得有些“格格不入”。她担心这个异常低的重复率会引起注意,于是从一些优秀论文中复制了他人的内容,将重复率提高至4.5%。
冯曼觉得生成的内容“挺专业的,语气各方面都很像一篇论文”。之后,她又将每一部分分别拓展提问,将生成的内容复制在自己的论文中,稍作修改。最后形成的论文中,有99%的内容由生成。
赵铭的硕士论文要求也是查重率10%以下,他将论文初稿查了一遍,原以为生成的部分重复率会很高,但让他意外的是,“标红的地方基本不是它写的”。他修改后上传至学校要求的查重系统,最终以5.6%通过。