chatgpt训练语料 ChatGPT来“语法纠错”,还不靠谱!

默认分类2个月前发布 admin
17 0
ChatGPT国内版

大火的发布后,很多小伙伴都拿它来语法改错,但结果可能会让你失望。

在国内知名科研工具箱平台——科研者之家(Home for )的官网上,有一个神器叫“语法纠错”,这个工具包括纠错和官方自研的纠错模型。为啥有2个呢?是因为之前上线后,他们收到了很多用户说效果不稳定的反馈,所以就上线了自家的,作为补充对比。

那是不是和官方说的一样,改错效果不咋地呢?小编随机使用了几个句子,故意改错,看看两者的表现:

第一句: for -s (TNBCs) .

评比结果:两者旗鼓相当!

第二句:, the .

chatgpt训练语料 ChatGPT来“语法纠错”,还不靠谱!

测试结果:直接认为是没有语法错了,有点震惊。小编猜想可能是因为训练的语料实在太多,比如很多口语化的语言,可能反而增加了包容性(专业术语叫过拟合),导致对很多语法错误都容忍了。

所以这句话,HR官方自研模型完胜!(注意下 stage的搭配实际也是有的哦)

小编就随机测试这2句了,统计学没有差异,但可以看到的是,不能无脑使用来纠错,同样也就要谨慎用来翻译和润色。

比如,用来翻译,试试下面这段话的效果:

Part.1

一篇关于影像组学的论文节选

chatgpt训练语料 ChatGPT来“语法纠错”,还不靠谱!

可以看到,这一段的翻译还是有比较多的问题的。很多术语翻译时,GPT往往选取了字面意思,比如在生信类文章中指的是模型,不需要称为“签名模型”,model fit则译为拟合度更佳,而非“适合度”。“比较高和低签名预测之间的……”指的应是高低风险组。最后“CT ”指的是CT检查中的伪影而非简单译成“CT成像异常”。二是整体缺乏一些句子之间的连词,略显生硬。

所以,不管是润色还是翻译,如果你迷信,那很可能就被它坑了。使用最大的风险,就是:碍于使用者本身的水平,以为它的结果是完美的,但实际它的结果没那么好,或者就是“正确的废话”…..而你却完全不自知。

弗雷赛斯

-浙江大学硕博创建于2015年

||| |||

让天下没有难做的科研–联系我们:

323AI导航网发布

© 版权声明
广告也精彩

相关文章

暂无评论

暂无评论...