当前位置: 华闻网 - 金融

ChatGPT“克星”:用AI识别AI生成的文本,英语论文阅读笔记都能测

时间:2022-12-15 10:36    作者:李陈默   来源:IT之家    阅读量:4975   

ChatGPT的出现让很多人看到了期末作业的曙光。

无论是英语论文还是读书笔记,只要是ChatGPT知识范围内的,都可以请它帮你完成,写的内容有理有据。

但是,你有没有想过,你的老师也打算用AI文字检测器之类的东西来防止你作弊。

输入一个听起来像这样的音符。经过一番测试,这篇文字是AI写的的概率是99.98%!

由ChatGPT生成的文本

试试别的数学卷子。ChatGPT的输出看起来很好,但它仍然准确地看穿了它:

由ChatGPT生成的文本

不是瞎猜毕竟对方也是一个AI,一个训练有素的AI

看到有网友调侃这个:以魔法打魔法。

用AI写的东西训练新AI。

这个AI检测器被称为GPT—2输出检测器,它是由OpenAI联合哈佛大学和其他大学和机构创建的。

输入50个以上的字符就可以准确识别AI生成的文字。

可是,即使是专门检测GPT—2的模型,也同样适用于检测其他人工智能生成的文本。

然后用这个数据集对RoBERTa模型进行微调,得到这个AI检测器。

罗伯塔是伯特的改进型最初的BERT使用的是13GB的数据集,但是RoBERTa使用的是包含6300万条英语新闻的160GB的数据集

其中,人类的文字全部被识别为真,AI生成的内容全部被识别为假。

当然,这个探测器并不是100%准确。

AI参数越大,生成的内容越不容易被识别比如有1.24亿个参数的模型被抓住的概率就比有15亿个参数的模型高

同时,模型生成结果的随机性越高,AI生成内容被检测到的概率越低。

但即使将模型调整到最高随机性,1.24亿个参数模型被检测到的概率仍然是88%,15亿个参数模型被检测到的概率仍然是74%。

这是OpenAI两年前发布的模型当时,GPT—2生成的内容是一打一准

现在面对升级后的ChatGPT,检测英文生成内容的效果还是可以发挥的。

但是面对ChatGPT生成的中文,它的识别能力就没那么好了。比如让ChatGPT写一篇作文:

人工智能检测器给出99.96%的概率是由人写的...

话说回来,当然ChatGPT也可以检测自己生成的文本。

所以不排除老师会把你的作业直接交给ChatGPT鉴定:

还有一点

值得一提的是,ChatGPT表示无法上网搜索信息。

显然,它不知道人工智能检测器GPT—2输出检测器的存在:

那么是否如网友所说,ChatGPT可以生成一段AI检测器检测不到的内容呢。

不幸的是,我不能:

所以写你自己的大作业吧...

参考链接:

ChatGPT“克星”:用AI识别AI生成的文本,英语论文阅读笔记都能测

相关内容