自从 ChatGPT 等人工智能工具推出以来,“人工智能”一词已成为从教育到内容创作等行业的流行词。作家和dent现在面临着捍卫自己作品的新挑战,无论是人工智能还是人类内容。
根据 Stastia 去年的统计,“AI”一词在 2023 年 7 月的搜索量超过 3040 万次,是前一个月的三倍。随着人工智能 变得越来越普遍, 教师和编辑必须找到一种替代方法来确定呈现给他们的文本是否是人工智能。这导致了人工智能探测器的兴起。
然而,许多作家和教育家质疑人工智能的真实性。其中之一是 TrustInsights.ai 的联合创始人 Christoper Pen,他在 LinkedIn 的一篇 帖子 , “AI 探测器”是一个笑话。 Pen并不是唯一一个认为人工智能探测器不可靠的人。 SEO 内容专家 Dianna Mason 表示 ,“人工智能内容检测器不起作用。”
根据 另一篇帖子 ,一位用户表示: “是的,人工智能探测器是一个骗局。从来没有一篇学术论文证明人工智能探测器可以可靠地工作。对于可靠的人工智能探测器如何工作,也没有一个有前景的理论框架。 “
几个广为人知的例子表明人工智能探测器效率低下。例如,一台探测器将美国《独立宣言》的 97.75%dent认为是人工智能撰写的。
在另一个例子中,圣经中的文本被发现是人工智能编写的。印度教经典《薄伽梵歌》也被人工智能误dent。此类dent对人工智能探测器的可信度提出了非常严重的质疑。
为了进一步研究人工智能探测器的有效性,我们用四种不同的探测器测试了圣经的摘录。结果却截然不同
- Quilbott-根据该网站,所使用的摘录可能是 0%,不是人工智能生成的。
- Grammaly - Grammaly 还dent文本为 100% 人工编写。
- Gpt Zero——该网站给出的文本有 96% 的可能性是由人类编写的。
- 零 Gpt - 这是我测试的最后一个网站,结果令人震惊,根据该网站,文本 96% 是 AI 编写的。
人工智能探测器如何工作
AI 检测器或 GPT 检测器是旨在dentAI 生成的内容的系统。这些检测器根据模式和单词排列来比较文本,就像法学硕士对文本所做的那样。法学硕士使用从数据推断的概率,并纯粹基于单词的序列检测来进行预测。 AI 检测器根据这些概率来检测 AI 内容。
AI检测器主要使用两种衡量标准,即困惑度和突发性。困惑度衡量下一个单词正确的概率,突发性衡量单词和短语数量的变化性。虽然人类书写往往表现出更多的多样性,但人工智能生成的文本通常更加统一。尽管如此,随着 GPT-4 等人工智能模型的进步,它们可以更熟练地复制人类书写,从而使检测变得更加困难。
Coachvox 创始人 朱迪·库克 (Jodie Cook) 表示 “现在我们嘲笑人工智能生成的 LinkedIn 评论......但随着技术的进步,我们将不知道什么是真实的,什么是不真实的。没有人会。 “
对于作家、dent和企业来说,风险很高。这就引出了一个问题:人工智能探测器是否可信?


