小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种新方法,通过优化鲁棒的风格特征空间,可靠地检测机器生成文本。研究表明,尽管模型经过优化,检测效果依然稳定,且随着样本增多,人机文本分布可明显区分,AURA指标有助于评估其重叠程度。

Optimized Language Models Designed to Deceive Detectors Still Exhibit Unique Styles (and How to Alter Them)

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

本研究提出了一种多尺度符合预测的零样本机器生成文本检测框架,旨在降低虚假正例率(FPR)带来的社会风险。该框架有效限制FPR上限,并提升检测性能,实证结果在多个检测器和数据集上表现显著。

Reliably Bounding False Positives: A Zero-Shot Machine-Generated Text Detection Framework via Multiscaled Conformal Prediction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-08T00:00:00Z

本文提出了一种基于Torrance创意写作测试的自动评估方法,旨在解决机器生成文本的创造力评估问题。该方法通过与高质量参考文本进行比较,提高了评估的一致性,实验结果显示配对准确率达到0.75,提升幅度为15%。

Automated Creativity Evaluation for Large Language Models: A Reference-Based Approach

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-22T00:00:00Z

本研究提出了OpenTuringBench,一个基于开放大型语言模型的机器生成文本检测与归属的基准框架。该框架通过评估任务和对比学习,显著提升了检测能力,超越了现有检测器。

OpenTuringBench: A Benchmark Framework for Machine-Generated Text Detection and Attribution Based on Open Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-15T00:00:00Z

本研究提出了一种基于逆困惑加权的模型集成方法,用于检测机器生成文本与人工撰写文本。该方法在英语和多语言环境中表现优异,特别是在多语言任务中,Macro F1-score达0.7513,显示出其在AI文本检测中的潜力。

Application of LuxVeri in GenAI Detection Task 1: Inverse Perplexity Weighted Ensemble Method for Robust Detection of AI-Generated Text in English and Multilingual Environments

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-21T00:00:00Z

本研究探讨了机器生成文本与人类撰写文本的辨识问题,并首次举办了学术论文真实性挑战。研究定义了任务、构建了数据集并建立了评估框架,参与团队展示了创新方法,最佳系统在英语和阿拉伯语上的F1分数超过0.98,显示出检测技术的显著进展。

GenAI Content Detection Task 2: AI vs. Human - Academic Paper Authenticity Challenge

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-24T00:00:00Z

本研究介绍了Advacheck团队开发的系统,旨在区分机器生成文本与人类写作文本。该系统采用共享的Transformer编码器的多任务架构,在测试集上实现了83.07%的宏观F1分数,超越基线10%,显示出多任务学习的优势。

Application of Advacheck in GenAI Detection Task 1: Domain-Aware Multi-Task AI Detection

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-18T00:00:00Z

本文提出了“Beemo”基准,旨在解决多作者场景下机器生成文本的评估问题。研究发现,专家编辑的文本更难被识别为机器生成,从而提高了评估的准确性和可靠性。

Beemo: A Benchmark for Expert-Edited Machine-Generated Outputs

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-06T00:00:00Z

本文介绍了两种新型机器生成文本检测方法DetectLLM-LRR和DetectLLM-NPR,均在准确性上优于现有技术。评估结果显示,CopyLeaks检测器最为准确,GPTKit有效减少假阳性,GLTR则展现出较强的鲁棒性。研究强调了提升检测器鲁棒性和适应性的必要性,并提出了基于参考文本的Synthetic-Siamese检测器,显著提升了检测性能。

DetectRL:在现实场景中基准测试LLM生成文本检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

本文探讨了水印技术在鉴别机器生成文本中的有效性,强调其在复杂样本中的可靠性。研究指出,水印的质量、大小和防篡改性是关键指标。尽管现有技术可用,但仍需改进以应对水印窃取和移除攻击。通过引入双层签名方案,研究提升了源头追踪能力,显示出水印技术在检测和防范欺骗攻击中的潜力。

发现伪造大型语言模型水印的线索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

本文介绍了多个语言处理项目,如古腾堡语料库、WinoGrande数据集和Samanantar平行语料库,探讨了机器生成文本的检测方法及其在文学研究中的应用。AuthentiGPT被提出用于区分机器与人类文本,显示出在学术环境中的有效性。此外,研究分析了不同语言的语料库体裁分布及其与经济发展的关系。

首字母隐藏者:多语言语料库中的首字母识别与排序的概率方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-08T00:00:00Z

本文讨论了SemEval-2024任务8,重点在于多生成器、多领域和多语言的机器生成文本检测。研究结合RoBERTa-base嵌入和多样性特征,达到了91%的准确率。通过引入M4GT-Bench基准,解决了识别机器生成文本与人类文本的挑战,展示了多种模型的有效性和适用性。

Sharif-MGTD 在 SemEval-2024 任务 8 中的应用:一种基于 Transformer 的机器生成文本检测方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-16T00:00:00Z

本文介绍了在SemEval2024任务8中检测机器生成文本的方法,包括统计、神经网络和预训练模型。研究表明,基于变压器的模型在多语言环境中表现优异,准确率达到86.9%。同时,指出了未来研究中的挑战,特别是在句法方面的改进空间。通过对比学习和数据增强,提出了一种单一模型,性能与多模型相当。

追踪文本起源的 RoBERTa-BiLSTM 方法: Mast Kalandar 在 SemEval-2024 任务 8 中探测生成的 AI 文本

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-03T00:00:00Z

近期,大型语言模型(LLMs)在文本生成方面表现出色,但也容易被滥用。研究提出了一种高效的自动检测方法,通过集成多个LLM的预测,提升了对机器生成文本的识别能力。实验结果显示,该方法在多个数据集上性能显著提升,具备良好的泛化能力。

应用集成方法进行模型无关的机器生成文本检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-18T00:00:00Z

本文探讨了黑匣子攻击对机器生成文本检测器的影响,提出了多种攻击方法及其对检测系统的挑战。研究表明,现有检测器的鲁棒性不足,亟需开发更强大的检测技术,以应对AI生成文本的滥用和虚假信息传播问题。

利用同形异义字规避 AI 生成的内容检测器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-17T00:00:00Z

RADAR框架通过对抗训练显著提升了AI文本检测能力,尤其在改写任务中表现优异。研究表明,大型语言模型更倾向于修改人类文本而非AI生成文本。我们提出的Raidar方法提高了现有检测模型的准确性,适用于多种文本类型,并展示了机器生成文本的独特特征。

RAID:用于机器生成文本检测器鲁棒评估的共享基准测试

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-13T00:00:00Z

SemEval-2024任务8聚焦于多语言和领域的机器生成文本检测。研究采用传统机器学习和基于大型语言模型的方法,LoRA-RoBERTa模型在多语言环境中的准确率分别为86.9%和83.7%。此外,提出了新的基准数据集MULTITuDE,涵盖11种语言,评估检测器的泛化能力。研究指出未来改进的空间和挑战。

SemEval-2024 任务 8:多领域、多模型和多语种机器生成文本检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-22T00:00:00Z

本文介绍了在SemEval2024任务8中检测机器生成文本的方法,包括统计、神经网络和预训练模型。研究表明,在单语和多语境下的准确率分别为86.9%和83.7%。提出了一种基于RoBERTa的新方法,超越了人类准确度,并强调了对混合文本的检测需求。研究还探讨了大型语言模型生成文本的检测技术现状及未来方向,呼吁加强相关研究以实现负责任的人工智能。

TM-TREK 参加 SemEval-2024 任务 8:面向基于 LLM 的人机混合文本自动边界检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-01T00:00:00Z

SemEval-2024任务8聚焦于多语言和领域的机器生成文本检测。研究表明,使用变压器模型(如LoRA-RoBERTa)和对比学习方法,能够有效区分人工与机器生成文本。我们的最佳方法在多个子任务中取得了高准确率,并通过新系统T5LLMCipher提升了F1得分,强调了未来研究的挑战与重要性。

AISPACE 在 SemEval-2024 任务 8 上:用于检测多生成器机器生成文本的类平衡软投票系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-01T00:00:00Z

AuthentiGPT是一个有效的分类器,用于区分机器生成的和人类编写的文本。它通过添加人工噪声并比较去噪后的文本与原始文本,利用黑盒LLM来消除噪声,判断内容是否为机器生成。AuthentiGPT具有0.918 AUROC分数,显示其在检测机器生成文本方面的有效性和潜力。

仅十个词仍然有所帮助:通过代理引导的高效再采样改进黑盒 AI 生成文本检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-14T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码