小红花·文摘

开源AI检测器实测：你刷的热榜网文三成不对劲

极道 ·

内网威胁检测面临挑战，因攻击者拥有合法访问权限。新加坡管理大学推出Chimera系统，利用大语言模型模拟正常与恶意员工行为，解决数据不足问题。ChimeraLog数据集包含250亿条日志，支持多种企业场景，提升检测模型有效性，为安全团队提供真实数据，缩小实验室与现实的差距。

新型AI工具如何革新内网威胁防御测试体系

FreeBuf网络安全行业门户 ·

Vercel BotID增强伪造硬件检测

Vercel News ·

使用Keras和Python进行假新闻检测

DEV Community ·

本研究探讨重放攻击对音频深伪造检测的影响。通过不同扬声器和麦克风播放及重新录制深伪音频，伪造样本在检测模型中表现得更为真实。引入ReplayDF数据集，分析六个开源检测模型的脆弱性，发现顶级模型的错误率从4.7%上升至18.2%。

Replay Attacks on Audio Deepfake Detection

BriefGPT - AI 论文速递 ·

本研究提出了一种基于符合性分割的钢材表面缺陷检测模型，有效解决了人工检测效率低和成本高的问题，同时提高了自动检测的可靠性和实用性。

Conformity Segmentation and Statistical Assurance in Industrial Surface Defect Detection

BriefGPT - AI 论文速递 ·

本研究提出了欺骗性幽默数据集（DHD），旨在探讨虚假主张中的幽默，揭示幽默与欺骗之间的关系，推动欺骗性幽默检测模型的发展。

欺骗性幽默：一个桥接虚假主张与幽默内容的多语言基准数据集

BriefGPT - AI 论文速递 ·

本研究提出了Wildflare GuardRail护栏管道，旨在提升大型语言模型推理的安全性和可靠性。研究表明，基于小型数据集构建的安全检测模型与OpenAI API的性能相当，且轻量级包装器能够以100%准确率处理恶意网址，从而显著提高推理的安全性。

Bridging the Safety Gap: A Guardrail Pipeline for Trustworthy Large Language Model Inferences

BriefGPT - AI 论文速递 ·

ACM Computing Surveys | 港大等基于可靠性视角的深度伪造检测综述，覆盖主流基准库、模型

机器之心 ·

从概念到影响：我的金融欺诈检测模型之旅

DEV Community ·

本研究提出了一种自学习的多模态假新闻检测模型，旨在解决社交媒体上的假新闻传播问题。该模型结合文本和图像特征，通过对比学习方法，无需标记数据，分类精度超过85%。

A Self-Learning Multimodal Approach for Fake News Detection

BriefGPT - AI 论文速递 ·

本文研究文本到图像生成模型在生成人类图像时的伪影问题，尤其是身体异常。通过创建大型人类伪影数据集（HAD）并训练检测模型（HADM），研究表明该模型能够有效识别和定位伪影，从而提高图像质量。

Detecting Human Artifacts from Text-to-Image Models

BriefGPT - AI 论文速递 ·

本研究解决了语音基础的帕金森病检测模型可解释性不足的问题，评估了多种可解释性方法以识别特有的语音特征，支持临床决策。尽管结果一致，但专家提供的信息仍显不足。

The Effectiveness of Explainability Methods in Voice Detection of Parkinson's Disease

BriefGPT - AI 论文速递 ·

本研究探讨了仇恨言论检测模型在定义与实际行为之间的差距，提出了三步流程DefVerify，以编码用户定义、量化模型反映程度并识别失效点。研究发现，当前模型与定义存在显著差距，强调了改进模型构建的重要性。

DefVerify: Do Hate Speech Models Reflect the Definitions of Their Datasets?

BriefGPT - AI 论文速递 ·

该研究分析了多种仇恨言论检测模型，发现数据类型和标注标准比模型架构更重要。提出的DeepHate模型在检测仇恨言论方面优于现有技术，并通过改进的LSTM架构提高分类性能。HateCOT数据集的引入显著提升了预训练模型在检测有害内容的能力，尤其在低资源情况下表现突出。

SWE2：子词丰富且重视显著词的仇恨言论检测框架

BriefGPT - AI 论文速递 ·

本文探讨了深度伪造检测模型的构建，介绍了WildDeepfake和FakeAVCeleb等数据集在检测中的应用，强调了多模态检测的重要性，提出了提高检测性能的新方法和技术，并指出了深度伪造技术带来的安全隐患及未来研究方向。

1M深度伪造检测挑战

BriefGPT - AI 论文速递 ·

本文提出多种基于深度学习的检测模型，涵盖铁路组件、个人防护装备和道路损伤等领域。这些模型结合了卷积神经网络和注意力机制，在准确性和鲁棒性上表现优异，推动了自动化损坏检测系统的发展，提升了建筑行业的安全合规性。

Improved YOLOv5 for Target Detection of Personal Protective Equipment

BriefGPT - AI 论文速递 ·

本文提出了一个框架，用于评估机器生成内容的对抗性攻击对检测模型的影响。研究表明，现有模型在短时间内容易被误判为人类文本，尽管有一定的鲁棒性提升，但在实际应用中仍面临挑战，强调了对更准确检测方法的需求。

面向文本感知推荐系统的对抗性文本改写

BriefGPT - AI 论文速递 ·

该研究提出了一种高性能的机器学习模型，专门用于检测钓鱼邮件，F1得分高达0.99。模型结合可解释的人工智能，提供实时应用程序，帮助用户识别钓鱼邮件。通过分析4000多封钓鱼邮件，采用人工神经网络算法，实验显示检测准确度可达97%至99%。研究还探讨了AI生成钓鱼邮件的识别，强调在训练中需考虑此类邮件以应对未来攻击。

事件响应人员的电子邮件归档、处理和标记系统

BriefGPT - AI 论文速递 ·

司机疲劳驾驶是交通事故的主要原因之一。研究提出了一种多关注融合疲劳驾驶检测模型（MAF），在低光照和面部遮挡条件下，准确率达到96.8%。此外，研究还介绍了多任务学习架构，结合视觉和机器学习方法，提高智能车辆的驾驶行为监测能力，确保安全。

驾驶员疲劳检测和人脸识别的多任务学习通过树状空间 - 通道注意力融合网络

BriefGPT - AI 论文速递 ·