小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

内网威胁检测面临挑战,因攻击者拥有合法访问权限。新加坡管理大学推出Chimera系统,利用大语言模型模拟正常与恶意员工行为,解决数据不足问题。ChimeraLog数据集包含250亿条日志,支持多种企业场景,提升检测模型有效性,为安全团队提供真实数据,缩小实验室与现实的差距。

新型AI工具如何革新内网威胁防御测试体系

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2025-08-24T22:00:15Z
Vercel BotID增强伪造硬件检测

Vercel的BotID更新了检测模型,增强了对定制无头浏览器和伪造硬件的指纹识别能力。作为一种隐形CAPTCHA,BotID能在不干扰真实用户的情况下识别复杂机器人。新模型实时提高了对自动化框架的识别准确性,用户无需操作即可生效,建议升级到botid@1.5.2版本。

Vercel BotID增强伪造硬件检测

Vercel News
Vercel News · 2025-08-15T13:00:00Z
使用Keras和Python进行假新闻检测

在数字时代,假新闻成为一种威胁。为应对这一问题,作者利用TensorFlow和自然语言处理技术构建了假新闻检测模型。该模型通过深度学习有效分类新闻的真实性,能够准确区分真假新闻。

使用Keras和Python进行假新闻检测

DEV Community
DEV Community · 2025-05-23T07:56:55Z

本研究探讨重放攻击对音频深伪造检测的影响。通过不同扬声器和麦克风播放及重新录制深伪音频,伪造样本在检测模型中表现得更为真实。引入ReplayDF数据集,分析六个开源检测模型的脆弱性,发现顶级模型的错误率从4.7%上升至18.2%。

Replay Attacks on Audio Deepfake Detection

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

本研究提出了一种基于符合性分割的钢材表面缺陷检测模型,有效解决了人工检测效率低和成本高的问题,同时提高了自动检测的可靠性和实用性。

Conformity Segmentation and Statistical Assurance in Industrial Surface Defect Detection

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-24T00:00:00Z

本研究提出了欺骗性幽默数据集(DHD),旨在探讨虚假主张中的幽默,揭示幽默与欺骗之间的关系,推动欺骗性幽默检测模型的发展。

欺骗性幽默:一个桥接虚假主张与幽默内容的多语言基准数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-20T00:00:00Z

本研究提出了Wildflare GuardRail护栏管道,旨在提升大型语言模型推理的安全性和可靠性。研究表明,基于小型数据集构建的安全检测模型与OpenAI API的性能相当,且轻量级包装器能够以100%准确率处理恶意网址,从而显著提高推理的安全性。

Bridging the Safety Gap: A Guardrail Pipeline for Trustworthy Large Language Model Inferences

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-12T00:00:00Z
ACM Computing Surveys | 港大等基于可靠性视角的深度伪造检测综述,覆盖主流基准库、模型

AIxiv专栏促进了学术交流,报道了2000多篇深度伪造研究。近期综述分析了深度伪造检测模型的可靠性,提出迁移性、可解释性和鲁棒性三大挑战,强调模型在实际应用中的重要性。研究者需提升模型综合性能,以保护个人隐私。

ACM Computing Surveys | 港大等基于可靠性视角的深度伪造检测综述,覆盖主流基准库、模型

机器之心
机器之心 · 2025-01-12T09:07:40Z
从概念到影响:我的金融欺诈检测模型之旅

本文介绍了开发动态金融欺诈检测模型的过程。通过生成合成数据、特征工程和机器学习,构建了一个识别可疑交易的系统。使用Python生成100万条交易数据,并利用规则和XGBoost模型进行训练,最终实现高效的欺诈检测。该系统具备适应性,能够根据反馈持续更新,以应对新型欺诈手段。

从概念到影响:我的金融欺诈检测模型之旅

DEV Community
DEV Community · 2024-12-21T10:06:20Z

本研究提出了一种自学习的多模态假新闻检测模型,旨在解决社交媒体上的假新闻传播问题。该模型结合文本和图像特征,通过对比学习方法,无需标记数据,分类精度超过85%。

A Self-Learning Multimodal Approach for Fake News Detection

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-08T00:00:00Z

本文研究文本到图像生成模型在生成人类图像时的伪影问题,尤其是身体异常。通过创建大型人类伪影数据集(HAD)并训练检测模型(HADM),研究表明该模型能够有效识别和定位伪影,从而提高图像质量。

Detecting Human Artifacts from Text-to-Image Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-21T00:00:00Z

本研究解决了语音基础的帕金森病检测模型可解释性不足的问题,评估了多种可解释性方法以识别特有的语音特征,支持临床决策。尽管结果一致,但专家提供的信息仍显不足。

The Effectiveness of Explainability Methods in Voice Detection of Parkinson's Disease

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-12T00:00:00Z

本研究探讨了仇恨言论检测模型在定义与实际行为之间的差距,提出了三步流程DefVerify,以编码用户定义、量化模型反映程度并识别失效点。研究发现,当前模型与定义存在显著差距,强调了改进模型构建的重要性。

DefVerify: Do Hate Speech Models Reflect the Definitions of Their Datasets?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z

该研究分析了多种仇恨言论检测模型,发现数据类型和标注标准比模型架构更重要。提出的DeepHate模型在检测仇恨言论方面优于现有技术,并通过改进的LSTM架构提高分类性能。HateCOT数据集的引入显著提升了预训练模型在检测有害内容的能力,尤其在低资源情况下表现突出。

SWE2:子词丰富且重视显著词的仇恨言论检测框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-25T00:00:00Z

本文探讨了深度伪造检测模型的构建,介绍了WildDeepfake和FakeAVCeleb等数据集在检测中的应用,强调了多模态检测的重要性,提出了提高检测性能的新方法和技术,并指出了深度伪造技术带来的安全隐患及未来研究方向。

1M深度伪造检测挑战

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-11T00:00:00Z

本文提出多种基于深度学习的检测模型,涵盖铁路组件、个人防护装备和道路损伤等领域。这些模型结合了卷积神经网络和注意力机制,在准确性和鲁棒性上表现优异,推动了自动化损坏检测系统的发展,提升了建筑行业的安全合规性。

Improved YOLOv5 for Target Detection of Personal Protective Equipment

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-12T00:00:00Z

本文提出了一个框架,用于评估机器生成内容的对抗性攻击对检测模型的影响。研究表明,现有模型在短时间内容易被误判为人类文本,尽管有一定的鲁棒性提升,但在实际应用中仍面临挑战,强调了对更准确检测方法的需求。

面向文本感知推荐系统的对抗性文本改写

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-01T00:00:00Z

该研究提出了一种高性能的机器学习模型,专门用于检测钓鱼邮件,F1得分高达0.99。模型结合可解释的人工智能,提供实时应用程序,帮助用户识别钓鱼邮件。通过分析4000多封钓鱼邮件,采用人工神经网络算法,实验显示检测准确度可达97%至99%。研究还探讨了AI生成钓鱼邮件的识别,强调在训练中需考虑此类邮件以应对未来攻击。

事件响应人员的电子邮件归档、处理和标记系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-01T00:00:00Z

司机疲劳驾驶是交通事故的主要原因之一。研究提出了一种多关注融合疲劳驾驶检测模型(MAF),在低光照和面部遮挡条件下,准确率达到96.8%。此外,研究还介绍了多任务学习架构,结合视觉和机器学习方法,提高智能车辆的驾驶行为监测能力,确保安全。

驾驶员疲劳检测和人脸识别的多任务学习通过树状空间 - 通道注意力融合网络

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-13T00:00:00Z

社交媒体平台上有害内容传播问题严重,现有检测模型泛化能力不足。研究提出了一种跨平台仇恨言论检测模型,通过分解输入特征和学习因果关系来提升检测效果。实验结果表明,该模型在多个平台上优于现有技术,能够有效识别仇恨言论。

弱监督因果解离下的跨平台仇恨言论检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-17T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码