内网威胁检测面临挑战,因攻击者拥有合法访问权限。新加坡管理大学推出Chimera系统,利用大语言模型模拟正常与恶意员工行为,解决数据不足问题。ChimeraLog数据集包含250亿条日志,支持多种企业场景,提升检测模型有效性,为安全团队提供真实数据,缩小实验室与现实的差距。
Vercel的BotID更新了检测模型,增强了对定制无头浏览器和伪造硬件的指纹识别能力。作为一种隐形CAPTCHA,BotID能在不干扰真实用户的情况下识别复杂机器人。新模型实时提高了对自动化框架的识别准确性,用户无需操作即可生效,建议升级到botid@1.5.2版本。
在数字时代,假新闻成为一种威胁。为应对这一问题,作者利用TensorFlow和自然语言处理技术构建了假新闻检测模型。该模型通过深度学习有效分类新闻的真实性,能够准确区分真假新闻。
本研究探讨重放攻击对音频深伪造检测的影响。通过不同扬声器和麦克风播放及重新录制深伪音频,伪造样本在检测模型中表现得更为真实。引入ReplayDF数据集,分析六个开源检测模型的脆弱性,发现顶级模型的错误率从4.7%上升至18.2%。
本研究提出了一种基于符合性分割的钢材表面缺陷检测模型,有效解决了人工检测效率低和成本高的问题,同时提高了自动检测的可靠性和实用性。
本研究提出了欺骗性幽默数据集(DHD),旨在探讨虚假主张中的幽默,揭示幽默与欺骗之间的关系,推动欺骗性幽默检测模型的发展。
本研究提出了Wildflare GuardRail护栏管道,旨在提升大型语言模型推理的安全性和可靠性。研究表明,基于小型数据集构建的安全检测模型与OpenAI API的性能相当,且轻量级包装器能够以100%准确率处理恶意网址,从而显著提高推理的安全性。
AIxiv专栏促进了学术交流,报道了2000多篇深度伪造研究。近期综述分析了深度伪造检测模型的可靠性,提出迁移性、可解释性和鲁棒性三大挑战,强调模型在实际应用中的重要性。研究者需提升模型综合性能,以保护个人隐私。
本文介绍了开发动态金融欺诈检测模型的过程。通过生成合成数据、特征工程和机器学习,构建了一个识别可疑交易的系统。使用Python生成100万条交易数据,并利用规则和XGBoost模型进行训练,最终实现高效的欺诈检测。该系统具备适应性,能够根据反馈持续更新,以应对新型欺诈手段。
本研究提出了一种自学习的多模态假新闻检测模型,旨在解决社交媒体上的假新闻传播问题。该模型结合文本和图像特征,通过对比学习方法,无需标记数据,分类精度超过85%。
本文研究文本到图像生成模型在生成人类图像时的伪影问题,尤其是身体异常。通过创建大型人类伪影数据集(HAD)并训练检测模型(HADM),研究表明该模型能够有效识别和定位伪影,从而提高图像质量。
本研究提出了一种新型假新闻检测模型CSDA,利用因果子结构提取和对比学习,显著提升了社交媒体假新闻的检测准确性,实验结果显示准确率提高了7至16个百分点。
本研究解决了语音基础的帕金森病检测模型可解释性不足的问题,评估了多种可解释性方法以识别特有的语音特征,支持临床决策。尽管结果一致,但专家提供的信息仍显不足。
本文提出了一个框架,旨在通过对抗性攻击微调机器生成内容以规避检测。研究表明,现有检测模型在10秒内可被攻破,导致误判机器文本为人类撰写。尽管模型的鲁棒性有所提高,实际应用仍面临挑战,凸显了对更准确检测方法的需求。
研究分析仇恨言论检测模型在定义与实际应用间的差距,提出DefVerify流程:编码用户定义、量化模型反映、识别失效点。结果显示模型与定义差距大,需改进模型构建。
本研究使用CARLA模拟器创建了DCI数据集,分析了三个检测模型在三种物理对抗攻击下的表现,指出对抗攻击算法可能已接近其极限。研究强调对抗攻击在实际环境中的重要性,DCI数据集为提高检测模型的鲁棒性提供了见解,并为未来研究提供指导。
本研究提出了一种新方法来解决工业生产中的表面缺陷检测挑战,通过结合高阶建模能力和检测模型,提高了困难目标的分类和定位效果。实验结果显示该方法在多个工业数据集上表现出竞争力,为缺陷检测提供了新思路。
本文提出了一个针对对抗性攻击的框架,通过对动态场景中的对抗性学习来评估检测模型的鲁棒性。实证结果发现,现有的检测模型可以在10秒内受到破坏。这些发现为AI文本检测器的未来发展提供了启示。
本文提出了一种用于高海拔环境中钢丝绳无损损伤检测的新算法,包括分割模型和检测模型,能够准确提取钢丝绳并区分正常和异常。实验证明该算法在钢丝绳图像数据集上有显著改进,达到了高准确率和F-measure值。
本文介绍了一种使用GPT-4进行提示工程辅助的恶意软件动态分析方法,通过为每个API调用创建说明性文本并利用BERT获取文本表示,从而获得API序列的表示。设计了一种基于CNN的检测模型,在五个基准数据集上验证了其性能优于TextCNN。在跨数据库实验和少样本学习实验中,该模型表现出良好的检测性能,并几乎达到100%的恶意软件召回率,证实了其卓越的泛化性能。
完成下面两步后,将自动完成登录并继续当前操作。