小红花·文摘

在线教程丨32K上下文一次解析数十页文档，百度开源Unlimited OCR，重构长文档复杂场景

HyperAI超神经 ·

该研究提出了一种名为VersionSeek的隐蔽软件版本识别方法，基于功能性变更分析软件更新的功能差异，设计探测请求以提高识别准确率。实验结果表明，该方法在识别率和数据包发送量上均优于传统技术，成功识别了240,020个软件实例，揭示了用户面临的安全威胁。

复旦大学、清华大学等 | 超越漏洞扫描：一种功能性变更驱动的远程软件版本识别方法

FreeBuf网络安全行业门户 ·

语音搜索错误纠正的音素增强判别重评分

Apple Machine Learning Research ·

本研究探讨了文本数据中的说话者识别问题，提出了一种基于大型预训练模型的模糊指纹方法。通过整合说话者特定令牌和上下文建模，显著提高了识别准确率，并在多个数据集上表现优越，为文本基础的说话者识别提供了重要见解。

Speaker Fuzzy Fingerprints: Benchmarking Text-Based Identification in Multiparty Dialogues

BriefGPT - AI 论文速递 ·

本研究提出了一种名为MaxGlaViT的轻量级视觉转换器模型，用于青光眼的早期诊断。该模型通过优化网络架构和引入注意机制，实现了92.03%的识别准确率，显示出在青光眼早期检测中的巨大潜力。

MaxGlaViT: A Novel Lightweight Vision Transformer-Based Approach for Early Diagnosis of Glaucoma Stages from Fundus Images

BriefGPT - AI 论文速递 ·

研究显示，ChatGPT重度用户在识别AI生成文本方面表现出色，准确率达到76%

DEV Community ·

本研究提出了一种隐私保护人脸识别（PPFR）方法，解决了黑箱模型推广和对抗学习的影响。通过扰动全局特征和增强局部特征，识别准确率达到94.21%，在隐私保护和抗重构能力上优于现有方法。

Combining Local Features and Random Anonymization: A Revolutionary Privacy-Preserving Face Recognition Black Box Model

BriefGPT - AI 论文速递 ·

本研究提出了均衡损失（EQL v2）、选择性物体对比学习（SoCo）和针对性监督对比学习（TSC）等新方法，以解决长尾目标检测中的不平衡问题。实验结果表明，这些方法在多个数据集上显著提升了模型的识别准确率和泛化能力，尤其在稀有类别上表现突出。

长尾物体检测预训练：动态重平衡对比学习与双重重建

BriefGPT - AI 论文速递 ·

本研究提出了两种新方法，从桌面录音中提取用户行为，分别为直接帧基和差分帧基。结果表明，直接帧基方法的识别准确率达到70%至80%，并可通过机器人流程自动化重放，显示出良好的应用潜力。

Sharingan: Extracting User Action Sequences from Desktop Recordings

BriefGPT - AI 论文速递 ·

Prompt Engineering是为AI对话设计提示词，以确保AI准确理解用户需求。该过程包括明确目标、设计提示词、优化测试和处理意外情况。随着AI技术的发展，Prompt Engineering逐渐成熟，广泛应用于各领域，如京东物流通过不同提示词提高商品件型判断的准确率。

AI对话魔法｜Prompt Engineering 探索指南

京东科技开发者 ·

本研究提出了一种新方法QCS，利用交叉相似性注意力机制和四分支循环框架，解决面部表情识别中的类间相似性和类内变异性问题。该方法有效提取同类特征，去除冗余特征，显著提高识别准确率，并在多个数据集上超越现有技术。

QCS: Facial Expression Recognition Based on Quadruplet Cross Similarity Feature Refinement

BriefGPT - AI 论文速递 ·

本文探讨了通过模仿灵长类动物的视觉系统和引入物理学概念，提升人工神经网络对抗攻击的鲁棒性。研究表明，改进网络结构和激活层可以提高识别准确率，增强对敌对扰动的抵抗能力，使人工智能更接近人类的视觉识别模式。

Object Recognition Model with Limited but Consistent Improvement in Adversarial Robustness through Joint Training with Human EEG

BriefGPT - AI 论文速递 ·

本研究探讨了视频生成过程中的先验知识是否适用于视频识别，并提出了GenRec，这是一种将生成与识别联合优化的统一框架。GenRec通过随机帧条件过程实现了显著的表现，在信息有限的情况下，其识别准确率达到75.8%和87.2%，展示了其在视频生成和识别任务中的潜在影响力。

在线教程丨32K上下文一次解析数十页文档，百度开源Unlimited OCR，重构长文档复杂场景

复旦大学、清华大学等 | 超越漏洞扫描：一种功能性变更驱动的远程软件版本识别方法

语音搜索错误纠正的音素增强判别重评分

Speaker Fuzzy Fingerprints: Benchmarking Text-Based Identification in Multiparty Dialogues

MaxGlaViT: A Novel Lightweight Vision Transformer-Based Approach for Early Diagnosis of Glaucoma Stages from Fundus Images

研究显示，ChatGPT重度用户在识别AI生成文本方面表现出色，准确率达到76%

Combining Local Features and Random Anonymization: A Revolutionary Privacy-Preserving Face Recognition Black Box Model

长尾物体检测预训练：动态重平衡对比学习与双重重建

Sharingan: Extracting User Action Sequences from Desktop Recordings

AI对话魔法｜Prompt Engineering 探索指南

QCS: Facial Expression Recognition Based on Quadruplet Cross Similarity Feature Refinement

Object Recognition Model with Limited but Consistent Improvement in Adversarial Robustness through Joint Training with Human EEG

GenRec：使用扩散模型统一视频生成与识别

BAUST Lipi: 基于深度学习的孟加拉手语识别的BdSL数据集

基于先进深度学习的三流混合模型动态手势识别

入选ACL 2024！引入零样本学习，华中科大发布针对甲骨文破译优化的条件扩散模型

Qalam：阿拉伯光学字符和手写识别的多模式语言模型

支付宝医疗大模型亮相！中英文考试超GPT-4，已落地江浙沪一线医院

从类别到风景：一个用于视频中多人人物 - 物体交互识别的端到端框架

CM2-Net: 司机动作识别的持续跨模态映射网络