小红花·文摘

本研究提出了FinePhys框架，通过物理法则实现细粒度人类动作生成，显著提高了复杂体操动作的自然性和可信性。

FinePhys: Fine-grained Human Action Generation through Explicit Incorporation of Physical Laws for Effective Skeletal Guidance

BriefGPT - AI 论文速递 ·

本研究评估了深度学习模型在大陆尺度水质预测中的可信性挑战，重点关注公平性、不确定性和可解释性。通过分析482个美国流域的水质数据，揭示了模型性能差异的系统模式，并提出了评估可信性的方法框架，为水资源管理中的数据驱动方法提供了重要见解。

深度学习模型在大陆尺度水质预测中的可信性挑战识别

BriefGPT - AI 论文速递 ·

本研究探讨了在社会人工智能设计与交互中应用人类关系规范，以提升人机合作效果。研究强调，制定适当的关系规范对确保人机互动的伦理性和可信性至关重要。

Relational Norms for Human-AI Cooperation

BriefGPT - AI 论文速递 ·

本研究提出了一个评估大型语言模型透明性和可信性的框架，采用人类推理一致性等四个指标。结果显示，LIME方法在多个模型中表现优异，人类推理一致性得分高达0.9685。

评估基于编码器的语言模型的可解释人工智能技术的有效性

BriefGPT - AI 论文速递 ·

本研究探讨了大型语言模型（LLMs）在生成可靠输出时面临的挑战，并提出将形式方法（FMs）与LLMs结合的新策略，以提升模型的可信性和工具的效率。这一融合有望变革可信AI软件系统的开发。

A Roadmap for Building Trustworthy AI Agents through the Fusion of Large Language Models and Formal Methods

BriefGPT - AI 论文速递 ·

本文探讨了在移动设备上结合通信效率与差分隐私的分布式随机梯度下降算法，提出了多种新方法以提升隐私保护和抗攻击能力。研究表明，这些算法在多分类逻辑回归和卷积神经网络训练中表现优异，尤其在隐私保障和模型性能方面超越现有方法。

分布式学习中随机梯度下降的可信性

BriefGPT - AI 论文速递 ·

本研究评估了8个语言模型在风险评估中的表现，发现GPT-4得分为72.29%，而人类得分为89.38%。引入风险描述显著提升了模型性能。此外，研究提出了TrustAgent框架，旨在提高大型语言模型代理的安全性，并通过多种基准测试评估其在复杂任务中的能力，发现其在高风险环境中的表现仍不足，为未来研究提供了新见解。

ST-WebAgentBench：评估网络代理安全性和可信性的基准

BriefGPT - AI 论文速递 ·

大型语言模型（LLM）在医疗领域的应用越来越普遍，能够帮助医生解答问题和做出决策。然而，LLM生成的误导信息难以检测，可能带来更大风险。研究指出在医疗中使用LLM时需关注安全性和可信性，呼吁加强验证机制和管理措施，以确保其可靠性。

等等，泰诺是对乙酰氨基酚……调查和改善语言模型抵制误导性信息请求的能力

BriefGPT - AI 论文速递 ·

本研究提出了一个统一框架来评估RAG系统的可信性，并为提高其在实际应用中的可信性提供了实用见解和未来研究的挑战。

检索增强生成系统的可信性研究

BriefGPT - AI 论文速递 ·

本文介绍了多种基于大型语言模型（LLM）的代理框架，旨在提升文本游戏中的推理和决策能力。研究表明，结合图形表示和外部思考器模块的创新方法能有效改善代理表现，尤其在复杂游戏环境中。实验验证显示，该框架在推理、语音生成和在线游戏评估方面具有优越性，并贡献了大型社交推理游戏数据集。

图检索增强的可信性推理

BriefGPT - AI 论文速递 ·

本文探讨了大型语言模型（LLMs）在知识获取和对齐技术中的应用，强调提高模型可信度和可解释性的必要性，尤其是在法律和医学等高风险领域。研究指出，关注事实准确性和安全性至关重要，未来应重视伦理、公平性和透明度，以确保LLMs更好地服务于人类。

通过上下文感知基础提高大型语言模型的可靠性：一种系统方法以确保可信性和真实性

BriefGPT - AI 论文速递 ·

本文综述了深度伪造技术的生成与检测方法，分析了深度学习在该领域的应用及其局限性。强调了研究深度伪造检测技术的重要性，以应对其对社会的负面影响，并确保数字媒体的可信性。研究表明，现有检测方法易受深度伪造视频干扰，未来需发展更有效的检测模型。

超越深度伪造图像：检测人工智能生成的视频

BriefGPT - AI 论文速递 ·

Iveta Lohovska谈生成性人工智能与向量搜索 | Qdrant

Qdrant - Vector Database ·

本研究介绍了DriveSceneGen，一种基于真实驾驶数据生成动态驾驶场景的方法，具有高保真度和多样性。GenAD模型通过大量视频数据增强自动驾驶的泛化能力，并在未见过的数据集上表现优越。此外，文章回顾了合成数据集生成方法的演变及其在自动驾驶中的应用，强调了可信性和安全性的重要性。

SubjectDrive：通过主体控制在自动驾驶中扩大生成数据规模

BriefGPT - AI 论文速递 ·

本文介绍了一个名为NeuralSentinel（NS）的工具，用于验证人工智能模型的可靠性和可信度，并帮助非专业人员增强对该系统的信心。该工具在一个黑客马拉松活动中使用，评估皮肤癌检测器的可靠性，并学习出导致模型错误分类的最重要因素和最有效的技术。同时，该工具还检测了NS的局限性并收集了反馈以进行改进。

神经哨兵：保护神经网络的可靠性和可信性

BriefGPT - AI 论文速递 ·