小红花·文摘

我的首次开源贡献：为CLI项目添加令牌使用功能

DEV Community ·

如何通过简单的RAG增强大型语言模型

The New Stack ·

本文提出了一种新的端到端框架，用于解码Large Language Models（LLMs）中隐藏的事实知识，并使用时间性知识图表达其在各层中的演化，以实现对LLMs的机理解释。通过解释性分析，揭示了LLMs中存在的潜在错误和事实知识的演化模式，为LLMs的机理解释迈出了一步。

从 LLMs 中提取事件序列解释的潜在逻辑树

BriefGPT - AI 论文速递 ·

本研究使用Large Language Models (LLMs)探究了使用LLMs进行人轨迹预测的可能性。通过生成物体过去/观察到的轨迹中的运动线索，并利用混合高斯聚类未来轨迹中的运动线索。采用基于Transformer的体系结构，展示了在行人轨迹预测基准数据集上的有效性，并进行了多个消融实验验证方法。

G2LTraj：用于轨迹预测的全局到局部生成方法

BriefGPT - AI 论文速递 ·

Branch-Train-MiX (BTX)是一种新的混合专家模型架构，旨在提高大型语言模型（LLMs）在多个领域中的性能。它由两个阶段组成：分支训练，其中多个专家模型在不同的数据集上并行训练，以及MiX，其中这些专家模型的前馈参数混合到一个混合专家（MoE）层中。BTX相比其他方法显示出更好的性能和计算效率，使其成为在各个领域训练LLMs的有希望的方法。

Branch-Train-MiX: 可以大幅度降低训练成本的新型混合专家模型架构

六虎 ·

研究人员揭示了Differential Privacy（DP）技术在处理Large Language Models（LLMs）时的权衡隐私和泛化关系。他们提出了一个框架来强制执行适当的权重平坦度，以提高模型的泛化能力并保持隐私保护。

通过平坦性实现大型语言模型的隐私保护微调

BriefGPT - AI 论文速递 ·

研究提出了Tree-of-Experts (ToE)方法，用于增强Winograd Schema Challenge中问题的生成。通过引入新的数据集WSC+，包含3,026个由Large Language Models生成的句子，对模型过度自信与偏见提供了更深入洞察。分析发现，LLMs在评估自己生成的问题时表现不佳，GPT-4在WSC+上的准确率为68.7%，明显低于人类基准的95.1%。

WSC+: 基于专家树的增强 Winograd Schema 挑战

BriefGPT - AI 论文速递 ·

本研究调查了Large Language Models（LLMs）中存在的内容限制和潜在误用的挑战，以及与破解LLMs相关的三个关键问题。研究发现了10种不同模式和三种破解提示类别，并评估了ChatGPT版本3.5和4.0中破解提示的能力。研究强调了提示结构在破解LLMs中的重要性，并讨论了生成和防止鲁棒破解提示的挑战。

如何请求决定一切：针对越狱攻击的简单黑盒方法

BriefGPT - AI 论文速递 ·

本研究调查了Large Language Models（LLMs）中的内容限制和潜在误用的挑战，并研究了与破解LLMs相关的三个关键问题。研究发现了10种不同模式和三种破解提示类别，并评估了ChatGPT版本3.5和4.0中破解提示的能力。研究强调了提示结构在破解LLMs中的重要性，并讨论了生成和防止鲁棒破解提示的挑战。

改变提示的蝴蝶效应：小的变化与越狱对大型语言模型的影响

BriefGPT - AI 论文速递 ·

研究者设计了一种基于Large Language Models (LLMs)的自主推荐代理系统RecMind，通过利用外部知识工具和个人数据，以及提出的Self-Inspiring算法来改善规划能力，实现了准确的个性化推荐。实验证明RecMind在多种推荐场景下表现优异，超过了现有的零/少样本LLM-based推荐方法，并与最近的预训练模型P5达到了竞争性的性能。

推荐 AI 代理：整合大型语言模型进行交互式推荐

BriefGPT - AI 论文速递 ·