小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
解构大型语言模型的偏见

研究发现,大型语言模型(LLMs)倾向于重视文档或对话的开头和结尾信息,忽视中间部分,这种“位置偏见”影响信息检索的准确性。麻省理工学院的研究者探讨了这一现象的机制,认为模型设计和训练数据导致了位置偏见。他们提出的理论框架可用于诊断和修正这一问题,从而提升模型在长对话和复杂任务中的表现。

解构大型语言模型的偏见

MIT News - Computer Science and Artificial Intelligence Laboratory (CSAIL)
MIT News - Computer Science and Artificial Intelligence Laboratory (CSAIL) · 2025-06-17T20:00:00Z

本研究探讨深度神经网络在视频理解中的应用,提出关注时空特征的新方法,回顾模型发展趋势与结构设计,推动视频理解的进步。

增强视频理解:用于时空分析的深度神经网络

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-11T00:00:00Z

本研究开发了一个中文为中心的开源大语言模型,解决了现有模型在中文处理中的不足,强调透明度,分享了数据收集、模型设计和训练方法,结果显示该模型在多个基准上表现优越。

钢铁大语言模型:从零起步到开源——构建以中文为中心的语言模型的个人旅程

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-10T00:00:00Z

本研究提出了一种新框架,用于评估生成语言模型在任务级输出选择中的解码效率,显示候选选择方法在多样化任务中的优势,为未来模型设计提供了重要见解。

从日志推断:探索无解码生成候选选择的最佳实践

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-28T00:00:00Z

本研究分析了三种设计不同但性能相似的轨迹预测模型的泛化能力。结果表明,归纳偏差最低的小模型在多种数据增强策略下表现最佳,对轨迹预测模型设计具有重要意义。

超越内分布性能:一项关于轨迹预测鲁棒性的跨数据集研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-27T00:00:00Z

本研究提出了一个统一框架,强调序列模型应具备联想记忆能力,以推动更强大的序列模型设计。

测试时间回归:设计具有联想记忆的序列模型的统一框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-21T00:00:00Z

本研究分析了变压器架构中自注意力与全连接层的逻辑关系,发现自注意力机制能够执行逻辑操作,值得进一步研究,可能影响未来模型设计。

Is the Logical Analysis of Transformers Performed in Self-Attention or in the Fully Connected Part?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-20T00:00:00Z

本研究探讨了专家混合模型在计算机视觉中的应用,发现适度的激活参数能提升图像分类效果,过度则会导致效果下降,强调模型设计需保持平衡。

图像分类中的专家混合:最佳平衡点是什么?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-27T00:00:00Z

本研究提出了一种高效框架,解决了MOOCs在个性化学习路径上的不足。通过强化学习预训练,显著提升了数据效率,为个性化学习模型设计提供了新视角。

基于图的预训练模型用于教育文档的自适应排序

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-18T00:00:00Z
Django开发者的会计指南:实现会计账簿

本文介绍了如何使用Django Admin构建会计系统,包括日记账、总账和试算表的实现。通过结合会计概念与编程,开发者能更好地理解会计术语。教程涵盖模型设计、数据验证和单元测试,旨在构建一个健壮的会计系统。

Django开发者的会计指南:实现会计账簿

DEV Community
DEV Community · 2024-11-09T00:54:35Z

本文通过为特定激活函数的科尔莫哥洛夫-阿诺德网络(KAN)建立泛化界限,解决了理论分析不足的问题。这些界限在保证性能的同时,适用于不同的回归损失函数,为科学任务中的模型设计提供理论支持。

Generalization Bounds and Model Complexity of Kolmogorov-Arnold Networks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-10T00:00:00Z

大型语言模型与图表示学习的结合促进了复杂数据分析的发展。研究提出了一种新分类法,分析其核心组成和操作技术,分为知识提取和整理两部分,并探讨集成和训练策略。研究揭示了有效模型设计,并指出未来研究方向。

基于大型语言模型的可解释图表示学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-02T00:00:00Z

本研究提出了思维图示(DoT)框架,解决了大语言模型(LLMs)推理的线性化表示问题。通过将推理建模为有向无环图(DAG),DoT允许在保持逻辑一致性的同时探索复杂的推理路径,提升了推理能力和训练效率,为下一代专注推理的模型设计提供了基础。

思维图示

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-16T00:00:00Z

深度学习在人工智能领域占主导地位,但在轻量设备上部署受限。调查报告提供设计指导,介绍轻量模型设计、压缩和硬件加速策略,以克服硬件限制,不影响模型准确性。未来关注TinyML和大型语言模型的部署技术,带来挑战,鼓励研究未开拓领域。

Deeploy: 实现小型语言模型在异构微控制器上的能效部署

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-08T00:00:00Z
结合差分隐私的端到端语音识别联邦学习

本文介绍了将差分隐私应用于联邦学习的自动语音识别任务的新方法。作者通过模型设计和数据异质性等因素的探索,建立了FL with DP的ASR基准,并成功对抗了差分隐私噪声对模型训练的不利影响。在用户级别上,他们实现了(7.2,10^-9)-DP和(4.5,10^-9)-DP,并在ASR中取得了较低的词错误率。

结合差分隐私的端到端语音识别联邦学习

Apple Machine Learning Research
Apple Machine Learning Research · 2024-07-24T00:00:00Z

对称性在深度学习中是一种高效的模型设计方法。研究发现等变函数无法针对单个数据样本进行对称性打破,提出了一种新的“放松等变性”的概念来规避这一限制。进一步讨论了对称性打破在不同应用领域的相关性。

近似等变神经过程

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-19T00:00:00Z

该研究引入了隐私保护语言模型(PPLM),通过注入特定领域知识来保护数据隐私。研究提供了模型设计理论分析,并介绍了语料库整理、训练损失和微调等技术。实验证实了该方法的有效性,特别是正负样本指令微调。该研究突显了大型语言模型作为隐私保护学习器的潜力。

大型语言模型对齐的隐私保护指令

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-21T00:00:00Z

研究人员创造了一个用于基础视觉聊天的数据集,并提出了一种模型设计来支持各种类型的视觉提示。实验结果表明,该模型在基准测试中表现优秀。

多轮多模态指称及锚定

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-24T00:00:00Z

QM是一款基于模型设计和自动代码生成的软件工具,将软件分解为事件驱动组件模块,并以图形方式设计与这些组件相关联的分层状态机。QM具有简单、内置QP框架和捕捉物理设计等特点,能够生成高质量的代码并灵活控制源代码结构。设计目标是尊重设计决策、简化状态图绘制并引入新的表示法来表示内部转换。

QP实时嵌入式框架之QM

良许Linux教程网
良许Linux教程网 · 2024-01-20T12:46:32Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码