小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
RVPO:通过方差正则化实现风险敏感的对齐

本文提出了一种风险敏感的奖励方差优化框架(RVPO),旨在解决多目标奖励聚合中的约束忽视问题。RVPO通过惩罚奖励间的方差,优化模型的一致性,从而在医疗和科学推理任务中提高表现。实验结果表明,RVPO在HealthBench上显著优于传统方法,并在保持准确性的同时,避免了多奖励方法的性能下降。

RVPO:通过方差正则化实现风险敏感的对齐

Apple Machine Learning Research
Apple Machine Learning Research · 2026-05-08T00:00:00Z

本研究提出了一种基于大型语言模型(LLM)的优化框架,能够自动重构代码以应对硬件设计的挑战。实验结果表明,该模型在成功率、效率和设计质量上优于传统LLM,为硬件设计提供了新的视角。

Can Inference Models Reason About Hardware? An Active High-Level Synthesis Perspective

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-17T00:00:00Z
REVOLVE:响应演化驱动的智能优化框架,破解传统AI优化瓶颈

iDreamer旨在激发科研热情,支持教授和学生追求卓越。REVOLVE是一种新优化框架,通过历史响应相似度提升大语言模型性能,解决复杂任务中的局部最优问题,展现出显著的适应性和效率。

REVOLVE:响应演化驱动的智能优化框架,破解传统AI优化瓶颈

机器之心
机器之心 · 2025-03-04T03:00:00Z

本研究提出了两个新的二元数据原型分析优化框架,克服了现有方法对连续数据的局限,显著提升了模型在合成和真实二元数据上的表现。

二元数据的原型分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-06T00:00:00Z

本研究提出了一种自适应熵感知优化框架(AEO),用于多模态开放集测试时的适应(MM-OSTTA)。该框架通过优化未知类别样本的自适应熵和模态预测差异,提升了在线适应性能,展现出在长时间场景中的强大适应能力,具有广泛的应用潜力。

Towards Robust Multimodal Open-set Test-time Adaptation via Adaptive Entropy-aware Optimization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-23T00:00:00Z

本研究提出了一种新的零阶邻近梯度算法,旨在解决现有算法在处理非平滑问题时计算量大的问题。通过构建两个通用的优化框架,显著提高了算法在非凸和凸问题上的表现,优化了查询复杂度,提升了机器学习中的优化效率。

Obtaining Lower Query Complexities through Lightweight Zeroth-Order Proximal Gradient Algorithms

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

本文介绍了一种无需训练的图像生成优化框架,速度比传统方法快1000~10000倍,效果更佳。研究涵盖文本到图像合成、用户素描图生成及高效局部微调等技术,提出了PhotoVerse和MaxFusion等创新方法,显著提升了图像生成的质量和控制能力。

生成性照片拼贴

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-13T00:00:00Z

本文提出了一种结合模型强化学习和目标识别的框架,解决了目标识别中的手动设计和在线计算问题,展示了在标准和嘈杂环境中的优异性能。研究探讨了基于两层分层强化学习的任务解决方法和高效的在线目标识别技术,强调了数据驱动方法和优化框架在真实场景中的应用效果。

ODGR:在线动态目标识别

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-23T00:00:00Z

本研究提出多种去偏见方法,利用辅助模型、优化框架和对比学习等技术,旨在减轻机器学习中的社会偏见。实验结果表明,这些方法在准确性和去偏成本上优于现有技术,尤其在处理特定子群体和图像分类器偏见方面表现突出。

使用 Datamodels(D3M)进行数据去偏:通过数据选择提高子群体鲁棒性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-24T00:00:00Z

本文探讨了通过反馈机制和搜索机制提高多步推理模型的准确性,提出了一种基于奖励模型的启发式贪婪搜索算法,展示了其在数学推理和代码生成任务中的优越性。同时,研究介绍了迭代经验优化框架,强调经验消除和不同优化模式对模型性能的影响,并提出了新颖的混合代理方法以提升规划性能,探讨了奖励机制对语言模型逻辑推理能力的优化。

每步严密观察!通过迭代的步骤级过程优化学习的 LLM Agent

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-17T00:00:00Z

本研究提出了一种优化框架,用于在商业微控制器上端到端部署 Transformer 模型,以降低延迟和能耗。通过分析模型架构瓶颈、硬件设计影响及调度挑战,应用于开源 DNN 加速器,推理速度提升最高可达 88.7 倍,并探讨了多种推断技术,以支持高效的深度学习应用。

在一个开源的 RISC-V 多微核平台上优化基础模型推理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-29T00:00:00Z

本文探讨了提高大型语言模型鲁棒性的方法,包括Jacobian正则化、预训练模型微调及其在自然语言处理任务中的应用。研究表明,使用ELECTRA编码、温度调节和Focal Loss可以有效减少校准误差。此外,提出了基于Bregman的优化框架和Frobenius规范化的后处理方法,以提升模型的稳定性和对抗攻击的表现。

从健壮性到预训练语言模型的改进泛化和校准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-31T00:00:00Z

本研究利用元表面技术对薄膜光学进行光学特性的灵活操控,提出了一种替代优化框架来开发适用于天文高对比度成像的两种旋涡相位面具。通过计算智能技术进行优化,有效地将所需的模拟次数减少了 75%。

神经刻印:使用 “实 2 虚” 学习的光刻模拟器,弥合计算光学中的设计到制造差距

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-29T00:00:00Z

本文介绍了一种新型的变分方法——变分Renyi界限(VR),通过参数化散度的Alpha值,实现了从证据下限到对数似然的平滑插值。实验证明了VR界限在贝叶斯神经网络和变分自编码器上的广泛适用性。

重新参数化的变分拒绝抽样

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-26T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码