小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
上下文修剪:在不损失质量的情况下减少LLM令牌

上下文修剪是从大型语言模型(LLM)输入中去除低价值内容,以降低成本并提高输出质量。它属于提示压缩,旨在减少输入长度和提高处理效率。修剪方法包括标记级、句子级和基于注意力的修剪。研究表明,适度修剪可以改善LLM性能,尤其与语义缓存结合使用时效果更佳。

上下文修剪:在不损失质量的情况下减少LLM令牌

Redis Blog
Redis Blog · 2026-05-09T00:00:00Z

为确保与vLLM的最佳兼容性,使用在特定提交后更新的Kimi K2模型。文章讨论了Kimi K2模型在vLLM上的调试过程,解决了三大兼容性问题,显著提高了工具调用成功率,并通过与Kimi团队的合作实现了性能改善。

追求100%准确性:深入探讨Kimi K2在vLLM上的工具调用调试

vLLM Blog
vLLM Blog · 2025-10-28T00:00:00Z

Kindle 阅读器最新固件版本为 5.18.5.0.1,更新内容包括性能改善和问题修复。越狱用户需谨慎更新,以免失效。固件适用于多款 Kindle 设备,用户可手动下载更新文件,更新后需重新安装插件。

[2025.10.01] Kindle 阅读器固件升级至 5.18.5.0.1

书伴
书伴 · 2025-10-01T15:56:06Z

Kindle最新固件版本为5.19.2,升级前需注意越狱可能失效。此次更新包含性能改善和问题修复,支持多款Kindle设备。用户可手动下载固件以避免等待自动升级。

[2025.08.19] Kindle 阅读器固件升级至 5.18.4.0.1

书伴
书伴 · 2025-08-19T13:25:32Z

Kindle 阅读器最新固件版本为 5.18.4,适用于多款设备。更新内容包括性能改善和问题修复,特别是 Kindle Scribe 支持多语言手写识别。越狱设备在升级时需注意可能导致越狱失效,建议在升级前安装最新的 JailBreak Hotfix。固件可通过 WiFi 自动更新或手动下载。

[2025.07.30] Kindle 阅读器固件升级至 5.18.4

书伴
书伴 · 2025-07-30T15:42:06Z

本研究探讨了多语言模型重标定对表现不佳语言的影响,提出AlignFreeze方法,通过冻结模型层的上半部分或下半部分,避免性能下降。研究表明,冻结下层能有效改善某些语言的词性标注效果。

AlignFreeze: Navigating the Impact of Layer Realignment in Multilingual Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-18T00:00:00Z

本研究介绍了多个针对性别偏见的指代消解数据集和方法,包括WinoBias、GAP和Counter-GAP,旨在消除自然语言处理中的性别刻板印象。研究表明,通过数据增强和新模型,指代消解系统的性能在性别平衡的数据集上显著改善。

重新审视英语Winogender范式的一致性、覆盖率和语法性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-09T00:00:00Z

上周,我们的RDS遇到了严重的问题,CPU使用率急剧上升,导致系统严重受损,影响了客户。经过调查,我们确定低效的SQL查询是主要原因之一。我们采取了五个关键措施来改善性能:1.确定问题的根源;2.有效使用索引;3.优化连接;4.限制数据检索;5.实施查询缓存。同时,我们还优化了数据库设计,通过添加读取副本来平衡负载和提高性能。

如何将CPU使用率降低20%:5个有效的SQL优化技巧

DEV Community
DEV Community · 2024-08-25T04:10:02Z

大视觉语言模型(LVLMs)在生成与视觉输入相关内容时常出现物体幻觉问题。本文提出了一种名为视觉对比解码(VCD)的方法,通过对比原始和失真的视觉输入,显著降低幻觉影响,确保生成内容的准确性。实验表明,VCD无需额外训练,能有效改善LVLM的性能和可靠性。

ConVis:对比解码与幻觉可视化以减轻多模态大型语言模型中的幻觉

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-25T00:00:00Z
Elastic Stack 8.14.3 发布

Elastic发布了8.14.3版本,建议用户升级以改善性能。此版本修复了apm-server的性能回归和企业搜索节点的自动缩减逻辑。

Elastic Stack 8.14.3 发布

Elastic Blog - Elasticsearch, Kibana, and ELK Stack
Elastic Blog - Elasticsearch, Kibana, and ELK Stack · 2024-07-11T00:00:00Z

构建公平的深度神经网络是实现可信的人工智能的关键步骤。研究发现深度神经网络内部的几何特征对公平性有影响。提出了内在维度正则化(IDR)的方法,减轻模型偏见并改善性能。

揭示和减缓 DNNs 的一般偏差通过感知流形的内在维度

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-22T00:00:00Z
大语言模型是否“贪婪”?激励提示效果的实验分析($0 至 $100 万)[译]

给GPT-4 Turbo提供小费可能有效,但小费数额关键。实验发现,提供$0.1和$100万美元的小费,性能改善幅度分别是-27%到+57%。需要更多实验验证不同类型的提示对性能的影响。实验结果显示,随着奖励金额增加,AI的质量和代码量呈上升趋势,但关系并不简单。小额打赏可能带来正面影响,但金额很小时模型表现反而更差。人类行为模式可能通过调整原始模型解释。

大语言模型是否“贪婪”?激励提示效果的实验分析($0 至 $100 万)[译]

宝玉的分享
宝玉的分享 · 2024-01-31T17:47:00Z

本文提出了一种新颖的自动图像上色网络(AIAIC),通过利用音频的额外语义信息,实现音频引导的上色。实验表明音频引导能够有效改善自动着色的性能。

通过利用音频场景语义实现自动图像着色

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-24T00:00:00Z

设计深度神经网络分类器是机器学习研究的活跃领域,而回归问题仍相对未经探索。研究者通过分析最小二乘回归的敏感性,提出了一种改善神经回归模型性能的方法。该方法在合成数据集和真实数据集上表现良好。

应用于强化学习的纠正误指的回归中减轻协变量变化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-22T00:00:00Z

该文介绍了一种新颖的长尾增强图对比学习(LAGCL)方法,通过引入可学习的长尾增强方法来增强尾节点,并基于增强的图生成对比视图,显著改善了推荐系统的性能。

增强型长尾图对比学习推荐

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-20T00:00:00Z

本研究评估了混合型数据增强方法在生理时间序列分类中的性能,发现其能显著改善数据集性能,且不需要专业知识或大量参数调整。同时总结了混合型增强方法的独特属性,并强调在生理时间序列数据中使用混合型增强方法的潜在益处。

生理时间序列数据中基于混合的数据增强方法的实证研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-18T00:00:00Z
Node.js 20现已发布!

Node.js 20发布,新增权限模型、同步import.meta.resolve和稳定的测试运行器等功能。权限模型提升了文件系统访问的安全性。V8引擎更新至11.3,性能显著改善。Node.js 20将于10月进入长期支持,鼓励用户测试新特性并规划升级。

Node.js 20现已发布!

Node.js Blog
Node.js Blog · 2023-04-18T15:45:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码