小红花·文摘 - 小红花技术领袖俱乐部

Qdrant在吞吐量上提高了2倍，延迟降低了50%，计算资源减少到1/3，超越了Elastic的DiskBBQ

Qdrant在吞吐量上提高了2倍，延迟降低了50%，计算资源减少到1/3，超越了Elastic的DiskBBQ

Qdrant - Vector Database ·

Spring AI动态工具发现：省下75% token消耗

Spring AI动态工具发现：省下75% token消耗

极道 ·

突破传统限制：OxygenREC--一个基于指令跟随的“快慢思考“电商生成式推荐框架

突破传统限制：OxygenREC--一个基于指令跟随的“快慢思考“电商生成式推荐框架

京东科技开发者 ·

OpenAI通过Fluent Bit优化回收了30,000个CPU核心

OpenAI通过Fluent Bit优化回收了30,000个CPU核心

The New Stack ·

打破‘无共享’瓶颈：一种NoSQL范式

打破‘无共享’瓶颈：一种NoSQL范式

The New Stack ·

本研究针对机器学习服务中的隐私问题，提出了一种基于密码技术的私密变压器推理方法，以保护用户数据和模型隐私，并回顾了相关进展与挑战。研究表明，该方法能有效平衡资源效率与隐私保护。

机器学习即服务中的私密变压器推理：综述

BriefGPT - AI 论文速递 ·

本研究通过QLoRA微调的LLM与检索增强生成技术，提高医疗决策支持系统的准确性和资源效率，同时关注患者隐私与数据安全。

Lightweight Clinical Decision Support System Based on QLoRA Fine-tuned LLM and Retrieval-Augmented Generation

BriefGPT - AI 论文速递 ·

Llama-Nemotron：2.5倍速度提升的AI推理，保持准确性

Llama-Nemotron：2.5倍速度提升的AI推理，保持准确性

DEV Community ·

组件与容器：对抗吗？

组件与容器：对抗吗？

Cloud Native Computing Foundation ·

监控重要指标：可扩展系统的实用警报设计

监控重要指标：可扩展系统的实用警报设计

DEV Community ·

科技行业可持续项目管理的崛起

科技行业可持续项目管理的崛起

DEV Community ·

该研究提出了一种基于层次决策结构的强化学习规划方案（HAM-PPO），旨在优化精准农业中的生物胁迫管理。结果表明，该方法在作物产量恢复和资源利用效率方面显著优于传统方法。

优化精准农业中的导航和化学施用：基于深度强化学习和条件行为树的方法

BriefGPT - AI 论文速递 ·

本文探讨了基于CORDIC的激活函数设计，以满足资源受限系统的需求，促进神经网络加速。介绍的DA-VINCI激活函数为多种AI工作负载提供动态可配置和精度可调的解决方案，显著提升DNN、RNN/LSTM和Transformer的资源效率与质量，NEURIC计算单元展示了98.5%的结果质量。

A Review of Configurable Activation Functions Based on CORDIC in Neural Network Applications

BriefGPT - AI 论文速递 ·

LLM测试的演变：最佳实践与挑战

LLM测试的演变：最佳实践与挑战

DEV Community ·

为DeepSeek MoE模型带来「免费午餐」加速，专家链可大幅提升LLM的信息处理能力

为DeepSeek MoE模型带来「免费午餐」加速，专家链可大幅提升LLM的信息处理能力

机器之心 ·

利用联邦学习开发去中心化的人工智能模型

利用联邦学习开发去中心化的人工智能模型

DEV Community ·

FitLight提出了一种新颖的联邦模仿学习框架，旨在解决基于强化学习的交通信号控制方法在实际应用中的高学习成本和泛化能力差的问题。该框架支持在各种交通环境中即插即用，显著提高了控制策略的收敛速度和资源使用效率。

FitLight: Federated Imitation Learning for Plug-and-Play Autonomous Traffic Signal Control

BriefGPT - AI 论文速递 ·

本研究探讨了大型语言模型（LLM）中文本生成解码策略对GPU能耗的影响，强调了解码技术和超参数选择对文本质量和资源利用的影响，以及优化资源效率与文本质量之间的平衡。

节能意识的LLM解码：文本生成策略对GPU能耗的影响

BriefGPT - AI 论文速递 ·

介绍Fluid计算

介绍Fluid计算

Vercel News ·

Python支持函数内并发公测

Python支持函数内并发公测

Vercel News ·