小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Kimi于2026年4月21日发布了K2.6,专注于长周期编程,具备在复杂工程中持续工作和自我优化的能力。K2.6在模型推理和金融引擎优化方面表现出显著的性能提升,企业反馈强调其可靠性和精准性。其开源特性使开发者能够本地部署,降低了开发门槛,推动了国产模型在Agent领域的进步。这标志着AI编程工具的选择将更加注重适用场景。

Kimi K2.6 开源了,国产模型开始抢「长周期编程」高地

dotNET跨平台
dotNET跨平台 · 2026-04-25T00:09:04Z
零侵入、极简适配!飞桨CINN实现类CUDA硬件“即插即用”

飞桨推出插件式CUDA兼容硬件接入方案,模型推理速度提升2.2倍。通过C接口实现CINN编译器与硬件解耦,支持动态注册,降低适配成本,促进国产芯片融入AI生态。

零侵入、极简适配!飞桨CINN实现类CUDA硬件“即插即用”

百度大脑
百度大脑 · 2026-04-03T11:00:10Z

COMI团队提出了一种新型长文本压缩方法,通过边际信息增益(MIG)优化相关性与多样性,解决了高压缩率下性能下降的问题。在32倍压缩下,该方法显著提升了模型推理能力,确保多样化信息的保留,推动了大模型的轻量化与实用化。

32倍压缩率下性能反超25个点!破解长文本压缩「翻车」难题 | ICLR 2026

量子位
量子位 · 2026-02-23T04:48:46Z

PPIO近日获得InfoQ 2025年度AI基础设施卓越奖,因其在分布式算力调度和模型推理加速方面的技术贡献。该奖项旨在表彰在AI创新和产业落地中表现突出的企业。PPIO通过整合多款开源模型和自研技术,提升Agent开发效率,推动AI行业发展。

PPIO荣获InfoQ2025 年度 AI 基础设施卓越奖

量子位
量子位 · 2025-12-25T05:58:38Z
通过MLX和M5 GPU中的神经加速器探索大型语言模型

Apple硅芯片的Mac在AI开发者中越来越受欢迎,MLX框架使得在Mac上高效运行大型语言模型成为可能。MLX支持神经网络的训练和推理,利用M5芯片的神经加速器提升性能,提供更快的模型推理体验,支持Python、Swift及C/C++等多种语言的简单安装和使用。

通过MLX和M5 GPU中的神经加速器探索大型语言模型

Apple Machine Learning Research
Apple Machine Learning Research · 2025-11-19T00:00:00Z
快速构建自定义 OpenCV 算法:可视化节点编辑器直观友好 | 开源日报 No.750

flash-linear-attention 是一个高效的线性注意力模型集合,支持多平台运行,集成多种最新模型,优化内存消耗,便于扩展和部署。PaperVision 提供用户友好的节点编辑器,适合计算机视觉算法实验。UniswapX 是无 Gas 费用的 ERC20 交换协议,提升交易效率。mpt-30B-inference 支持在 CPU 上运行 MPT-30B 模型推理,推荐使用 Docker 和 Python 3.10。

快速构建自定义 OpenCV 算法:可视化节点编辑器直观友好 | 开源日报 No.750

开源服务指南
开源服务指南 · 2025-10-06T07:35:48Z
提示词工程概述

提示词工程是构建AI应用的基础,连接人类意图与大语言模型。它包括结构设计、工程流程和输出塑形,分为结构层、方法层和输出层。提示词由任务描述、行为规约和输出约束组成,影响模型推理。工程流程包括试运行、评估和优化,推动其向多模态和智能体扩展。

提示词工程概述

云原生
云原生 · 2025-09-25T10:15:36Z
从零构建检索增强生成系统:提升大型语言模型的知识获取能力 | 开源日报 No.686

ai-cookbook 是一个开源项目,提供构建人工智能系统的示例和教程,包括可复制代码。rag-from-scratch 旨在帮助理解检索增强生成技术,提升模型推理能力。hack-together-dotnet 鼓励开发者构建云原生和 AI 应用,并提供微软专家指导。games 是 Flutter 游戏工具包,包含多种休闲游戏模板。onepixel_backend 是一个 API URL 缩短器。

从零构建检索增强生成系统:提升大型语言模型的知识获取能力 | 开源日报 No.686

开源服务指南
开源服务指南 · 2025-08-04T07:35:31Z
寻找远程工作的理想公司: 半远程到全远程科技企业一览 | 开源日报 No.682

remote-jobs 是一个汇总支持远程工作的科技公司列表,帮助求职者寻找合适职位。amazon-q-developer-cli 是一个命令行工具,用于自然语言应用开发。awesome-entra 收集了 Microsoft Entra 相关资源。GPTFast 加速 Hugging Face 模型推理,JettonGramGpuMiner 用于挖掘 GRAM 代币。

寻找远程工作的理想公司: 半远程到全远程科技企业一览 | 开源日报 No.682

开源服务指南
开源服务指南 · 2025-08-01T07:35:34Z

本文介绍了如何为机器学习应用程序实现用户管理和身份验证系统,以确保安全性。通过创建用户和分配访问权限,管理员能够有效管理用户访问,降低安全风险。应用程序基于FastAPI框架,支持API密钥认证,允许用户进行模型推理。设计包括用户创建、删除功能及模型信息访问,确保安全性和可扩展性。

通过身份验证和用户管理确保机器学习应用程序的安全性

KDnuggets
KDnuggets · 2025-05-05T16:00:17Z
教程:使用谷歌云Cloud Run进行GPU加速的无服务器推理

谷歌云为Cloud Run无服务器平台推出GPU支持,助力开发者加速模型推理。本文介绍如何在GPU基础的Cloud Run上部署Llama 3.1大语言模型,步骤包括环境初始化、部署TGI模型服务器和推理测试。

教程:使用谷歌云Cloud Run进行GPU加速的无服务器推理

The New Stack
The New Stack · 2025-04-18T13:00:21Z

华为开发者空间推出DeepSeek-R1(昇腾满血版),利用昇腾算力和强化学习技术提升模型推理能力,支持多轮对话和复杂逻辑推理。开发者可一键调用大模型,快速构建应用,平台提供实战场景和完整项目源码,助力技术成长。

【重磅来袭】DeepSeek-R1昇腾满血版入驻华为开发者空间!互动体验,瓜分福利!

华为云官方博客
华为云官方博客 · 2025-04-10T02:50:34Z

本研究探讨了深度学习模型推理过程中的不一致性和错误,提出了新的检测和测量方法,并介绍了针对训练数据偏见的采样和合成数据生成技术,以提升模型在复杂任务中的表现,增强其鲁棒性、公平性和可解释性。

Reasoning Inconsistencies in Deep Learning and Their Mitigation Methods

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-03T00:00:00Z
理解RAG第八部分:减轻RAG中的幻觉

在RAG系统中,幻觉问题依然存在,尽管通过检索外部信息有所减少。幻觉的原因包括数据错误和缺乏上下文细节。为减轻幻觉,需要确保数据质量、优化检索技术和改进模型推理。策略包括严格筛选数据、优化上下文和微调模型,以提高生成响应的准确性和可靠性。

理解RAG第八部分:减轻RAG中的幻觉

MachineLearningMastery.com
MachineLearningMastery.com · 2025-03-20T10:00:13Z

本研究提出了一种新框架,通过推理拓扑量化大型语言模型解释中的不确定性。该框架设计了结构化引导策略,使模型能够将答案解释转化为图拓扑,从而在语义和推理路径上量化不确定性,为理解模型推理提供了系统化的方法。

Understanding the Uncertainty of LLM Explanations: A Perspective Based on Reasoning Topology

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-24T00:00:00Z
不要让你的大型语言模型产生幻觉——看看这些提示规则和方法!

本文介绍了提升提示效果的关键方法,包括结构化文本、分解复杂请求、引导模型推理和组合响应。结构化提示有助于模型理解任务,分解请求提高准确性,逐步引导模型思考可获得更可靠的答案。

不要让你的大型语言模型产生幻觉——看看这些提示规则和方法!

DEV Community
DEV Community · 2025-02-23T16:12:46Z

本文介绍了如何使用Unsloth库对DeepSeek模型进行微调,包括安装库、加载模型、应用LoRA适配器、准备数据集、格式化提示、配置训练器及训练过程。最后,提供了模型推理和保存步骤,并强调了微调大型语言模型的最佳实践。

如何针对您的自定义数据集逐步微调DeepSeek-R1

KDnuggets
KDnuggets · 2025-02-03T15:00:49Z

清华团队提出新型强化学习方法PRIME,仅用1万元和8张A100显卡,训练出超越GPT-4o的7B模型Eurus-2-7B-PRIME。该方法通过隐式过程奖励解决了奖励稀疏问题,显著提升模型推理能力,未来有望推动更强模型的训练。

仅需一万块钱!清华团队靠强化学习让7B模型数学打败GPT-4o

量子位
量子位 · 2025-01-07T01:47:15Z

本研究提出了HashAttention,一种提高长上下文注意力计算效率的方法。HashAttention通过将关键token识别视为推荐问题,实现了$32 imes$的稀疏性,显著提升了模型推理速度,具有重要的实际应用潜力。

HashAttention: Semantic Sparsity for Faster Inference

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-19T00:00:00Z

本文探讨了从强化学习角度重现OpenAI o1的方法,分析了策略初始化、奖励设计、搜索与学习等关键组成部分。研究表明,合理的策略和奖励设计能显著提升模型的推理能力,推动o1及大型语言模型的发展。

Scaling of Search and Learning: A Roadmap to Reproduce o1 from a Reinforcement Learning Perspective

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码