StreamBridge：将您的离线视频大语言模型转变为主动流媒体助手

We present StreamBridge, a simple yet effective framework that seamlessly transforms offline Video-LLMs into streaming-capable models. It addresses two fundamental challenges in adapting existing...

StreamBridge是一个有效的框架，将离线视频大语言模型转化为流媒体模型，解决了多轮实时理解不足和缺乏主动响应的问题。通过记忆缓冲和轻量激活模型，StreamBridge构建了Stream-IT数据集，显著提升了离线视频模型的流媒体理解能力，超越了GPT-4o和Gemini 1.5 Pro等专有模型。

StreamBridge 大语言模型实时理解数据集流媒体模型记忆缓冲

原文英文，约200词，阅读约需1分钟。发表于：。

阅读原文

分享给好友

小型模型，大影响：为什么JetBrains看好聚焦型大语言模型

At AI Summit London 2025, Kris Kang, Head of Product for AI at JetBrains, gave a talk that questioned a common belief in AI development: that bigger means better. The industry has focused heavily...

在2025年伦敦AI峰会上，JetBrains的Kris Kang提出小型聚焦模型，强调其在降低成本和能耗方面的优势。这些模型专注于特定领域，性能优越，适合企业应用。JetBrains推出的Mellum模型专为代码开发设计，支持多种编程语言，旨在提升开发效率，为AI的可持续发展提供新方案。

Mellum模型 jetbrains 大语言模型小型聚焦模型开发效率成本能耗

原文英文，约900词，阅读约需3分钟。发表于：。

阅读原文

分享给好友

在 openSUSE Tumbleweed 上使用 Ollama 运行本地大语言模型

本文为社区投稿作品翻译。在本地计算机上运行大型语言模型（LLM）正变得越来越流行，它能提供隐私保护、离线访问和自定义功能。Ollama 是一款出色的工具，可以简化本地下载、设置和运行 LLM 的流程。它以强大的 llama.cpp 作为后端，支持在各种硬件上高效推理。本指南将介绍如何在 openSUSE Tumbleweed 上安装 Ollama，并解释...

本文介绍了如何在 openSUSE Tumbleweed 上安装和使用 Ollama 工具，以便本地运行大型语言模型（LLM）。Ollama 简化了下载和设置过程，支持多种硬件，用户可通过简单命令运行模型，并利用 Modelfile 自定义配置。

Ollama openSUSE Tumbleweed 大型语言模型大语言模型安装配置

在 openSUSE Tumbleweed 上使用 Ollama 运行本地大语言模型

原文中文，约2800字，阅读约需7分钟。发表于：。

阅读原文

分享给好友

利用大语言模型与 RAG 架构构建智能化 Support Case 问答系统

1. 引言在云计算环境中，快速响应和解决客户问题至关重要。亚马逊云科技技术支持案例是客户与亚马逊云科技支持团 […]

本文介绍了如何利用大语言模型（LLM）自动化处理亚马逊云科技的技术支持案例，并将内容导入Dify知识库，构建基于RAG的支持机器人。目标是提升响应速度、知识积累和新员工培训效率，未来将优化模型并扩展功能。

RAG 大语言模型技术支持知识库自动化

原文中文，约5700字，阅读约需14分钟。发表于：。

阅读原文

分享给好友

大语言模型（LLM）到底是怎么运作的？（配图通俗讲解）

* LLM本质上是学习单词序列的条件概率。 * 每次预测下一个单词时，会根据已出现的上下文计算条件概率。 * 使用温度（Temperature）是为了控制生成结果的多样性和创造性。

条件概率是指在已知某事件发生的情况下，另一个事件发生的概率。大语言模型（LLM）通过学习单词序列的条件概率来预测下一个单词，并通过温度调节生成内容的多样性与创造性。

llm 单词序列大语言模型条件概率温度调节预测

原文中文，约1200字，阅读约需3分钟。发表于：。

阅读原文

分享给好友

DeepSeek-R1 API：大语言模型接口详解

近年来，大型语言模型（LLM）在自然语言处理（NLP）领域取得了突破性进展，DeepSeek 推出的 DeepSeek-R1 API 凭借其强大的推理能力、高效的性能以及开源特性，迅速成为开发者关注的焦点。 DeepSeek-R1 API：大语言模型接口详解最先出现在APISpace。

DeepSeek-R1 API 是一款高性能的大型语言模型，支持文本生成、代码辅助和知识问答等多种自然语言处理任务，具备长上下文支持和多语言能力，适合开发者快速构建智能应用。

DeepSeek-R1 api 多语言能力大语言模型接口文本生成自然语言处理语言模型

原文中文，约2600字，阅读约需7分钟。发表于：。

阅读原文

分享给好友

你的模型是否公平地自信？面向不确定性的公平性评估方法用于大语言模型

The recent rapid adoption of large language models (LLMs) highlights the critical need for benchmarking their fairness. Conventional fairness metrics, which focus on discrete accuracy-based...

近期大语言模型（LLMs）的普及凸显了公平性基准的重要性。传统公平性指标未能有效捕捉模型的不确定性影响。为此，我们提出了UCerF指标，以更细致地评估模型公平性。同时，我们创建了一个包含31,756个样本的新性别-职业公平性评估数据集。通过该基准评估十个开源LLMs的表现，发现Mistral-7B在不正确预测中表现出高自信，UCerF能够捕捉到这一点。我们的基准为开发更透明的AI系统奠定了基础。

Mistral-7B UCerF指标公平性基准大语言模型性别-职业评估

原文英文，约200词，阅读约需1分钟。发表于：。

阅读原文

分享给好友

大语言模型随意猜测网址引发网络安全危机

AI乱猜网址34%出错，竟直接推荐钓鱼网站。

最新研究表明，AI生成的网址中有34%与品牌不符，部分链接指向钓鱼网站。专家建议企业告知客户可信网址以防钓鱼攻击。同时，攻击者伪造GitHub账户向AI系统投毒，需加强数据验证和来源审核。

AI生成品牌大语言模型数据验证网络安全钓鱼网站

原文中文，约1100字，阅读约需3分钟。发表于：。

阅读原文

分享给好友

利用 Amazon SageMaker Sticky Session 实现大语言模型推理加速

本文探讨了 Amazon SageMaker Sticky Session 技术如何解决大语言模型推理中的性能挑战。通过会话绑定机制，确保同一用户的请求路由至相同计算实例，实现 KV Cache 复用和上下文保持，这一技术显著降低多轮对话延迟，提升用户体验，特别适合交互式 AI 应用场景。

Amazon SageMaker的粘性会话路由功能通过会话绑定机制优化了大语言模型的推理性能，解决了传统架构的性能瓶颈，提升了用户体验和系统效率。该技术确保同一用户的请求路由到相同实例，实现缓存复用，降低计算开销，适用于需要保持对话上下文的应用。

sagemaker session 大语言模型对话上下文推理性能用户体验粘性会话路由

利用 Amazon SageMaker Sticky Session 实现大语言模型推理加速

原文中文，约5800字，阅读约需14分钟。发表于：。

阅读原文

分享给好友

SUSE 优化并发布开源大语言模型，助力社区协作发展

6 月 24 日，SUSE 在 openSUSE 的 Hugging Face 平台上开源发布了新版精调的语言模型 Cavil-Qwen3-4B，旨在让开源生态中的开发者能够更便捷地实现法律合规自动化。该版本基于出色的 Qwen3-4B 基础模型构建，并采用 LoRA 适配器（低秩自适应）技术，用于检测代码和文档中与法律相关的文本（如许可证声明）。该模型源自 openSUSE...

SUSE于6月24日在Hugging Face平台发布了开源语言模型Cavil-Qwen3-4B，旨在帮助开发者实现法律合规自动化。该模型基于Qwen3-4B，采用LoRA技术，能够检测法律文本，支持商业使用。模型性能优越，适合消费级GPU，数据集和验证工具将公开，鼓励开发者反馈与合作。

Cavil-Qwen3-4B LoRA技术 SUSE 大语言模型开源开源模型法律合规

原文中文，约900字，阅读约需3分钟。发表于：。

阅读原文

分享给好友