标签

 大语言模型 

相关的文章:

本列表汇集了关于大语言模型的最新研究与应用,涵盖从代码安全到交互式程序开发的多方面内容,助您深入了解这一前沿技术。

SUSE 优化并发布开源大语言模型,助力社区协作发展

6 月 24 日,SUSE 在 openSUSE 的 Hugging Face 平台 上开源发布了新版精调的语言模型 Cavil-Qwen3-4B,旨在让开源生态中的开发者能够更便捷地实现法律合规自动化。 该版本基于出色的 Qwen3-4B 基础模型 构建,并采用 LoRA 适配器(低秩自适应)技术,用于检测代码和文档中与法律相关的文本(如许可证声明)。该模型源自 openSUSE...

SUSE于6月24日在Hugging Face平台发布了开源语言模型Cavil-Qwen3-4B,旨在帮助开发者实现法律合规自动化。该模型基于Qwen3-4B,采用LoRA技术,能够检测法律文本,支持商业使用。模型性能优越,适合消费级GPU,数据集和验证工具将公开,鼓励开发者反馈与合作。

SUSE 优化并发布开源大语言模型,助力社区协作发展
原文中文,约900字,阅读约需3分钟。发表于:
阅读原文

利用多模态大语言模型推进自我中心视频问答

Egocentric Video Question Answering (QA) requires models to handle long-horizon temporal reasoning, first-person perspectives, and specialized challenges like frequent camera movement. This paper...

本文评估了多模态大语言模型在Egocentric视频问答中的表现,使用QaEgo4Dv2数据集。研究发现,经过微调的Video-LLaVa-7B和Qwen2-VL-7B-Instruct在OpenQA和CloseQA中表现优异,超越了之前的基准。然而,模型在空间推理和细粒度物体识别方面仍存在困难。

利用多模态大语言模型推进自我中心视频问答
原文英文,约200词,阅读约需1分钟。发表于:
阅读原文

大语言模型高考数学拿高分靠强化学习,那文科考高分得靠什么?

上次分析了大语言模型在高考数学考试中拿高分靠的是强化学习,也就是在后训练阶段,自己训练自己做有标准答案的数学题或者编程题,反复的自己刷题,做完题目对答案,答案做对了就有奖励,做错了就有惩罚,最终自己训练自己越练越牛。但是文科这样做行不通,因为文科很多题目没有标准答案,它就没有办法用文科题目自己训练自己,做强化学习。

大语言模型在高考文科中取得高分的原因包括优质训练数据、思维链推理、长上下文处理和多模态能力,这些因素提升了模型对复杂问题的理解和回答能力。

大语言模型高考数学拿高分靠强化学习,那文科考高分得靠什么?
原文中文,约1800字,阅读约需5分钟。发表于:
阅读原文
原文英文,约700词,阅读约需3分钟。发表于:
阅读原文

即构实时互动AI Agent 支持接入多家最新大语言模型

作为AI Agent的“大脑”,大语言模型为AI Agent赋予了思考、推理和决策能力,是其实现复杂能力的基础。近期,多家大语言模型厂商发布新产品、新版本,为AI Agent进一步...

大语言模型为AI代理提供思考与决策能力,近期多家厂商推出新产品,提升性能并降低成本。构科技的方案支持多种主流模型,帮助开发者实现低延迟的实时互动体验,满足多样化应用需求。

即构实时互动AI Agent 支持接入多家最新大语言模型
原文中文,约1100字,阅读约需3分钟。发表于:
阅读原文
原文中文,约1300字,阅读约需4分钟。发表于:
阅读原文

在C#中使用Semantic Kernel和Mediator模式实现基于大语言模型的交互式绘图程序

因此,在一个聊天会话中,如果用户让大语言模型将画布上的内容全部清除,只需要用自然语言输入命令,比如:“请帮我清理画布上的内容”,或者是“清除画布”,大语言模型在理解了对话语义之后,就会调用上面的ClearCanvasAsync方法,而就是在这个方法中,我们使用Windows...

本文介绍了如何在C#中利用Semantic Kernel和Mediator模式实现AI绘图程序。通过插件功能,AI能够调用工具完成绘图任务,结合面向对象设计,提高程序的扩展性和可维护性。

原文中文,约5800字,阅读约需14分钟。发表于:
阅读原文

Dev Proxy v0.28 引入了大语言模型使用情况和成本分析的遥测功能

The .NET team has released Dev Proxy version 0.28, introducing new capabilities aimed at improving observability, plugin extensibility, and integration with AI models. A central feature of this...

.NET团队发布Dev Proxy 0.28版本,新增OpenAITelemetryPlugin插件,帮助开发者跟踪OpenAI请求的使用情况和成本。该版本支持Foundry Local本地AI环境,简化了与Aspire应用的集成,并扩展了对OpenAI负载的支持,同时改进了TypeSpec生成和日志处理,增强了并发性能。

Dev Proxy v0.28 引入了大语言模型使用情况和成本分析的遥测功能
原文英文,约600词,阅读约需2分钟。发表于:
阅读原文
发表于:
阅读原文
原文中文,约2300字,阅读约需6分钟。发表于:
阅读原文