小红花·文摘
  • 首页
  • 排行榜🏆
  • 直播
  • FAQ
沉浸式翻译 immersive translate
Dify.AI
语言模型微调的温和介绍

本文介绍了语言模型微调的原因、数据集、过程及技术。微调能提升模型在特定领域的理解,适用于指令跟随和对话生成,且通常比预训练更快。文中还提到了一些高级微调技术,如基于人类反馈的强化学习(RLHF)和低秩适应(LoRA)。

语言模型微调的温和介绍

MachineLearningMastery.com
MachineLearningMastery.com · 2026-01-06T23:21:15Z
叙事轨迹:超越画面的评估视频语言模型

本文讨论了视频理解基准的局限性,指出现有基准未能有效区分知识性与图像性问题,从而影响模型的时间推理能力评估。

叙事轨迹:超越画面的评估视频语言模型

Apple Machine Learning Research
Apple Machine Learning Research · 2026-01-06T00:00:00Z

7B扩散语言模型单样例1000+ tokens/s!上交大联合华为推出LoPA

机器之心
机器之心 · 2025-12-31T08:31:48Z
Midscene.js - 一个基于视觉语言模型的跨平台UI自动化框架,使用…

Midscene.js是一个跨平台的UI自动化框架,利用视觉语言模型进行视觉定位和交互。它支持自然语言描述自动化目标,提供JavaScript SDK和YAML脚本,适用于Web、Android和iOS,适合端到端UI测试和操作任务自动化,降低维护成本。

Midscene.js - 一个基于视觉语言模型的跨平台UI自动化框架,使用…

云原生
云原生 · 2025-12-26T10:34:26Z
评估语言模型的困惑度

语言模型的困惑度(perplexity)用于衡量模型对文本的预测能力,表示为样本中标记概率的几何平均数的倒数。困惑度越低,模型对下一个标记的预测越准确。可以使用HellaSwag数据集来评估模型的困惑度,示例代码展示了如何计算每个结尾的困惑度并评估模型的准确性。

评估语言模型的困惑度

MachineLearningMastery.com
MachineLearningMastery.com · 2025-12-23T16:44:35Z

P5是一个统一的推荐系统框架,通过将用户交互、描述和评论等数据转化为自然语言序列,实现个性化推荐。它在预训练阶段学习多种任务,具备良好的零样本泛化能力,有效提升推荐系统性能。

[译][论文] P5 paper | 用语言模型做推荐:一种统一的预训练、个性化提示和预测范式(2022)

ARTHURCHIAO'S BLOG
ARTHURCHIAO'S BLOG · 2025-12-20T00:00:00Z

译者序 本文翻译自 2022 年 RecSys 大会的一篇论文 Recommendation as Language Processing (RLP): A Unified Pretrain, Personalized Prompt & Predict Paradigm (P5)。 Figure 1: P5 pretrains on an encoder–decoder...

[译][论文] P5 paper | 用语言模型做推荐:一种统一的预训练、个性化提示和预测范式(2022)

ARTHURCHIAO'S BLOG
ARTHURCHIAO'S BLOG · 2025-12-20T00:00:00Z
经济实惠地托管语言模型

本文介绍如何在Hugging Face上免费部署TinyLlama语言模型,用户可在10分钟内完成。文章分析了模型需求、成本及免费托管选项,适合低流量演示。通过简单步骤,用户可创建并测试聊天机器人,鼓励优化模型。

经济实惠地托管语言模型

KDnuggets
KDnuggets · 2025-12-18T15:08:54Z
Ai2 推出 Molmo 2 开源视频语言模型

Ai2发布了开源视频语言模型Molmo 2,支持多图像和视频输入,允许用户进行端到端研究,强调开源的重要性,适合企业使用,关注数据透明性和责任。

Ai2 推出 Molmo 2 开源视频语言模型

实时互动网
实时互动网 · 2025-12-17T03:38:15Z
变换器的思维方式:驱动语言模型运作的信息流

大型语言模型(LLMs)利用变换器架构将文本转化为数字表示。文本首先被分割为标记,随后每个标记转化为向量并注入位置信息。模型通过多头注意力机制和前馈神经网络逐步学习文本关系,最终预测下一个单词,从而生成连贯的输出。

变换器的思维方式:驱动语言模型运作的信息流

KDnuggets
KDnuggets · 2025-12-15T15:00:43Z

里程碑时刻!首个100B扩散语言模型来了,技术报告揭秘背后细节

机器之心
机器之心 · 2025-12-12T05:16:27Z
评估数据质量在训练双语语言模型中的作用

双语和多语种模型在自然语言处理中的表现因语言而异,数据质量不均是主要原因。我们提出了一种数据过滤策略,选择高质量的双语训练数据,应用于法语、德语和中文,提升了单语性能2-4%,并将双语模型性能差距缩小至1%。这表明数据质量在多语种预训练中的重要性。

评估数据质量在训练双语语言模型中的作用

Apple Machine Learning Research
Apple Machine Learning Research · 2025-12-11T00:00:00Z
GRACE:可解释的逆强化学习语言模型框架

该论文在NeurIPS 2022的“人机协作学习研讨会”上被接受。偏好强化学习算法通过人类反馈提炼奖励函数,但仍需大量标签,实用性不足。本文展示了环境编码的有效性。

GRACE:可解释的逆强化学习语言模型框架

Apple Machine Learning Research
Apple Machine Learning Research · 2025-12-11T00:00:00Z
大规模语言模型工作负载的令牌高效数据准备指南

随着RAG架构和AI系统的扩展,数据序列化效率低下导致40%至70%的令牌浪费,增加API成本并降低模型性能。优化策略包括消除结构冗余、优化数值精度和应用层次扁平化。有效的数据准备和预处理能显著提升令牌效率,降低成本,增强AI部署的经济性。

大规模语言模型工作负载的令牌高效数据准备指南

The New Stack
The New Stack · 2025-12-06T19:00:34Z
Jina-VLM:小型多语言视觉语言模型

jina-vlm是一个具有2.4B参数的视觉语言模型,支持29种语言的视觉问答,性能优越,适合消费级硬件。它结合了SigLIP2视觉编码器和Qwen3语言骨干,在多语言理解和视觉推理方面表现出色,并通过高效的注意力池化连接器减少视觉标记数量,保持多语言能力。

Jina-VLM:小型多语言视觉语言模型

Jina AI
Jina AI · 2025-12-04T18:57:53Z
如何加速语言模型的训练

本文探讨了加速深度学习模型训练的技术,特别是语言模型。重点包括使用AdamW优化器、余弦衰减学习率调度器、序列长度调度、随机重启和梯度裁剪等方法,以提高模型的收敛速度和稳定性,并减少内存消耗。

如何加速语言模型的训练

MachineLearningMastery.com
MachineLearningMastery.com · 2025-11-30T14:49:19Z
五种用于语言模型开发的Docker容器

本文介绍了五种容器设置,帮助开发者在构思、实验和部署过程中避免工具链冲突。容器提供稳定、可复现的环境,确保GPU库、Python版本和机器学习框架的一致性,适用于大语言模型的研究和开发。每种设置具备独特的灵活性,以满足现代开发需求。

五种用于语言模型开发的Docker容器

KDnuggets
KDnuggets · 2025-11-24T13:00:49Z

AAAI 2026 Oral | 通过视觉安全提示与深度对齐实现大型视觉语言模型的安全对齐

机器之心
机器之心 · 2025-11-24T07:44:00Z
AnyLanguageModel:Apple平台上本地与云语言模型的统一API

AnyLanguageModel是一个新的Swift包,简化了Apple平台上本地和云语言模型的集成,支持Core ML、Ollama及多个云服务,便于开发者切换模型,并增强了视觉-语言提示功能。开发者可在GitHub上获取该项目,促进AI应用开发的一致性。

AnyLanguageModel:Apple平台上本地与云语言模型的统一API

InfoQ
InfoQ · 2025-11-24T06:42:00Z
超大规模语言模型:解决训练不稳定与智能推理挑战 | 开源日报 No.798

moon-dev-ai-agents 是一个基于 Python 的自主 AI 交易代理项目,支持多种智能代理,具备并行处理和风险管理功能,提供市场情绪分析及语音提醒。PageIndex 是一个文档索引系统,模拟人类专家进行信息检索,准确率高达 98.7%。go-sdk 是实现 Model Context Protocol 的开发工具包,支持多种通信方式。

超大规模语言模型:解决训练不稳定与智能推理挑战 | 开源日报 No.798

开源服务指南
开源服务指南 · 2025-11-23T07:35:11Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码