小红花·文摘
  • 首页
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate
语言模型微调的温和介绍

本文介绍了语言模型微调的原因、数据集、过程及技术。微调能提升模型在特定领域的理解,适用于指令跟随和对话生成,且通常比预训练更快。文中还提到了一些高级微调技术,如基于人类反馈的强化学习(RLHF)和低秩适应(LoRA)。

语言模型微调的温和介绍

MachineLearningMastery.com
MachineLearningMastery.com · 2026-01-06T23:21:15Z
叙事轨迹:超越画面的评估视频语言模型

本文讨论了视频理解基准的局限性,指出现有基准未能有效区分知识性与图像性问题,从而影响模型的时间推理能力评估。

叙事轨迹:超越画面的评估视频语言模型

Apple Machine Learning Research
Apple Machine Learning Research · 2026-01-06T00:00:00Z

7B扩散语言模型单样例1000+ tokens/s!上交大联合华为推出LoPA

机器之心
机器之心 · 2025-12-31T08:31:48Z
Midscene.js - 一个基于视觉语言模型的跨平台UI自动化框架,使用…

Midscene.js是一个跨平台的UI自动化框架,利用视觉语言模型进行视觉定位和交互。它支持自然语言描述自动化目标,提供JavaScript SDK和YAML脚本,适用于Web、Android和iOS,适合端到端UI测试和操作任务自动化,降低维护成本。

Midscene.js - 一个基于视觉语言模型的跨平台UI自动化框架,使用…

云原生
云原生 · 2025-12-26T10:34:26Z
评估语言模型的困惑度

语言模型的困惑度(perplexity)用于衡量模型对文本的预测能力,表示为样本中标记概率的几何平均数的倒数。困惑度越低,模型对下一个标记的预测越准确。可以使用HellaSwag数据集来评估模型的困惑度,示例代码展示了如何计算每个结尾的困惑度并评估模型的准确性。

评估语言模型的困惑度

MachineLearningMastery.com
MachineLearningMastery.com · 2025-12-23T16:44:35Z

P5是一个统一的推荐系统框架,通过将用户交互、描述和评论等数据转化为自然语言序列,实现个性化推荐。它在预训练阶段学习多种任务,具备良好的零样本泛化能力,有效提升推荐系统性能。

[译][论文] P5 paper | 用语言模型做推荐:一种统一的预训练、个性化提示和预测范式(2022)

ARTHURCHIAO'S BLOG
ARTHURCHIAO'S BLOG · 2025-12-20T00:00:00Z

译者序 本文翻译自 2022 年 RecSys 大会的一篇论文 Recommendation as Language Processing (RLP): A Unified Pretrain, Personalized Prompt & Predict Paradigm (P5)。 Figure 1: P5 pretrains on an encoder–decoder...

[译][论文] P5 paper | 用语言模型做推荐:一种统一的预训练、个性化提示和预测范式(2022)

ARTHURCHIAO'S BLOG
ARTHURCHIAO'S BLOG · 2025-12-20T00:00:00Z
经济实惠地托管语言模型

本文介绍如何在Hugging Face上免费部署TinyLlama语言模型,用户可在10分钟内完成。文章分析了模型需求、成本及免费托管选项,适合低流量演示。通过简单步骤,用户可创建并测试聊天机器人,鼓励优化模型。

经济实惠地托管语言模型

KDnuggets
KDnuggets · 2025-12-18T15:08:54Z
Ai2 推出 Molmo 2 开源视频语言模型

Ai2发布了开源视频语言模型Molmo 2,支持多图像和视频输入,允许用户进行端到端研究,强调开源的重要性,适合企业使用,关注数据透明性和责任。

Ai2 推出 Molmo 2 开源视频语言模型

实时互动网
实时互动网 · 2025-12-17T03:38:15Z
变换器的思维方式:驱动语言模型运作的信息流

大型语言模型(LLMs)利用变换器架构将文本转化为数字表示。文本首先被分割为标记,随后每个标记转化为向量并注入位置信息。模型通过多头注意力机制和前馈神经网络逐步学习文本关系,最终预测下一个单词,从而生成连贯的输出。

变换器的思维方式:驱动语言模型运作的信息流

KDnuggets
KDnuggets · 2025-12-15T15:00:43Z

里程碑时刻!首个100B扩散语言模型来了,技术报告揭秘背后细节

机器之心
机器之心 · 2025-12-12T05:16:27Z
评估数据质量在训练双语语言模型中的作用

双语和多语种模型在自然语言处理中的表现因语言而异,数据质量不均是主要原因。我们提出了一种数据过滤策略,选择高质量的双语训练数据,应用于法语、德语和中文,提升了单语性能2-4%,并将双语模型性能差距缩小至1%。这表明数据质量在多语种预训练中的重要性。

评估数据质量在训练双语语言模型中的作用

Apple Machine Learning Research
Apple Machine Learning Research · 2025-12-11T00:00:00Z
GRACE:可解释的逆强化学习语言模型框架

该论文在NeurIPS 2022的“人机协作学习研讨会”上被接受。偏好强化学习算法通过人类反馈提炼奖励函数,但仍需大量标签,实用性不足。本文展示了环境编码的有效性。

GRACE:可解释的逆强化学习语言模型框架

Apple Machine Learning Research
Apple Machine Learning Research · 2025-12-11T00:00:00Z
大规模语言模型工作负载的令牌高效数据准备指南

随着RAG架构和AI系统的扩展,数据序列化效率低下导致40%至70%的令牌浪费,增加API成本并降低模型性能。优化策略包括消除结构冗余、优化数值精度和应用层次扁平化。有效的数据准备和预处理能显著提升令牌效率,降低成本,增强AI部署的经济性。

大规模语言模型工作负载的令牌高效数据准备指南

The New Stack
The New Stack · 2025-12-06T19:00:34Z
Jina-VLM:小型多语言视觉语言模型

jina-vlm是一个具有2.4B参数的视觉语言模型,支持29种语言的视觉问答,性能优越,适合消费级硬件。它结合了SigLIP2视觉编码器和Qwen3语言骨干,在多语言理解和视觉推理方面表现出色,并通过高效的注意力池化连接器减少视觉标记数量,保持多语言能力。

Jina-VLM:小型多语言视觉语言模型

Jina AI
Jina AI · 2025-12-04T18:57:53Z
如何加速语言模型的训练

本文探讨了加速深度学习模型训练的技术,特别是语言模型。重点包括使用AdamW优化器、余弦衰减学习率调度器、序列长度调度、随机重启和梯度裁剪等方法,以提高模型的收敛速度和稳定性,并减少内存消耗。

如何加速语言模型的训练

MachineLearningMastery.com
MachineLearningMastery.com · 2025-11-30T14:49:19Z
五种用于语言模型开发的Docker容器

本文介绍了五种容器设置,帮助开发者在构思、实验和部署过程中避免工具链冲突。容器提供稳定、可复现的环境,确保GPU库、Python版本和机器学习框架的一致性,适用于大语言模型的研究和开发。每种设置具备独特的灵活性,以满足现代开发需求。

五种用于语言模型开发的Docker容器

KDnuggets
KDnuggets · 2025-11-24T13:00:49Z

AAAI 2026 Oral | 通过视觉安全提示与深度对齐实现大型视觉语言模型的安全对齐

机器之心
机器之心 · 2025-11-24T07:44:00Z
AnyLanguageModel:Apple平台上本地与云语言模型的统一API

AnyLanguageModel是一个新的Swift包,简化了Apple平台上本地和云语言模型的集成,支持Core ML、Ollama及多个云服务,便于开发者切换模型,并增强了视觉-语言提示功能。开发者可在GitHub上获取该项目,促进AI应用开发的一致性。

AnyLanguageModel:Apple平台上本地与云语言模型的统一API

InfoQ
InfoQ · 2025-11-24T06:42:00Z
超大规模语言模型:解决训练不稳定与智能推理挑战 | 开源日报 No.798

moon-dev-ai-agents 是一个基于 Python 的自主 AI 交易代理项目,支持多种智能代理,具备并行处理和风险管理功能,提供市场情绪分析及语音提醒。PageIndex 是一个文档索引系统,模拟人类专家进行信息检索,准确率高达 98.7%。go-sdk 是实现 Model Context Protocol 的开发工具包,支持多种通信方式。

超大规模语言模型:解决训练不稳定与智能推理挑战 | 开源日报 No.798

开源服务指南
开源服务指南 · 2025-11-23T07:35:11Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码