小红花·文摘 - 小红花技术领袖俱乐部

全球首个「具身原生」预训练模型发布，从物理世界出发为机器人造大脑！

量子位 ·

CoCoEmo：面向人类式复杂情感表达的可组合、可控语音合成框架 | ICML 2026

CoCoEmo：面向人类式复杂情感表达的可组合、可控语音合成框架 | ICML 2026

实时互动网 ·

零样本文本分类入门

零样本文本分类入门

MachineLearningMastery.com ·

本文探讨了预训练模型的三种主要目标：自回归语言建模（GPT）、掩码语言建模（BERT）和去噪序列到序列（T5/BART）。每种方法在训练任务上有所不同，导致模型在生成、理解和条件生成能力上的差异。GPT专注于续写，BERT擅长理解，而T5/BART兼顾生成与理解。最终，GPT因其统一接口和扩展性成为主流。

【Transformer 与注意力机制】30｜预训练目标：BERT、GPT、T5 其实在学三种不同的事

土法炼钢兴趣小组的博客 ·

天下苦「调参」久矣！MIT师生推出全新RandOpt算法

量子位 ·

[译][论文] P5 paper | 用语言模型做推荐：一种统一的预训练、个性化提示和预测范式（2022）

[译][论文] P5 paper | 用语言模型做推荐：一种统一的预训练、个性化提示和预测范式（2022）

ARTHURCHIAO'S BLOG ·

【最新技术】多模态零样本工业缺陷检测概述

【最新技术】多模态零样本工业缺陷检测概述

gloomyfish ·

Interspeech 2026 第二届音频编码器能力挑战赛正式启动

Interspeech 2026 第二届音频编码器能力挑战赛正式启动

实时互动网 ·

ML.NET 可通过文本分类和命名实体识别（NER）提取人名和地名。实现步骤包括安装必要的包、准备预训练模型、定义数据结构、构建 ML 管道并进行预测。尽管 ML.NET 在 NER 生态中不如 Python 库丰富，但适合于已有 .NET 技术栈的轻量集成场景。

ML.NET实现人名、地名的提取

dotNET跨平台 ·

TADA：一种改进的无训练增强动态扩散采样方法

TADA：一种改进的无训练增强动态扩散采样方法

Apple Machine Learning Research ·

这篇博客推荐书籍《大规模语言模型：从理论到实践》，认为其为中文领域较为系统的预训练模型学习资料，内容更新及时，适合跳读，帮助读者发现知识盲点。

[书评] 推荐《大规模语言模型：从理论到实践》

桑弧蓬矢射四方 ·

音调重音检测提升了预训练自动语音识别的性能

音调重音检测提升了预训练自动语音识别的性能

Apple Machine Learning Research ·

最优语料感知训练用于神经机器翻译

最优语料感知训练用于神经机器翻译

Apple Machine Learning Research ·

大语言模型微调

范叶亮的博客 ·

生成式AI：自学路线图

生成式AI：自学路线图

KDnuggets ·

大模型从零到一：LLM 原理与实践指南 | 开源日报 No.662

大模型从零到一：LLM 原理与实践指南 | 开源日报 No.662

开源服务指南 ·

李飞飞团队提出了一种名为“嫁接”的新方法，通过修改预训练模型组件，节省计算资源并验证新架构设计。研究表明，使用不到2%的预训练算力仍能保持模型性能，并提升生成速度，适合资源有限的场景。

李飞飞团队提出架构设计新思路！无需从头训练，直接“嫁接”预训练模型关键组件

量子位 ·

本研究探讨了预训练模型在人工智能创新中的应用，分析了HCI研究者的案例，提出了创新机会、能力分类和新兴交互设计模式，为有效应用提供指导，强调理解这些模型对推动AI创新的重要性。

Exploring Innovative Opportunities of Pre-trained Models

BriefGPT - AI 论文速递 ·

本研究提出了一种变分前缀调优（VPT）方法，旨在解决代码摘要生成中对多样性和替代选项的忽视。该方法基于条件变分自编码器框架，增强了预训练模型生成多样且精确摘要的能力，使用户能够选择最合适的摘要，并在参数效率上优于传统方法。

Variational Prefix Tuning for Diverse and Accurate Code Summarization

BriefGPT - AI 论文速递 ·

模型调用：Amazon Bedrock

模型调用：Amazon Bedrock

DEV Community ·