小红花·文摘 - 小红花技术领袖俱乐部

一分钟读论文：《Function-Aware Fill-in-the-Middle 作为编码 Agent 基础模型的中期训练》

一分钟读论文：《Function-Aware Fill-in-the-Middle 作为编码 Agent 基础模型的中期训练》

Micropaper ·

语音增强中的自监督学习：从无配对训练到基础模型先验

语音增强中的自监督学习：从无配对训练到基础模型先验

实时互动网 ·

自监督学习使得在无需手动标注数据集的情况下训练神经网络成为可能。通过定义基于数据的预训练任务，自动生成标签并训练编码器以获取表示，这些表示可用于下游任务。常见的预训练任务包括图像补全、旋转预测和对比学习。模型性能评估方法包括线性评估、聚类和可视化。掩码自编码器（MAE）通过掩盖输入的部分补丁进行训练以重建图像，而对比表示学习则通过正负样本的评分函数优化编码器。

CS231n 讲义：自监督学习

Louis Aeilot's Blog ·

ICASSP 2026｜迈向构建低资源语种的多任务语音理解模型

ICASSP 2026｜迈向构建低资源语种的多任务语音理解模型

实时互动网 ·

突破传统：ReSU 神经网络单元——从果蝇大脑中获得的 AI 新灵感

突破传统：ReSU 神经网络单元——从果蝇大脑中获得的 AI 新灵感

Micropaper ·

PART如何组装成整体：学习图像的相对组成

PART如何组装成整体：学习图像的相对组成

Apple Machine Learning Research ·

基于高斯过程的自监督学习

基于高斯过程的自监督学习

Apple Machine Learning Research ·

10种在表格机器学习任务中使用嵌入的方法

10种在表格机器学习任务中使用嵌入的方法

MachineLearningMastery.com ·

NeurIPS 2025最佳论文和时间检验奖揭晓，阿里Qwen门控注意力获最佳论文，何恺明的Faster R-CNN获时间检验奖。今年共七篇论文，涉及扩散模型和自监督学习等领域的突破。

NeurIPS 2025放榜：阿里Qwen门控注意力获最佳论文，何恺明Faster R-CNN获时间检验奖

量子位 ·

使用成对相对位移预训练学习脑电图信号的相对组成

使用成对相对位移预训练学习脑电图信号的相对组成

Apple Machine Learning Research ·

理解类人智能的细微差别

理解类人智能的细微差别

MIT News - Artificial intelligence ·

轻量化 JavaScript 行为框架：简化 HTML 交互过程 | 开源日报 No.743

轻量化 JavaScript 行为框架：简化 HTML 交互过程 | 开源日报 No.743

开源服务指南 ·

生成与对比图表示学习

生成与对比图表示学习

Apple Machine Learning Research ·

构建类似于Llama-2和Llama-3的仅解码器变换器模型

构建类似于Llama-2和Llama-3的仅解码器变换器模型

MachineLearningMastery.com ·

Nubank如何利用AI模型分析1亿用户的交易数据

Nubank如何利用AI模型分析1亿用户的交易数据

ByteByteGo Newsletter ·

硅智能的发展历程包括自监督学习和强化学习的演变。自2013年起，深度学习模型在图像识别等领域超越人类，开启了深度学习革命。2015年，ResNet和Adam优化方法的提出提升了模型训练效率。强化学习在2015年崭露头角，AlphaGo等模型展示了其潜力。未来，AI将通过更高效的数据学习和探索能力推动科学与技术进步。

推动硅智能的前沿：过去、开放问题与未来

Josherich的博客 ·

Meta发布的V-JEPA 2世界模型能够在62小时内训练机器人，使其理解物理世界并进行预测与规划。该模型通过自监督学习，利用大量视频数据提升机器人控制能力，标志着机器人技术的新纪元。

LeCun世界模型出2代了！62小时搞定机器人训练，开启物理推理新时代

量子位 ·

研究显示，当前天然小分子化学空间的探索不足10%，且90%的质谱图因缺乏注释而无法利用。捷克科学院团队开发的DreaMS模型通过自监督学习从7亿条质谱数据中提取分子特征，显著提高了质谱注释的准确性，为新药发现和疾病诊断提供了重要资源。

覆盖2亿分子质谱图，捷克科学院发布DreaMS模型，构建全球最大规模质谱数据集GeMS

HyperAI超神经 ·

本研究提出符号图排序器（SGR），旨在提升大语言模型（LLMs）在会话搜索中的表现。通过将会话图转化为文本，增强了对图结构的理解，并通过自监督学习提升拓扑信息的捕捉能力。实验结果表明，该方法在基准数据集上表现优越，促进了传统搜索策略与现代LLMs的融合。

Unifying Graph Learning with Text: Unleashing the Potential of Large Language Models in Session Search

BriefGPT - AI 论文速递 ·

本研究提出了一种新的图神经网络基准测试方法，通过最大化重叠边进行自监督学习，解决图对齐问题。实验结果表明，该方法在分子回归任务中优于传统卷积架构。

基于图对齐的图神经网络及位置编码的基准测试

BriefGPT - AI 论文速递 ·