小红花·文摘 - 小红花技术领袖俱乐部

Auto Research时代，47个没有标准答案的任务成了Agent能力必测榜

量子位 ·

PREDICT：通过评估从候选轨迹推断的分解偏好进行偏好推理

PREDICT：通过评估从候选轨迹推断的分解偏好进行偏好推理

Apple Machine Learning Research ·

本研究探讨了在图像再生中迭代优化输入提示的重要性，发现逐步调整提示显著提高了再生图像与目标图像的相似度，验证了迭代工作流程在生成性AI内容创作中的潜力。

A Picture is Worth a Thousand Words? The Efficacy of Iterative Human-Driven Prompt Optimization in Image Regeneration Tasks

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法，利用隐式神经表达在低数据环境下进行无镜像图像去模糊。该方法通过嵌入先验的无训练迭代优化，显著提升了重建性能和收敛速度，优于现有低shot方法。

Research on Lensless Image Deblurring Based on Prior-Embedded Implicit Neural Representations

BriefGPT - AI 论文速递 ·

利用 Self Refine 提高 LLM 的生成质量

利用 Self Refine 提高 LLM 的生成质量

亚马逊AWS官方博客 ·

没想到！AlphaZero式树搜索也能用来增强大语言模型推理与训练

没想到！AlphaZero式树搜索也能用来增强大语言模型推理与训练

机器之心 ·

本文介绍了使用RLHF范式对Transformer模型进行迭代优化的方法，包括定义模型参数和超参数、将数据集转换为环境、定义奖励函数、训练过程和加载最佳参数等。

使用pytorch从零开始实现一个简单的gpt - Xu_Lin

Xu_Lin ·