小红花·文摘 - 小红花技术领袖俱乐部

No Need for Hundreds of GPUs! HKUST and Others Open Source LightGen: A Cost-Effective Text-to-Image Solution Comparable to SOTA Models

No Need for Hundreds of GPUs! HKUST and Others Open Source LightGen: A Cost-Effective Text-to-Image Solution Comparable to SOTA Models

机器之心 ·

本文探讨了自利独立学习体之间的合作挑战，提出了一种无偏高阶无梯度策略梯度算法，专注于感知强化学习。该算法通过高效序列模型调节行为，以实现合作和高回报。

通过学习感知的策略梯度实现多智能体合作

BriefGPT - AI 论文速递 ·

还是原装Transformer好！北大清华团队同时揭示Mamba等推理短板

还是原装Transformer好！北大清华团队同时揭示Mamba等推理短板

机器之心 ·

本研究通过分析对话文本自动化评估CEFR B2口语，解决了依赖人工评估口语考试的可扩展性挑战。研究建立了合成对话数据集，并开发了高效模型，评估准确性达到96%，展示了在语言能力评估中的应用潜力。

EvalYaks：用于自动评分 CEFR B2 口语评估文本的指令调优数据集和 LoRA 微调模型

BriefGPT - AI 论文速递 ·

EfficientMod是一种高效模型，融合了卷积和注意力机制，具有高效性和强大的表示能力。它在图像分类、目标检测、实例分割和语义分割等任务上表现出色，性能更好且计算复杂度更低。通过逐元素乘法融合特征和线性投影进行通道间的信息交流，EfficientMod在各种任务中都取得了非常好的结果。

EfficientMod：微软出品，高效调制主干网络 | ICLR 2024 - 晓飞的算法工程笔记

晓飞的算法工程笔记 ·

调查现代Hopfield模型的内存检索动力学的计算限制，发现基于模式的范数的效率存在相变行为，仅在范数低于某个临界值时存在亚二次的高效模型；在此条件下进行内存模式的线性检索和输入查询序列的处理，证明了计算时间与存储模式数量和查询序列长度线性扩展的下界，并证明了其内存检索误差边界和指数级内存容量。

现代 Hopfield 模型的计算限制：一个细粒度复杂性分析

BriefGPT - AI 论文速递 ·