小红花·文摘

代理型人工智能是防止昂贵AI幻觉的关键

The New Stack ·

谢赛宁团队推出的MetaCLIP 2模型打破了“多语言诅咒”，支持300多种语言，并提升了英语性能。该模型通过全球数据训练，优化了数据筛选和模型结构，现已开源数据和代码。

谢赛宁团队新作打破“多语言诅咒”！MetaCLIP 2支持300多种语言，英语性能反倒提升了

量子位 ·

本研究提出VariReal，通过最小编辑源图像生成合成图像，探讨合成数据在训练CLIP分类器中的有效性。结果表明，混合可行与不可行图像对分类性能的影响微乎其微。

可行性重要吗？理解可行性对合成训练数据的影响

BriefGPT - AI 论文速递 ·

探索联邦AI在去中心化数据训练中的应用

DEV Community ·

OpenAI重启机器人项目！揭秘从数据收集到大模型训练的人形机器人未来规划！

硕鼠的博客站 ·

推动大模型自我进化，北理工推出「流星雨计划」

机器之心 ·

新一代赛博仆人！这款机器人要帮你把各种家务活都做了

爱范儿 ·

本文介绍了一种基于区块链的去中心化联邦学习框架，旨在提升安全性和可扩展性。研究重点在医疗元宇宙中的隐私保护、数据训练和激励机制，提出了确保模型参数安全的隐私保护联邦学习模型，并综述了区块链与联邦学习的整合研究，分析了其应用、挑战及未来方向。

BF-Meta：增强隐私保护的安全区块链联邦学习框架用于元宇宙

BriefGPT - AI 论文速递 ·

本文探讨了基于深度学习的航天器姿态估计技术，包括单图像6DOF姿态估计方法、卷积神经网络架构、数据集构建及优化技术。研究表明，合成数据与真实数据结合训练能显著提升算法性能，尤其在自主交会和对接操作中具有重要应用价值。

测试时可认证自监督以弥合基于事件的卫星姿态估计中的Sim2Real差距

BriefGPT - AI 论文速递 ·

Meta 宣布推出 Llama 3 [译]

宝玉的分享 ·

通过对2个生物医学自然语言处理任务使用6个语言模型评估联邦学习在医学领域的应用，结果显示联邦学习模型在总体表现上优于单个客户数据训练的语言模型，有时甚至与整合数据训练的模型持平。当数据总量固定时，使用更多客户训练的语言模型表现较差，但基于预训练模型的转换器表现更加强劲。联邦学习训练的语言模型在客户数据独立同分布的情况下与整合数据训练的模型表现接近，但在非独立同分布数据下有明显差距。

利用 NVIDIA FLARE 增强大规模模型的联合学习

BriefGPT - AI 论文速递 ·

隐私保护的多囊卵巢综合症治疗的病患数据联邦学习

BriefGPT - AI 论文速递 ·