小红花·文摘 - 小红花技术领袖俱乐部

阿里云推出通义千问Qwen2系列模型，提供5个版本，表现不俗。模型能力较前版本提升，支持128K tokens，增加27种语言训练。Qwen2超过Llama3和Mixtral-8x22B，给Meta带来压力。模型经过微调，提升智能水平，对人类有帮助、诚实和安全。使用多种自动方法获取高质量指令和偏好数据，训练方面采用多种方法。

阿里云开源通义千问Qweb2 支持128K上下文在测试中表现不俗

蓝点网 ·

LinCIR是一种新型的CIR框架，只使用语言进行训练。它通过自掩蔽投影方法将文本的潜在嵌入投影到标记嵌入空间，并构建一个具有相同潜在嵌入向量的新文本。LinCIR在48分钟内训练，展现出最佳的零-shot CIR性能。

仅语言实现高效训练的零样本组合图像检索

BriefGPT - AI 论文速递 ·