小红花·文摘

大型语言模型能理解上下文吗？

Apple Machine Learning Research ·

提升搜索相关性：通过LLM生成的判断增强应用商店排名

Apple Machine Learning Research ·

本研究探讨多模态大语言模型（MLLMs）的安全对齐问题，指出现有模型在多模态输入下存在缺口。实验表明，数据分布偏见是主要原因。提出通过微调模型和使用拒绝句替换响应的方法，显著提高安全性，而无需收集恶意数据。

Do We Really Need Curated Malicious Data for Safety Alignment in Multi-modal Large Language Models?

BriefGPT - AI 论文速递 ·

本研究评估了电子商务中图像嵌入的基础模型，发现全面微调模型表现优异，而文本-图像和自监督嵌入在较少训练下也能达到相似效果。顶层微调被证实为降低计算成本的有效替代方案，为嵌入选择和微调策略提供了实用指导。

Benchmarking Image Embeddings for E-Commerce: Evaluating Off-the-Shelf Foundation Models, Fine-Tuning Strategies, and Practical Trade-offs

BriefGPT - AI 论文速递 ·

本研究提出两种策略以解决多语言图像描述评估中的数据稀缺问题，结果表明微调的多语言模型具有良好的泛化能力，并与人类评判结果高度相关。

多语言图像描述评估：CLIP模型能达到多远？

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的2层次SimCSE微调模型，结合无监督与监督方法，针对情感分析和语义文本相似性任务进行实验，模型在语义文本相似性任务中表现优异，平均得分达到0.742。

Two-Level SimCSE: Enhancing BERT for Robust Sentence Embeddings

BriefGPT - AI 论文速递 ·

本研究评估了12种机器学习模型在检测经济意识形态方面的能力。生成模型（如GPT-4o和Gemini 1.5 Flash）表现优异，但受限于可访问性和资源。微调模型是可靠的替代方案，尽管扩展性有限。研究结果对政治内容的自动化分析具有重要指导意义。

从12种机器学习模型中提取经济意识形态的比较洞察

BriefGPT - AI 论文速递 ·

计算Token：理清细节

DEV Community ·

本文探讨了利用语言数据预测跨语种语言模型性能的方法，评估了多种大型语言模型在多语言机器翻译中的表现。研究发现，大型模型在某些任务中表现良好，但与小型微调模型仍存在差距。提出了多语言语言可接受性基准MELA，分析了语言间的转移困难，并讨论了大型语言模型在多语种环境中的应用及未来研究方向。

P-MMEval：一个用于一致评估大型语言模型的多语种多任务并行基准

BriefGPT - AI 论文速递 ·

本研究分析大型语言模型在机器翻译中如何利用输入上下文。结果显示，源文本在少量示例中比目标文本贡献更大，微调模型改变了上下文贡献模式，早期示例对翻译影响更大。这些发现帮助理解翻译机制并揭示异常现象。

基于大语言模型的机器翻译中的上下文贡献分析

BriefGPT - AI 论文速递 ·

本研究探讨了在不同文本领域微调模型中，特征的出现、消失和持久化，揭示了特征在迁移学习中的动态变化。

Tracking Universal Features Through Fine-Tuning and Model Merging

BriefGPT - AI 论文速递 ·

本研究通过创建QACC数据集，分析大型语言模型在开放领域问答中因冲突信息导致的准确性问题，并提出微调模型的新方法。结果显示，适当微调能增强推理能力，提高问答效果。

Question Answering with Conflicting Information in Open Domains

BriefGPT - AI 论文速递 ·

研究评估了K-12 STEM教育中大语言模型的应用，特别是提示工程。分析2021至2024年30项研究，发现高级提示技术在教育任务中效果更好，小型和微调模型在特定情境下可超越大型模型。

关于大语言模型在K-12 STEM教育中提示工程的系统评价

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法，通过“软提示”嵌入和激活补丁技术提高微调模型的鲁棒性。动态激活组合和基于拒绝采样的自我指导微调方法在控制模型行为和提高生成效率方面表现优越，尤其在数据量较少时。

激活缩放用于引导和解释语言模型

BriefGPT - AI 论文速递 ·

本研究提出了一种高效的解决方案，通过微调后的单步模型在零样本测试中表现优于其他深度和法线估计模型。研究还展示了扩散模型在光流和单目深度估计中的有效性，并提出了基于扩散的图像修复统一条件框架。此外，还介绍了扩散模型在图像恢复与增强中的应用，并提出了条件扩散蒸馏和PrimeDepth等方法。

微调图像条件扩散模型比你想象的更简单

BriefGPT - AI 论文速递 ·

你应该这样构建基于 AI 的产品（译）

Colorful - 一枚数字艺术家的自留地 ·

硅积流动是一家提供云端服务的新公司，由袁进辉创立。公司目前有三个产品：硅LLM、硅积云和one diff。他们计划扩充开源模型并加入微调模型，以提供更快速和稳定的服务，并降低价格。

从王慧文AI创业狗血独角兽剧情中脱身的小伙伴们，再出发，中国版本的Together AI，硅基动力，AI基础架构新一轮融资揭秘

硕鼠的博客站 ·

本文提出了一种低成本的文本到图像生成方法，通过微调预训练模型实现多概念生成。采用交叉注意力引导，分解多个概念，提升图像保真度和文本对齐度。实验结果表明，该方法在生成质量上优于现有模型，并有效去除不良概念，保持其他元素的完整性。

Espresso：文本到图像模型中的鲁棒概念过滤

BriefGPT - AI 论文速递 ·

How to Enter the Field of Deep Learning?

DemoChen's Clip ·

讨论大模型项目团队的工作流程和目标，包括微调模型、优化摘要prompt和增强review特异性。介绍了爬取论文早期版本和康奈尔大学的审稿模型Reviewer2和PeerRead项目。

提升大模型数据质量的三大要素：找到早期paper且基于GPT摘要出来7方面review——七月论文审稿GPT第4.5/4.6/4.8版

结构之法算法之道 ·