小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
大型语言模型能理解上下文吗?

大型语言模型(LLMs)在理解人类语言上下文方面表现优异。本文提出了一种上下文理解基准,包含四个任务和九个数据集,以评估模型的上下文理解能力。实验结果显示,预训练的密集模型在理解细微上下文特征上不及最新的微调模型,且量化模型在上下文学习中的表现也有所下降。

大型语言模型能理解上下文吗?

Apple Machine Learning Research
Apple Machine Learning Research · 2026-04-21T00:00:00Z
提升搜索相关性:通过LLM生成的判断增强应用商店排名

文章探讨了通过生成文本相关性标签提升应用商店搜索排名的方法。研究表明,经过微调的模型在生成相关标签方面优于大型预训练模型。生成的数百万个文本标签显著提高了行为和文本相关性的离线NDCG,并在全球A/B测试中验证了转化率提升0.24%,尤其在尾部查询中效果显著。

提升搜索相关性:通过LLM生成的判断增强应用商店排名

Apple Machine Learning Research
Apple Machine Learning Research · 2026-02-27T00:00:00Z

本研究探讨多模态大语言模型(MLLMs)的安全对齐问题,指出现有模型在多模态输入下存在缺口。实验表明,数据分布偏见是主要原因。提出通过微调模型和使用拒绝句替换响应的方法,显著提高安全性,而无需收集恶意数据。

Do We Really Need Curated Malicious Data for Safety Alignment in Multi-modal Large Language Models?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-14T00:00:00Z

本研究评估了电子商务中图像嵌入的基础模型,发现全面微调模型表现优异,而文本-图像和自监督嵌入在较少训练下也能达到相似效果。顶层微调被证实为降低计算成本的有效替代方案,为嵌入选择和微调策略提供了实用指导。

Benchmarking Image Embeddings for E-Commerce: Evaluating Off-the-Shelf Foundation Models, Fine-Tuning Strategies, and Practical Trade-offs

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-10T00:00:00Z

本研究提出两种策略以解决多语言图像描述评估中的数据稀缺问题,结果表明微调的多语言模型具有良好的泛化能力,并与人类评判结果高度相关。

多语言图像描述评估:CLIP模型能达到多远?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-10T00:00:00Z

本研究提出了一种新颖的2层次SimCSE微调模型,结合无监督与监督方法,针对情感分析和语义文本相似性任务进行实验,模型在语义文本相似性任务中表现优异,平均得分达到0.742。

Two-Level SimCSE: Enhancing BERT for Robust Sentence Embeddings

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-23T00:00:00Z

本研究评估了12种机器学习模型在检测经济意识形态方面的能力。生成模型(如GPT-4o和Gemini 1.5 Flash)表现优异,但受限于可访问性和资源。微调模型是可靠的替代方案,尽管扩展性有限。研究结果对政治内容的自动化分析具有重要指导意义。

从12种机器学习模型中提取经济意识形态的比较洞察

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-16T00:00:00Z
计算Token:理清细节

六三八的女性在解读模糊地址时面临挑战,类似于在OpenAI数据上微调模型时对token使用的理解至关重要。使用Tiktoken计算token数量可以优化效率和控制成本。微调模型不仅是技术挑战,还涉及与token使用直接相关的财务问题,因此提前规划和预算非常重要。

计算Token:理清细节

DEV Community
DEV Community · 2024-12-23T21:40:36Z

本文探讨了利用语言数据预测跨语种语言模型性能的方法,评估了多种大型语言模型在多语言机器翻译中的表现。研究发现,大型模型在某些任务中表现良好,但与小型微调模型仍存在差距。提出了多语言语言可接受性基准MELA,分析了语言间的转移困难,并讨论了大型语言模型在多语种环境中的应用及未来研究方向。

P-MMEval:一个用于一致评估大型语言模型的多语种多任务并行基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-14T00:00:00Z

本研究探讨了从释义文本恢复原文的方法,通过微调模型验证了在机器和人类文本中恢复内容的可行性,提升了抄袭检测和作者身份识别的效果。

大型语言模型生成的释义是否可逆?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-29T00:00:00Z

本研究分析大型语言模型在机器翻译中如何利用输入上下文。结果显示,源文本在少量示例中比目标文本贡献更大,微调模型改变了上下文贡献模式,早期示例对翻译影响更大。这些发现帮助理解翻译机制并揭示异常现象。

基于大语言模型的机器翻译中的上下文贡献分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z

研究探讨了在不同文本领域中微调模型时特征的动态变化。通过使用Transformer模型和球面线性插值技术,分析小规模模型和稀疏自编码器在迁移学习中的特征稳定性,揭示了特征的动态本质。

通过微调和模型合并跟踪通用特征

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z

本研究通过创建QACC数据集,分析大型语言模型在开放领域问答中因冲突信息导致的准确性问题,并提出微调模型的新方法。结果显示,适当微调能增强推理能力,提高问答效果。

开放领域的有冲突信息的问答

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z

大型语言模型在金融情绪分析中表现优异,尤其在零样本和少样本学习中。研究发现,通过上下文学习和微调,即使参数较少的模型也能达到先进水平,且增加样本数量并未提升性能,显示出微调模型在金融领域的潜力。

基础设施项目意见的长上下文情感分析中的上下文学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-15T00:00:00Z

本研究提出VHExpansion方法,通过自动扰动问题、答案和修改图像,扩展多模态大型语言模型的视觉幻觉测试用例。引入对称精度评估指标,解决传统精度在不平衡测试中的偏差。实验显示,微调模型在扩展数据集上能更有效减少视觉幻觉现象。

为多模态大型语言模型自动生成视觉幻觉测试用例

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-15T00:00:00Z

研究评估了K-12 STEM教育中大语言模型的应用,特别是提示工程。分析2021至2024年30项研究,发现高级提示技术在教育任务中效果更好,小型和微调模型在特定情境下可超越大型模型。

关于大语言模型在K-12 STEM教育中提示工程的系统评价

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-14T00:00:00Z

大型语言模型(LLMs)在基因组学和蛋白质组学中应用广泛。Geneverse是专注于基因和蛋白质功能的微调模型,表现优于一些闭源模型,并且免费提供。

基于知识的特征选择与工程:利用大型语言模型进行基因型数据分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-02T00:00:00Z

本研究提出了一种高效的解决方案,通过微调后的单步模型在零样本测试中表现优于其他深度和法线估计模型。研究还展示了扩散模型在光流和单目深度估计中的有效性,并提出了基于扩散的图像修复统一条件框架。此外,还介绍了扩散模型在图像恢复与增强中的应用,并提出了条件扩散蒸馏和PrimeDepth等方法。

微调图像条件扩散模型比你想象的更简单

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-17T00:00:00Z
你应该这样构建基于 AI 的产品(译)

本文讨论了构建人工智能产品的方法,建议避免仅仅包装现有模型,而是创建独特且有价值的技术。解决方案是创建自己的工具链,结合微调过的模型、自定义编译器和训练的模型。作者强调在需要的地方使用人工智能,而不是完全依赖它。最后,作者推荐使用类似Builder的方法来构建人工智能产品。

你应该这样构建基于 AI 的产品(译)

Colorful - 一枚数字艺术家的自留地
Colorful - 一枚数字艺术家的自留地 · 2024-08-29T00:00:00Z

硅积流动是一家提供云端服务的新公司,由袁进辉创立。公司目前有三个产品:硅LLM、硅积云和one diff。他们计划扩充开源模型并加入微调模型,以提供更快速和稳定的服务,并降低价格。

从王慧文AI创业狗血独角兽剧情中脱身的小伙伴们,再出发,中国版本的Together AI,硅基动力,AI基础架构新一轮融资揭秘

硕鼠的博客站
硕鼠的博客站 · 2024-07-12T00:50:36Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码