小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

该研究探讨了大型语言模型(LLM)在动态任务中的数值推理能力,提出了“代理交易竞技场”以模拟复杂经济系统。实验表明,LLM在处理文本股票数据时的数值推理能力较弱,但在图像数据中几何推理显著提升,表明视觉表示能增强数值推理能力。引入反思模块后,LLM的分析与解释能力进一步改善。

LLM Understands Geometry Better than Algebra: Numerical Understanding of LLM-Based Agents in the Trading Domain

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-25T00:00:00Z

本研究提出了LongDocURL基准,旨在解决长文档理解和布局元素定位的不足。该基准涵盖长文档理解、数值推理和跨元素定位,收集了超过33,000页文档的高质量问答对,显著提升了文档理解性能。

LongDocURL: A Comprehensive Multimodal Benchmark Framework for Long Document Understanding, Reasoning, and Localization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-24T00:00:00Z

本研究提出了一种创新方法,解决大型语言模型处理结构化表格数据的不足。通过多层次分区和自适应量化机制,改善了稀疏高基数字段和数值推理的挑战,实现了交易与文本的有效交互,并在合成支付交易数据集上验证了其有效性。

Scalable Multimodal Table Transaction Representation Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-10T00:00:00Z

该研究提出了一种混合方法,结合加权有限状态转换器和神经语言模型,以解决文本归一化中的上下文依赖性问题。通过对比学习和推理感知预训练,提升了数值推理能力,实验结果显示准确性有所提高。此外,研究分析了位置编码在Transformer模型中的作用,并提出改进数字表示的方法,增强了自然语言理解性能,为未来研究提供了新思路。

数字标准化的位置信息描述

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-22T00:00:00Z

本文研究了预训练语言模型在数值推理和代码理解生成任务中的表现,发现模型对高频词语的推理能力更强,微调能进一步提升性能。使用代码数据增强预训练效果显著,动态混合数据有助于推理能力提升。此外,研究探讨了文档质量对模型理解能力的影响及大型语言模型在编程教育中的潜在影响。

编码还是不编码?探索代码在预训练中的影响

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-20T00:00:00Z

本文介绍了针对金融领域的中文情感分析数据集及其应用,提出了CFGPT框架和BBT-FinT5模型,并评估了大型语言模型在金融知识方面的表现。研究表明,经过微调的Llama 2模型在金融新闻分析中表现优异,FinLLMs方法有效提升了数值推理模型的性能。

FFN:一个细粒度的中英金融领域平行语料库

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-27T00:00:00Z

该论文介绍了一个名为DocMath-Eval的综合基准测试,用于评估金融文件中包含文本和表格的LLMs的数值推理和问题解决能力。研究发现,最好的系统在简单问题上表现良好,但在复杂问题上落后于人类专家。该基准测试将在指定的网址上发布。

DocMath-Eval:评估 LLMs 在理解带表格数据的长文档中的数值推理能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-16T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码