小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

该研究提出了一种新策略,以优化生成文本中的水印设计,检测率优于现有方案,具有实际应用潜力。

Optimized Coupling for Watermarking in Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

本研究探讨了区分人类生成文本与大型语言模型(LLM)生成文本的挑战,提出了基于LLM的检测和解释方法。结果表明,LLM在检测自身生成文本时表现优于他人生成文本,但仍需改进。将二分类任务扩展为三分类任务显著提高了检测准确性和解释质量。

"I Know Myself, But Not Really Deeply": Using Large Language Models to Detect and Explain LLM-Generated Texts

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-18T00:00:00Z

本研究提出自引用因果循环(RECALL)机制,旨在解决大型语言模型在回忆上下文时的“逆转诅咒”问题。通过引入循环令牌,增强模型的信息重现能力,从而提高生成文本的准确性和连贯性。

Enhancing Language Model Library Behavior through Self-Referential Causal Loops

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-23T00:00:00Z
提升大型语言模型性能的提示工程技术

大型语言模型(LLMs)如GPT在生成类人文本方面表现出色,但存在幻觉问题,即生成不准确或无关的内容。理解幻觉的成因及其解决方案至关重要。提示工程是设计有效提示以引导LLMs生成准确、有意义输出的艺术与科学。

提升大型语言模型性能的提示工程技术

DEV Community
DEV Community · 2025-01-17T02:04:06Z

本研究提出MAGNET方法,旨在增强解码器的双向建模能力。通过自监督训练和结合双向与因果注意力,MAGNET提升了生成文本和填补缺失文本的能力。

MAGNET: Enhancing Generative Decoders with Representation Learning and Infilling Capabilities

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-15T00:00:00Z

本研究提出递归扩散概率模型(RDPM),旨在解决扩散概率模型与大语言模型在生成图像和文本方面的差异。RDPM通过递归令牌预测机制增强了扩散过程,展现出优越的性能,尤其在推理速度上具有明显优势。

RDPM: Solving Diffusion Probabilistic Models through Recursive Token Prediction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-24T00:00:00Z

本文分析了传统评估指标在生成文本质量评估中的不足,特别是在缺乏单一真实值的情况下。研究表明,大型语言模型(如Google Gemini 1)在自动评估方面具有潜力,但与人类评估者的一致性较低,鲁棒性不足,亟需改进。

理解大型语言模型评估在扰动下的鲁棒性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z

本文探讨了大语言模型(LLM)的快速发展及其本地运行的优势,如隐私保护和无注册限制。作者分享了使用llama.cpp软件的经验,介绍了多种模型的特点与应用。尽管LLM在生成代码和文本方面表现出色,但仍存在准确性和上下文长度的限制。总体而言,LLM在校对、创作和翻译等领域展现了潜力。

译文 | 百舸争流,能者自渡:本地大语言模型(LLM)那些事

少数派
少数派 · 2024-12-05T07:00:00Z

该研究探讨了深度学习生成文本中的社会偏见,发现机器生成的文本在多个领域比人类撰写的文本更具偏见。研究提出了新的偏差测量数据集和评估框架,强调在评估大型语言模型的公平性时需谨慎,尤其是在经济偏见和人口属性方面。研究结果表明,偏见在不同模型中普遍存在,呼吁采取有效的偏见缓解技术。

评估大型语言模型开放式生成偏见的指标模型偏见基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-14T00:00:00Z

作者使用TensorFlow测试一个小型LLM程序。步骤包括安装TensorFlow和NumPy,创建小数据集,定义LLM类,进行数据标记、输入序列创建、模型构建和训练。模型由嵌入层、LSTM和Dropout层组成,使用交叉熵损失函数和Adam优化器进行训练。最后,通过测试方法生成文本,避免重复单词。

使用TensorFlow在Python中创建用于测试的LLM

DEV Community
DEV Community · 2024-10-07T17:12:13Z

本研究提出了一种利用社交媒体点赞数评估故事质量的方法,并通过神经网络预测点赞数。同时探讨了情感分析在文学中的应用、生成文本的结构评估及意见挖掘方法,展示了大型语言模型在定性分析中的潜力,并强调了研究者的专业知识在新技术中的重要性。

分层叙事分析:揭示对生成性人工智能的看法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-17T00:00:00Z

本文探讨了大型语言模型(LLMs)与人类偏好的对齐问题,提出了广义偏好优化(GPO)和混合偏好优化(HPO)等多种优化方法,以提升模型的鲁棒性和生成文本的质量。同时,引入了新的损失函数和降采样方法,验证了其在处理噪声和优化性能方面的有效性。

纠正 KL 正则化神话:通过卡方偏好优化进行直接对齐而不过多参数化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-18T00:00:00Z

该论文探讨了长篇问答任务中的评估和数据集构建挑战,提出新模型以提高答案的真实性和准确性。研究指出现有评估指标不足,建议关注答案的相关性、可靠性和简洁性。通过引入新数据集和检测方法,分析了大型语言模型生成的幻觉现象,并提出改进方案以减少幻觉,提高生成文本的准确性。

长文问答中细粒度的幻觉检测与缓解

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-16T00:00:00Z

本文探讨了语言模型中的性别偏见,分析了其在生成文本中的表现及影响。研究创建了带有性别偏见的数据集,评估了模型在翻译和性别推断中的偏见程度,强调了减少偏见的重要性,并提出了改进建议。

GPT 中的令人惊讶的性别偏见

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-08T00:00:00Z
Vercel AI SDK现已提供Cohere服务

Vercel AI SDK现已支持Cohere,用户需安装相关包,并可使用AI SDK的核心方法生成文本。

Vercel AI SDK现已提供Cohere服务

Vercel News
Vercel News · 2024-06-17T13:00:00Z

本文探讨了利用自然语言处理和机器学习技术区分人类与机器生成文本的方法。研究表明,机器生成文本与人类文本的区别日益模糊,提出了基于信息理论的检测方法,并评估了多种模型的性能,为未来的文本检测提供了重要依据。

探索检测机器生成文本的局限性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-16T00:00:00Z
Vercel AI SDK现已提供Azure AI服务

Vercel AI SDK现已支持Azure AI服务,用户需安装相关包,并可与AI SDK核心方法一起使用,如生成文本。

Vercel AI SDK现已提供Azure AI服务

Vercel News
Vercel News · 2024-06-12T13:00:00Z

本文介绍了M-HalDetect数据集及其在幻觉检测和预防模型中的应用。通过细粒度偏好优化和拒绝抽样,显著降低了幻觉率。研究提出了新的评估基准RAH-Bench,分析了大型视觉语言模型中的幻觉问题,并探讨了缓解方法。FAVA模型在细粒度幻觉检测中表现优异,提升了生成文本的准确性。

通过精细的人工智能反馈检测和缓解大型视觉语言模型中的幻觉

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-22T00:00:00Z
[译] 大模型推理的极限:理论分析、数学建模与 CPU/GPU 实测(2024)

本文分析了大模型推理的速度瓶颈,探讨了访存带宽与算力的关系。实测数据表明,推理速度受限于访存带宽,尤其在生成文本时,模型逐个处理token,导致并行性不足。以Mistral 7B为例,计算推理所需的最小时间,强调低精度量化可降低延迟。建议在设计推理系统时考虑访存带宽的影响,以优化性能。

[译] 大模型推理的极限:理论分析、数学建模与 CPU/GPU 实测(2024)

ARTHURCHIAO'S BLOG
ARTHURCHIAO'S BLOG · 2024-04-06T00:00:00Z

本文研究了生成文本中使用分类器控制文本生成过程时,生成的文本分布与分类器训练集不一致的问题,并提出了基于不变性学习的解决方案和选择自然环境的启发式策略。实验证明分布转换对生成文本的困难性以及不变性方法在解决问题上的潜力。

学习在任意书写风格中生成文本

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-28T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码