小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
从递归神经网络到变换器

自然语言处理经历了巨大的演变,传统的序列到序列模型依赖递归神经网络(RNN),但在处理长序列时存在信息瓶颈。为了解决这一问题,引入了注意力机制,使解码器能够动态关注输入序列的不同部分。现代的Transformer模型通过堆叠注意力层,能够高效处理复杂的序列数据,广泛应用于文本生成和图像处理等领域。

从递归神经网络到变换器

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-04-07T22:30:09Z
创造力是温柔的谎言

大模型生成文本时,通过预测下一个词元输出,使用Temperature、Top-p和Top-k参数控制输出的随机性和创造性。Temperature调节概率分布的尖锐程度,Top-k和Top-p限制候选词元的数量和概率密度。这些方法旨在提高生成内容的多样性和创造性,但模型仍基于概率随机选择,缺乏真正的创造过程。

创造力是温柔的谎言

Surmon.me
Surmon.me · 2026-03-29T16:00:21Z

自2022年底发布以来,OpenAI的ChatGPT迅速普及。基于Transformer架构的大语言模型(LLM)展现出强大能力,尤其在文本生成和教学中表现优异,但仍需人类引导。未来,LLM可能面临训练数据劣化的瓶颈,并与人类智能存在本质差异。

三年LLM:过去和未来

Yi's Blog
Yi's Blog · 2026-03-28T05:00:00Z
面向未来的思考:变压器的潜在前瞻训练

本文介绍了一种名为“潜在前瞻”的训练策略,旨在提升自回归语言模型的文本生成能力。该方法通过多步前瞻提高预测准确性,实验结果显示其在迷宫求解、数独和ProsQA等任务中显著优于传统模型。

面向未来的思考:变压器的潜在前瞻训练

Apple Machine Learning Research
Apple Machine Learning Research · 2026-03-25T00:00:00Z
如何构建和优化AI中的RAG以获得可靠的答案

RAG(检索增强生成)结合信息检索与文本生成,通过外部数据源获取信息,生成准确响应,减少AI幻觉,提升生成质量,适用于客服聊天机器人等。构建RAG系统需关注数据、检索与生成,确保信息相关性和安全性,Meilisearch可优化检索过程,提升系统可靠性。

如何构建和优化AI中的RAG以获得可靠的答案

meilisearch blog
meilisearch blog · 2026-03-24T00:00:00Z

本文介绍了如何使用vLLM进行离线推理,特别是在视觉语言模型中采用正确的提示格式进行文本生成。示例展示了多种模型的提示格式和参数设置,以确保在不同GPU上有效运行。

【vLLM 学习】Vision Language

HyperAI超神经
HyperAI超神经 · 2026-03-09T02:10:53Z

人工智能(AI)是让机器模仿人类智能的技术,大语言模型(LLM)是其新分支,能够生成文本。LLM基于统计和概率生成语言,但缺乏理解力和意识,可能出现“AI幻觉”。使用时需人类审核,并撰写高质量提示词以提升输出质量。

什么是 AI,什么是大语言模型,缺点分析,以及使用技法和技巧总结

Peijie's Wiki
Peijie's Wiki · 2026-03-08T00:00:00Z
AI Gateway支持OpenAI的Responses API

OpenAI的Responses API现已通过AI Gateway提供,作为Chat Completions API的现代替代方案。用户可以使用OpenAI SDK与AI Gateway连接,支持TypeScript和Python。该API支持文本生成、工具调用、结构化输出和推理功能。

AI Gateway支持OpenAI的Responses API

Vercel News
Vercel News · 2026-03-06T13:00:00Z
Inception表示其扩散语言模型比Claude、ChatGPT和Gemini快10倍

Inception Labs推出了基于扩散模型的语言模型Mercury 2,其速度比传统自回归模型快5到10倍,采用并行计算优化响应时间。尽管生成文本质量与Claude Haiku和Google Flash相当,但在经济性上更具优势。Mercury 2现已通过OpenAI兼容API提供。

Inception表示其扩散语言模型比Claude、ChatGPT和Gemini快10倍

The New Stack
The New Stack · 2026-03-02T21:30:30Z

本文介绍了使用vllm库生成文本的代码示例,包括采样参数设置、提示和答案的定义,以及通过LLM模型生成文本并验证输出的过程。

【vLLM 学习】Tpu

HyperAI超神经
HyperAI超神经 · 2026-03-02T05:31:10Z

谷歌推出Nano Banana 2图像生成模型,具备快速智能与高视觉质量,支持精确的文本生成与翻译,提升创作控制和角色一致性,适用于多种工作流程,已在谷歌产品中上线。

Nano Banana 2:将专业能力与闪电般的速度相结合

The Keyword
The Keyword · 2026-02-26T16:00:00Z
模力方舟 MCP Server 上线:在 Cursor 里玩 AI 生图+语音

模力方舟推出MCP Server,支持文本生成图片和语音功能。用户可通过MCP协议在Cursor等工具中快速生成图像和语音,简化开发流程,实现多模态AI助手。

模力方舟 MCP Server 上线:在 Cursor 里玩 AI 生图+语音

Gitee 官方博客
Gitee 官方博客 · 2026-01-26T07:31:55Z
nanobot-gpt

本文介绍了GPT模型的配置和实现细节,包括序列长度、词汇表大小、层数和注意力机制。重点讨论了RMSNorm归一化方法、旋转嵌入的应用、注意力层的实现,以及模型的初始化和优化策略。最后,介绍了生成文本时的采样方法,如Top-K采样和温度调整。

nanobot-gpt

plus studio
plus studio · 2026-01-18T00:00:00Z
Vercel AI Gateway 现已支持 OpenResponses API

Vercel AI Gateway 是 OpenAI OpenResponses API 的首批合作伙伴,提供统一的多供应商 AI 交互接口,支持文本生成、流式传输、工具调用和图像输入等功能。

Vercel AI Gateway 现已支持 OpenResponses API

Vercel News
Vercel News · 2026-01-15T13:00:00Z
使用Vercel AI SDK构建支持代理

Vercel AI SDK是一个TypeScript工具包,用于构建AI功能,支持文本生成和嵌入。新课程教授如何创建自主决策的客户支持代理,利用支持文档和实时网络搜索回答问题,涵盖嵌入、检索和结构化输出等主题。

使用Vercel AI SDK构建支持代理

freeCodeCamp.org
freeCodeCamp.org · 2025-12-23T16:34:48Z
【案例共创】昇腾NPU部署SDXL文生图模型

本文介绍了在华为开发者空间中使用昇腾NPU部署SDXL文生图模型的案例。SDXL是一种先进的文本生成图像模型,适合个人开发者和高校学生,预计操作时间为30分钟。用户可通过Notebook环境进行代码开发,生成不同主题的图像,如三体太空电梯和古风美女。

【案例共创】昇腾NPU部署SDXL文生图模型

华为云官方博客
华为云官方博客 · 2025-12-22T14:30:00Z
适合树莓派的7款小型AI模型

本文介绍了七种适合低功耗设备(如树莓派)的小型AI模型,这些模型体积小但性能强大,能够进行文本生成、视觉理解和工具调用。其中,Qwen3系列表现突出,适合本地AI实验,展示了小型AI的潜力。

适合树莓派的7款小型AI模型

KDnuggets
KDnuggets · 2025-12-22T14:17:30Z

本文展示了如何通过前缀缓存优化大语言模型的文本生成,并比较了启用与未启用前缀缓存的生成结果,以验证文本生成的一致性和性能提升。

【vLLM 学习】Prefix Caching

HyperAI超神经
HyperAI超神经 · 2025-12-17T08:54:42Z
使小型语言模型能够解决复杂推理任务

麻省理工学院的研究人员开发了“DisCIPL”框架,通过结合大型语言模型与小型模型,提高了文本生成和推理任务的效率与准确性,降低了计算成本,为未来的数学推理和模糊偏好处理奠定了基础。

使小型语言模型能够解决复杂推理任务

MIT News - Computer Science and Artificial Intelligence Laboratory (CSAIL)
MIT News - Computer Science and Artificial Intelligence Laboratory (CSAIL) · 2025-12-12T20:30:00Z
用于分类生成建模的连续增强离散扩散模型

本文介绍了连续增强离散扩散模型(CADD),该模型通过在连续潜在空间中增强离散状态空间,解决了传统离散扩散模型的信息缺失问题。CADD利用噪声潜在向量表示被遮蔽的标记,提升了文本生成、图像合成和代码建模的生成质量,并在多样性与上下文精确性之间实现了灵活控制。

用于分类生成建模的连续增强离散扩散模型

Apple Machine Learning Research
Apple Machine Learning Research · 2025-12-10T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码