小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
为下一个美国世纪赋能:美国能源部长克里斯·赖特与NVIDIA副总裁伊恩·巴克谈“创世纪任务”

美国能源部长克里斯·赖特与NVIDIA副总裁伊恩·巴克在SCSP AI+博览会上讨论了“创世纪任务”,旨在通过人工智能推动科学发现。赖特强调电力对AI发展的重要性,并呼吁改善电网以满足日益增长的能源需求。两者认为,AI和能源是推动人类进步的关键因素。

为下一个美国世纪赋能:美国能源部长克里斯·赖特与NVIDIA副总裁伊恩·巴克谈“创世纪任务”

NVIDIA Blog
NVIDIA Blog · 2026-05-07T19:14:38Z
麻省理工学院的递归语言模型提升了长上下文任务的表现

麻省理工学院的研究人员提出了一种递归语言模型(RLM),旨在提升大语言模型(LLM)在长上下文任务中的表现。RLM通过编程环境递归处理输入,能够处理比基础LLM长100倍的提示。其核心在于利用编程语言(如Python)生成代码,以分块或搜索正则表达式等方式预处理提示。研究表明,RLM在长上下文基准测试中优于其他策略,有效解决了上下文窗口限制的问题。

麻省理工学院的递归语言模型提升了长上下文任务的表现

InfoQ
InfoQ · 2026-01-20T14:00:00Z
AI 论文周报丨英伟达开源模型/OpenAI基准测试/Agent系统/长上下文推理……AI 动态一文速递

大语言模型(LLMs)在推荐系统中展现出潜力,但RecGPT-V1存在计算效率低和模板多样性不足的问题。阿里团队推出了RecGPT-V2,采用分层多智能体系统和元提示框架等创新,验证了其在工业场景中的可行性。

AI 论文周报丨英伟达开源模型/OpenAI基准测试/Agent系统/长上下文推理……AI 动态一文速递

HyperAI超神经
HyperAI超神经 · 2025-12-19T05:08:08Z
长对话语音合成,突破多说话人与时长限制 | 开源日报 No.823

Serial-Studio 是一个跨平台的实时遥测数据工作台,支持多种数据输入源和自定义可视化界面。VibeVoice 是开源的语音AI框架,支持多说话人长篇语音合成。agents.md 提供编程智能代理的项目指导,bash_unit 是 Bash 脚本的单元测试框架,具备丰富的测试功能。onedrive-cf-index-ng 是 OneDrive 文件分享解决方案。

长对话语音合成,突破多说话人与时长限制 | 开源日报 No.823

开源服务指南
开源服务指南 · 2025-12-18T07:35:56Z
家长呼吁纽约州长签署具有里程碑意义的人工智能安全法案

超过150名家长致信纽约州长霍楚,呼吁签署《负责任的人工智能安全与教育法案》,该法案要求大型AI开发商制定安全计划并报告安全事件。霍楚提议对法案进行大幅修改,引发AI公司反对。家长们强调该法案应成为法律,以保护儿童免受AI和社交媒体的伤害。

家长呼吁纽约州长签署具有里程碑意义的人工智能安全法案

The Verge
The Verge · 2025-12-12T22:16:09Z
【音视频】如何埋点统计播放器卡顿率和卡顿时长

本文探讨了如何在播放器 SDK 中准确统计有效播放时长和卡顿时长,以计算播放卡顿率。通过定义事件类型和状态,记录播放过程中的各种事件,能够有效区分用户操作与真实卡顿,从而提供精确的播放质量数据。

【音视频】如何埋点统计播放器卡顿率和卡顿时长

实时互动网
实时互动网 · 2025-12-03T02:57:05Z

OpenAI首席研究员Mark Chen在访谈中表示,Meta与OpenAI之间的人才争夺已演变为“送汤大战”。他强调OpenAI仍专注于AI研究,内部有300个项目,团队对未来充满信心。Chen提到,OpenAI在预训练方面有信心与Gemini 3竞争,并计划推出更强模型,保持人才是关键,团队文化仍以研究为中心。

OpenAI首席研究员Mark Chen长访谈:小扎亲手端汤来公司挖人,气得我们端着汤去了Meta

量子位
量子位 · 2025-12-03T00:27:35Z

中国联通研究团队在AAAI 2026上发布了HiMo-CLIP模型,解决了长文本图像检索中的语义层级和单调性问题。该模型通过动态特征提取和对齐机制,显著提高了长短文本的检索精度,性能优于现有模型。

让大模型学会“高维找茬”,中国联通新研究解决长文本图像检索痛点|AAAI 2026 Oral

量子位
量子位 · 2025-12-01T08:49:46Z
天使降临到了我身边!联动烟花大会——长瀞船玉节 2025

2025年8月15日,作者参加了长瀞船玉节,尽管遇到大雨,但仍欣赏到美丽的烟花和灯船,活动吸引了众多游客,作者获得了前排位置。尽管天气影响了体验,作者仍感到欣慰,并希望明年能有好天气。

天使降临到了我身边!联动烟花大会——长瀞船玉节 2025

维基萌
维基萌 · 2025-08-28T23:05:56Z
引导长上下文语言模型的上下文检索与推理

近期长上下文语言模型(LCLMs)的进展有望简化检索增强生成(RAG)流程。LCLMs能够直接处理知识库进行检索和推理。本文提出了ICR2基准,以更真实地评估LCLMs的性能,并提出了提升LCLM性能的方法,包括检索后生成微调和联合训练检索头与生成头。通过对四个LCLMs的广泛基准测试,我们的方法在多个任务上显著优于现有模型。

引导长上下文语言模型的上下文检索与推理

Apple Machine Learning Research
Apple Machine Learning Research · 2025-08-12T00:00:00Z
从复杂文档提取结构化数据:支持长文档与批量并行处理 | 开源日报 No.671

go-interview-practice 是一个开源项目,帮助用户通过 Go 语言编程挑战准备技术面试,支持在线编写和测试代码。agentic-doc 是一个 Python 库,用于从复杂文档中提取结构化数据。flexile 简化了承包商付款流程。CVE-2024-23897 是 Jenkins 的安全漏洞,可能导致任意文件读取和远程代码执行。

从复杂文档提取结构化数据:支持长文档与批量并行处理 | 开源日报 No.671

开源服务指南
开源服务指南 · 2025-07-20T07:35:59Z

Linebender 组织在 6 月取得进展,优化了 Rust GUI 项目,提升了 Vello 和 Masonry 的性能,并发布了 Parley 0.5.0 版本。讨论了变参泛型的局限性,分享了 LZ4 压缩优化经验,并提供了新手编写 Rust 代码的技巧。同时,Wgpu 发布了新版本,Minmath 数学库已创建,Aralez 提供高性能反向代理服务。

【Rust日报】2025-07-10 文章:某些变长参数泛型提议的不可行之处,以及真正的方向

Rust.cc
Rust.cc · 2025-07-11T00:25:48Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

微软推出深度视频探索智能体,登顶多个长视频理解基准

机器之心
机器之心 · 2025-06-30T03:38:29Z
MiniMax发布M1:一款用于长上下文推理和软件任务的4560亿混合注意力模型

MiniMax推出了MiniMax-M1,这是一个具有4560亿参数的开放权重语言模型,支持长上下文推理和工具使用,采用高效的“闪电注意力”机制。该模型在长上下文任务和软件工程方面表现优异,尽管用户反映其在实际应用中的局限性,但仍被视为开放权重模型的佼佼者。

MiniMax发布M1:一款用于长上下文推理和软件任务的4560亿混合注意力模型

InfoQ
InfoQ · 2025-06-24T18:55:00Z

机器之心数据服务已上线,提供高效稳定的数据获取,简化数据爬取流程。

ICML 2025 | 千倍长度泛化!蚂蚁新注意力机制GCA实现16M长上下文精准理解

机器之心
机器之心 · 2025-06-13T16:13:24Z

机器之心数据服务现已上线,提供高效稳定的数据获取服务,帮助用户轻松获取所需数据。

SAVANA:使用长读长测序对细胞畸变进行精准测量分析

机器之心
机器之心 · 2025-06-05T04:00:29Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

强化学习解决长上下文推理问题:通义推出QwenLong-L1-32B

机器之心
机器之心 · 2025-05-27T10:20:23Z
Gemma 3支持视觉语言理解、长上下文处理和改进的多语言能力

谷歌开源的生成性人工智能模型Gemma 3具备视觉语言理解、长上下文处理和多语言能力。新特性包括减少的KV缓存内存、自定义Sigmoid损失的视觉编码器,以及改进的图像处理算法。Gemma 3支持高达128k的上下文,性能优于前代模型,适合单个消费者GPU或TPU主机。

Gemma 3支持视觉语言理解、长上下文处理和改进的多语言能力

InfoQ
InfoQ · 2025-05-20T22:15:00Z

本文针对大语言模型在实际长上下文信息利用中面临的挑战,提出了一种名为SoLoPO的框架。该框架将长上下文偏好优化分为短上下文偏好和短到长的奖励对齐两个组件,有效提升了模型在长上下文场景下的能力。实验结果表明,SoLoPO在各类长上下文基准测试中显著改善了模型的长度和领域泛化能力,并在计算和内存效率上取得了明显提升。

SoLoPO:通过短到长的偏好优化解锁大语言模型的长上下文能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-16T00:00:00Z
我的第一篇文章

这是对一篇长文章的总结。

我的第一篇文章

DEV Community
DEV Community · 2025-05-10T14:09:22Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码