小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Workers AI 正在构建支持超大语言模型的基础设施,通过硬件优化、预填解码分离、提示缓存和 KV 缓存优化等技术,提高了模型的处理速度和效率。新推出的推测解码技术加速了推理过程,Cloudflare 的专有推理引擎 Infire 进一步提升了多 GPU 支持和启动速度,确保模型高效运行。

构建支持超大语言模型的基础设施

The Cloudflare Blog
The Cloudflare Blog · 2026-04-16T14:00:00Z
谷歌推出了Gemini 3.1 Flash-Lite,这是其迄今为止最快的Gemini 3模型

谷歌推出了Gemini 3.1 Flash-Lite,这是其最快的AI模型,专为高容量开发者工作负载设计,价格为每百万输入/输出令牌0.25美元。尽管比前一版本贵,但性能显著提升,处理速度可达每秒363个令牌,仍比竞争对手快两到五倍,适合高容量任务和数据处理。

谷歌推出了Gemini 3.1 Flash-Lite,这是其迄今为止最快的Gemini 3模型

The New Stack
The New Stack · 2026-03-03T18:17:12Z
Jeff Dean 深度访谈:一页纸备忘录促成 Gemini 的诞生,Google AI 的反击与 10,000 Token 的未来

Jeff Dean 参与了 Google 的 AI 基础设施建设,包括 Gemini 项目。他在播客中讨论了蒸馏技术、AI 模型的需求与未来发展,强调前沿模型与小模型的关系,以及通过分层检索实现复杂任务的方式。他预测个性化模型将超越通用模型,未来目标是达到每秒处理 10,000 个 token 的速度。

Jeff Dean 深度访谈:一页纸备忘录促成 Gemini 的诞生,Google AI 的反击与 10,000 Token 的未来

宝玉的分享
宝玉的分享 · 2026-02-17T00:00:00Z
FlexiCodec:3-12.5Hz超低帧率动态音频编解码器

FlexiCodec是一种新型音频编解码器,支持低于10Hz的超低帧率,旨在提高语义信息的保留。通过动态帧率、ASR引导的语义和可控帧率,FlexiCodec在音频质量和处理速度上表现优异,适用于多种应用场景。

FlexiCodec:3-12.5Hz超低帧率动态音频编解码器

实时互动网
实时互动网 · 2025-10-20T03:36:13Z

Meta推出的SAM 3模型实现了通过语言提示在图像中识别和分割多个实例。该模型支持多模态提示,具备快速处理和高准确率,但对复杂语言的理解能力有限。

Meta「分割一切」3.0曝光!技能语义分割加入概念提示,好好玩,要爆了

量子位
量子位 · 2025-10-13T03:43:53Z
谷歌重新推出其AI驱动的‘Ask Photos’搜索工具,并提升了处理速度

谷歌重新推出了其AI驱动的“Ask Photos”搜索工具,并提升了处理速度。该工具现在可以更快地响应简单搜索,如“海滩”或“狗”。用户反馈促使谷歌改进该功能,以便更快返回照片,同时在后台处理复杂查询。该功能现已向更多美国用户开放。

谷歌重新推出其AI驱动的‘Ask Photos’搜索工具,并提升了处理速度

The Verge
The Verge · 2025-06-26T23:42:26Z
高效地拆分文本文件的Java方法

在处理大文本文件时,传统Java代码效率低,频繁内存分配和数据复制。建议使用零拷贝技术,通过FileChannel的transferTo方法直接进行磁盘间传输,确保行完整性。该方法在处理短行日志文件时表现优异,显著提升处理速度。

高效地拆分文本文件的Java方法

DEV Community
DEV Community · 2025-05-09T14:27:43Z
边缘计算中的人工智能:架构、优势与权衡

人工智能正向边缘计算发展,嵌入式AI使设备能够快速决策,提高处理速度和隐私保护。边缘设备需关注硬件要求和编程复杂性,尽管成本降低,维护和部署仍面临挑战。

边缘计算中的人工智能:架构、优势与权衡

The New Stack
The New Stack · 2025-05-01T17:00:01Z
OpenAI推出价格更便宜的Flex API接口 处理速度较慢但只需要半价即可使用

OpenAI推出了价格更低的Flex API,适合处理不紧急的异步任务,响应速度较慢,需实名认证。Flex API的费用为常规API的一半,但仍高于竞争对手。

OpenAI推出价格更便宜的Flex API接口 处理速度较慢但只需要半价即可使用

蓝点网
蓝点网 · 2025-04-18T05:30:33Z
大规模多租户应用的域名别名处理速度更快

Vercel的多租户应用优化了别名处理速度,时间缩短至95%。

大规模多租户应用的域名别名处理速度更快

Vercel News
Vercel News · 2025-03-14T13:00:00Z

本研究提出了一种几何重新定位(GeoRT)算法,旨在解决远程操作中的手部重定向问题。该算法以无监督方式将人类手指关键点转换为机器人手关键点,具备1KHz的处理速度和高精度,提供可扩展的实时解决方案。

几何重新定位:一种原则性超快速神经手部重新定位算法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-10T00:00:00Z
解锁效率:LServe在长序列语言模型中的突破

长序列语言模型(LLMs)在处理大数据集时效率低下。LServe通过稀疏注意机制和两级索引优化,显著提升了处理速度和内存使用,适用于医疗、金融和教育等领域,推动了AI应用的发展,增强了模型的性能和实用性。

解锁效率:LServe在长序列语言模型中的突破

DEV Community
DEV Community · 2025-02-22T16:08:32Z

Kimi的新论文提出了一种名为MoBA的长文注意力机制,能够将处理1M长文本的速度提升6.5倍。该机制通过将上下文划分为块,并利用top-k门控机制选择相关信息,从而提高长序列数据的处理效率。MoBA在保持模型性能的同时,支持全注意力与稀疏注意力模式的切换,具有良好的扩展性。

Kimi新论文再次“撞车”DeepSeek,都谈到了长文注意力机制

量子位
量子位 · 2025-02-19T06:26:18Z
阿里云通义开源长文本模型及推理框架,百万Tokens处理速度提升近7倍

阿里云推出开源Qwen2.5-1M模型,支持100万Tokens上下文,处理长文本任务超越GPT-4o-mini。该模型有7B和14B两种版本,推理速度提升近7倍,适合长篇小说和学术论文解析。开发者可在多个平台下载体验。

阿里云通义开源长文本模型及推理框架,百万Tokens处理速度提升近7倍

机器之心
机器之心 · 2025-01-27T11:44:17Z
为什么DeepSeek可能成为取代ChatGPT Premium的AI工具!

DeepSeek V3是中国初创公司推出的开源AI模型,拥有6710亿参数,采用Mixture-of-Experts架构,处理速度达到每秒60个token,是前代的三倍,API定价低于竞争对手,提升了AI的可及性。

为什么DeepSeek可能成为取代ChatGPT Premium的AI工具!

DEV Community
DEV Community · 2025-01-25T15:43:58Z

本文提出了一种算法,解决了中国象棋应用开发中判断比赛结果的问题,能够准确处理WXF手册中的所有案例,并显著提高了重复局面的处理速度,提升了评分和胜率。

Comprehensive Implementation of WXF Chinese Chess Rules

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-23T00:00:00Z

本研究提出了一种量化感知训练管道,以解决MedSAM模型在医学图像分割中对计算资源的高需求问题。该方法通过OpenVINO推理引擎进行部署,实验结果表明在提高处理速度的同时保持了可接受的准确性,具有重要的临床应用潜力。

Efficient Quantization-Aware Training and Deployment of the Segmentation Anything Model in Medical Images

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-15T00:00:00Z
Google AI 发布 Gemini 2.0 Flash:比 Gemini 1.5 Pro 快 2 倍的全新 AI 模型

谷歌AI研究推出Gemini 2.0 Flash,显著提升处理速度和多模式功能,速度是Gemini 1.5 Pro的两倍,支持实时音视频处理和图像生成,集成多语言音频输出及工具交互改进,助力软件工程任务,未来功能有望进一步扩展。

Google AI 发布 Gemini 2.0 Flash:比 Gemini 1.5 Pro 快 2 倍的全新 AI 模型

实时互动网
实时互动网 · 2024-12-12T03:02:53Z

该研究提出了一种新颖的单阶段共享高效框架EOV-Seg,旨在提升全景分割的效率。通过引入词汇感知选择模块和双向动态嵌入专家,EOV-Seg在开放词汇环境下显著提高了处理速度和性能,其推理速度比现有方法快4到21倍。

高效开放词汇全景分割:EOV-Seg

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-11T00:00:00Z

本研究提出了一种新系统,使用Open AI的Whisper替代传统音频特征提取模型,解决了实时谈话头像生成中的延迟问题。实验结果表明,Whisper提高了处理速度和渲染质量,增强了AI化身在采访者培训中的应用潜力。

Comparative Analysis of Audio Feature Extraction for Real-Time Conversational Avatar Synthesis

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-20T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码