小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
在DigitalOcean上使用Arcee AI的Trinity Large-Thinking进行高级推理

Arcee AI的Trinity Large-Thinking模型现已在DigitalOcean的Agentic Inference Cloud上公开预览,开发者可轻松运行推理工作负载,无需管理基础设施。该模型经过压力测试,适合复杂应用,支持长时间和多步骤操作。Trinity在OpenRouter上已处理超过3.4万亿个令牌,成为美国最常用的开放权重模型。

在DigitalOcean上使用Arcee AI的Trinity Large-Thinking进行高级推理

The DigitalOcean Blog
The DigitalOcean Blog · 2026-04-01T20:09:27Z
打破密集瓶颈:Voyage-4-large如何利用混合专家(MoE)进行扩展

本文介绍了Voyage AI在嵌入模型扩展方面的研究,特别是通过混合专家(MoE)架构提高效率。Voyage-4-large模型实现了75%的参数减少,同时保持检索准确率,显著降低计算成本和延迟。MoE模型通过优化设计有效解耦知识容量与计算成本。

打破密集瓶颈:Voyage-4-large如何利用混合专家(MoE)进行扩展

Voyage AI
Voyage AI · 2026-03-03T22:26:12Z
Amazon Bedrock 新增 18 个完全托管式开放权重模型,包括新的 Mistral Large 3 和 Ministral 3 模型

今天,Amazon Bedrock 正式推出来自多家公司的 18 个开放权重模型,包括 Mistral Large 3 和 Ministral 3 系列。客户可以根据需求选择模型,支持无服务器访问,优化性能和成本,适用于多种应用场景。

Amazon Bedrock 新增 18 个完全托管式开放权重模型,包括新的 Mistral Large 3 和 Ministral 3 模型

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-12-11T02:55:48Z
Mistral Large 3 现已在 Vercel AI Gateway 上可用

Mistral最新模型Mistral Large 3现已通过Vercel的AI Gateway访问,具有41亿活跃参数,采用稀疏专家混合架构。使用时需在AI SDK中设置为mistral/mistral-large-3。

Mistral Large 3 现已在 Vercel AI Gateway 上可用

Vercel News
Vercel News · 2025-12-02T13:00:00Z
AWS 一周综述:Amazon S3 Express One Zone 存储类降价、Pixtral Large 在 Amazon Bedrock 中推出、Amazon Nova Sonic 发布等(2025 年 4 月 14 日)

2025年AWS Summit在巴黎举行,汇聚全球云计算社区。AWS将S3 Express One Zone存储费用降低至最高85%。新发布的Pixtral Large 25.02模型和Amazon Nova Sonic语音对话体验提升了AI应用性能。同时,AWS更新了IAM Identity Center和WAF控制台,增强了用户体验和安全性。

AWS 一周综述:Amazon S3 Express One Zone 存储类降价、Pixtral Large 在 Amazon Bedrock 中推出、Amazon Nova Sonic 发布等(2025 年 4 月 14 日)

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-04-15T12:55:39Z
Amazon Bedrock 现已提供 Pixtral Large 25.02 模型

Pixtral Large 25.02 模型现已在 Amazon Bedrock 上推出,具备视觉和语言理解能力,支持多种语言和编程语言,适用于复杂任务。开发者可按需付费,无缝集成,享受高可用性和低延迟。多模态功能使用户能够轻松处理图像和文本,提升应用体验。

Amazon Bedrock 现已提供 Pixtral Large 25.02 模型

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-04-10T03:13:08Z
使用LangChain、Milvus、Anthropic Claude 3 Haiku和voyage-3-large构建RAG聊天机器人

RAG(检索增强生成)结合大型语言模型与外部知识源,提高对话AI的准确性和相关性。本文介绍如何利用LangChain、Milvus和Anthropic Claude 3构建RAG聊天机器人,并提供优化建议和成本计算工具,以帮助开发高效智能应用。

使用LangChain、Milvus、Anthropic Claude 3 Haiku和voyage-3-large构建RAG聊天机器人

DEV Community
DEV Community · 2025-02-22T01:08:59Z
voyage-3-large:新一代通用嵌入模型的最先进技术

voyage-3-large是一种新型多语言嵌入模型,在100个数据集的八个领域中表现优异,超越OpenAI-v3-large和Cohere-v3-English。该模型通过Matryoshka学习和量化训练,支持小维度和低存储成本,检索质量几乎不受影响,提供更高的灵活性和效率。

voyage-3-large:新一代通用嵌入模型的最先进技术

Voyage AI
Voyage AI · 2025-01-07T19:16:24Z
Stable Diffusion 3.5 Large 现已在 Amazon Bedrock 正式可用

Amazon Bedrock 现已支持 Stable Diffusion 3.5 Large 模型,具备81亿参数,能够根据文本生成高质量图像,适用于媒体和游戏行业。该模型支持多种风格,响应精准提示,提升创意和图像生成效率。用户可通过 AWS CLI 和 Python SDK 轻松生成图像。

Stable Diffusion 3.5 Large 现已在 Amazon Bedrock 正式可用

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2024-12-23T03:09:36Z

本研究提出了一种新颖的适应性元求解器Balans,专注于混合整数规划中的在线学习问题。实验结果表明,Balans在解决复杂优化实例时性能显著提升,超越了传统求解器和现有的大邻域搜索方法。

Balans: Adaptive Large Neighborhood Search Based on Multi-Armed Bandits for Mixed-Integer Programming Problems

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z

本研究提出了一种基于Q学习的自适应大邻域搜索算法(Q-ALNS),用于解决混合服务模式码头的卡车分配与调度问题。该模型有效集成了码头模式决策与卡车调度,显著降低了平均延误和周转时间,能够适应需求变化。

Integrated Trucks Assignment and Scheduling Problem with Mixed Service Mode Docks: An Adaptive Large Neighborhood Search Algorithm Based on Q-Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z
LWiAI播客第191期 - Sora泄露、Pixtral Large、OpenAI邮件档案

OpenAI的Sora视频生成器泄露,展示了其先进功能。Mistral推出Pixtral Large,增强了Le Chat的竞争力。微软在Ignite 2024发布新AI代理,巴黎初创公司H推出AI跑步者。亚马逊再投资40亿美元于Anthropic,显示行业联系加深。

LWiAI播客第191期 - Sora泄露、Pixtral Large、OpenAI邮件档案

Last Week in AI
Last Week in AI · 2024-12-05T17:37:22Z

FedCoLLM是一种高效的联邦共同调优框架,旨在通过轻量级适配器提升小型语言模型(SLM)的性能,同时保护数据隐私,使大型语言模型(LLM)在客户端数据上的表现与直接微调相当。

FedCoLLM: An Efficient Federated Co-tuning Framework for Large and Small Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-18T00:00:00Z

本研究提出了GraphRPM框架,用于在工业环境中挖掘大型属性图上的风险模式。该工具结合边相关图同构网络和优化的并行计算,降低了计算复杂性,支持有效的风险模式筛选,提升了工业应用的可解释性。

GraphRPM: Risk Pattern Mining on Industrial Large Attributed Graphs

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-11T00:00:00Z
刚刚!Stable Diffusion 3.5最强模型全家桶来了,三个型号

Stability AI发布Stable Diffusion 3.5模型,包括Large、Large Turbo和Medium版本。Large有80亿参数,适合高分辨率应用;Large Turbo速度更快;Medium适合消费级硬件,参数为25亿。新版本强调可定制性和多样化,适合科研和企业。Medium版本计划10月29日发布。

刚刚!Stable Diffusion 3.5最强模型全家桶来了,三个型号

机器之心
机器之心 · 2024-10-22T15:57:25Z

Meta发布了Llama 3.1,这是一个大规模的开源模型,性能与现有的SOTA模型相当甚至超过。Mistral AI也发布了Mistral Large 2,它的部署要求较低,但性能与Llama 3.1相当。HyperAI提供了这两个模型的一键部署教程。

在线教程丨超大模型部署无压力!一键运行 Llama 3.1 405B 和 Mistral Large 2

HyperAI超神经
HyperAI超神经 · 2024-08-08T03:02:15Z
ollama v0.3 发布,支持 Llama 3.1 和 Mistral Large 2

ollama v0.3已发布,支持最新的Llama 3.1模型,参数大小为8B、70B和405B。它还支持Mistral Large 2,具有更强大的代码生成、数学、推理等能力。更多详情和下载请访问https://github.com/ollama/ollama/releases/tag/v0.3.0。

ollama v0.3 发布,支持 Llama 3.1 和 Mistral Large 2

实时互动网
实时互动网 · 2024-07-26T02:19:45Z
零一万物发布千亿参数模型 Yi-Large,李开复:中国大模型赶上美国,立志比肩 GPT-5

中国大模型公司零一万物发布了第二款闭源模型Yi-Large,该模型在全球头部大模型的中英文双语PK中表现出色。Yi-Large在AlpacaEval 2.0的模型排行榜上排名世界第二,英语能力主要指标LC Win Rate排名世界第一。零一万物还宣布启动下一代Yi-XLarge MoE模型训练,冲击GPT-5的性能与创新性。此外,零一万物发布了一站式AI工作平台「万知」,提供会议纪要、周报、写作助手等功能。

零一万物发布千亿参数模型 Yi-Large,李开复:中国大模型赶上美国,立志比肩 GPT-5

爱范儿
爱范儿 · 2024-05-13T09:34:12Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码