小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
沉浸式翻译 immersive translate
Dify.AI
在Amazon SageMaker AI和Amazon Bedrock上高效服务数十个微调模型与vLLM

为解决多模型AI服务的闲置GPU成本问题,我们与vLLM社区合作开发了Multi-LoRA技术,允许多个模型共享同一GPU,优化MoE模型的推理性能。该技术通过保持原始权重不变,仅调整小型适配器,显著提升了输出速度并降低了延迟,适用于多个开源MoE模型,并已在Amazon SageMaker和Bedrock上实现。

在Amazon SageMaker AI和Amazon Bedrock上高效服务数十个微调模型与vLLM

vLLM Blog
vLLM Blog · 2026-02-26T00:00:00Z
AWS 一周综述:Amazon Bedrock 上线 Claude Sonnet 4.6、Kiro 在 GovCloud 区域推出、全新代理插件等(2026 年 2 月 23 日)

上周,团队在圣何塞的开发者周活动中与开发者交流,Vinicius Senger介绍了复兴式软件及AI协作,讨论了代理内存等话题。3月4日至6日将在亚特兰大举行dev/nexus大会,分享AI代理构建技巧。AWS发布了Claude Sonnet 4.6模型和Amazon EC2 HPC8a实例,增强了安全性和性能。

AWS 一周综述:Amazon Bedrock 上线 Claude Sonnet 4.6、Kiro 在 GovCloud 区域推出、全新代理插件等(2026 年 2 月 23 日)

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-02-23T03:48:34Z

本周的开篇新闻就是一个很好的例子:Amazon EC2 M8azn 实例正式推出。它们是通用型、高频率、高网络实例,由第五代 AMD EPYC 处理器提供支持,提供云中最高的 CPU 频率,达到 5 GHz。与上一代 M5zn 实例相比,M8azn 实例的计算性能最高提高了 2 倍,内存带宽提高了 4.3 倍,L3 缓存容量则增加了 10 倍。与 M5zn 相比,它们还提供最高 2...

AWS 一周综述:Amazon EC2 M8azn 实例,Amazon Bedrock 中的新开放权重模型等(2026 年 2 月 16 日)

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-02-16T05:20:07Z
基于Amazon Bedrock的云基础设施代码化自动解决方案实践

基础设施即代码(IaC)在云运维中应用广泛,但面临历史遗留问题、工具门槛高和运维效率低等挑战。通过结合人工智能(AI),开发了基于Amazon Bedrock的智能Terraform系统TerraPilot,提升资源导入效率80%,确保代码符合企业标准,并提供统一管理平台,优化运维流程。

基于Amazon Bedrock的云基础设施代码化自动解决方案实践

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-02-10T03:39:09Z
从代码到分子系列:一场由 AI 驱动的 EGFR 抑制剂发现之旅 — 深度融合 AWS Bedrock与 Claude Code/Claude Agent Skills,生命健康行业的科学活动探微

传统药物研发面临时间、经济和技能的挑战,周期长达10-15年,成本高达26亿美元,成功率不足5%。AI技术如Claude Agent Skills能够自动化药物发现流程,提高效率,降低人力成本,推动科学研究变革。

从代码到分子系列:一场由 AI 驱动的 EGFR 抑制剂发现之旅 — 深度融合 AWS Bedrock与 Claude Code/Claude Agent Skills,生命健康行业的科学活动探微

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-02-09T06:33:03Z

以下是上周的重要发布和更新,可帮助您在 AWS 上进行构建、扩展和创新。

AWS 一周综述:Amazon Bedrock 中的 Claude Opus 4.6、AWS 构建者 ID 支持苹果设备登录等(2026 年 2 月 9 日)

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-02-09T02:58:10Z
AWS上的Redis:借助Amazon Bedrock驱动实时AI应用

各行业企业迅速采用生成式AI,以提升聊天机器人、自动化和客户体验等应用。然而,LLM推理成本高且不可预测,延迟要求极低。Redis在AWS上提供实时AI架构,降低成本并保持低延迟,支持企业级耐用性和智能。结合Amazon Bedrock,Redis实现快速向量搜索和语义缓存,优化AI应用性能,确保实时数据同步,助力企业构建智能应用。

AWS上的Redis:借助Amazon Bedrock驱动实时AI应用

Redis Blog
Redis Blog · 2026-01-26T00:00:00Z
使用Amazon Bedrock + 自建ECS Docker Sandbox实现Agent 程序化工具调用Programmatic Tool Calling

本文介绍了最新的程序化工具调用(PTC)技术,利用亚马逊云科技ECS自托管Docker Sandbox与Amazon Bedrock兼容。PTC通过生成Python代码优化工具调用,提高效率、降低Token消耗并确保数据安全,适用于多种大模型,推动AI Agent工具调用的进步。

使用Amazon Bedrock + 自建ECS Docker Sandbox实现Agent 程序化工具调用Programmatic Tool Calling

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-01-23T08:14:26Z
快时尚电商行业智能体设计思路与应用实践(六)借助 Amazon Bedrock AgentCore MCP Server,Amazon Bedrock,Strands Agents,Kiro 实现智能体极速研发

在快时尚电商中,智能体研发需快速迭代以应对短产品生命周期和高频营销。Amazon Bedrock AgentCore MCP Server通过实时文档查询和动态配置管理,提高研发效率,简化开发流程,支持智能客服系统的快速构建与稳定交付。

快时尚电商行业智能体设计思路与应用实践(六)借助 Amazon Bedrock AgentCore MCP Server,Amazon Bedrock,Strands Agents,Kiro 实现智能体极速研发

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-12-16T08:46:31Z
亚马逊云科技在Amazon Bedrock中新增18款开放权重模型

亚马逊云科技在2025 re:Invent大会上宣布,Amazon Bedrock新增18款开放权重模型,包括Mistral Large 3和Ministral 3系列,进一步丰富全托管模型选择。

亚马逊云科技在Amazon Bedrock中新增18款开放权重模型

全球TMT-美通国际
全球TMT-美通国际 · 2025-12-11T02:56:36Z
Amazon Bedrock 新增 18 个完全托管式开放权重模型,包括新的 Mistral Large 3 和 Ministral 3 模型

今天,Amazon Bedrock 正式推出来自多家公司的 18 个开放权重模型,包括 Mistral Large 3 和 Ministral 3 系列。客户可以根据需求选择模型,支持无服务器访问,优化性能和成本,适用于多种应用场景。

Amazon Bedrock 新增 18 个完全托管式开放权重模型,包括新的 Mistral Large 3 和 Ministral 3 模型

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-12-11T02:55:48Z
Amazon Bedrock AgentCore 为部署可信人工智能代理增加了质量评估和策略控制

Amazon Bedrock AgentCore推出新功能,提升AI代理构建与部署效率,确保代理在安全边界内运作,提升内容生成速度,降低成本,助力各行业高效运营。

Amazon Bedrock AgentCore 为部署可信人工智能代理增加了质量评估和策略控制

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-12-11T02:04:17Z
快时尚电商行业智能体设计思路与应用实践(五)借助 AgentCore Runtime 与 Bedrock 模型平台,轻松实现 Claude Agent SDK 的生产级部署

在智能体开发中,运行环境与模型平台的差异常常导致问题。Claude Agent SDK与Amazon Bedrock结合,提供稳定的生产环境,支持长时间推理和工具调用。本文介绍如何搭建基于AgentCore Runtime与Bedrock的生产级环境,以帮助开发者将智能体应用于实际业务场景。

快时尚电商行业智能体设计思路与应用实践(五)借助 AgentCore Runtime 与 Bedrock 模型平台,轻松实现 Claude Agent SDK 的生产级部署

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-12-10T06:48:07Z
Amazon Bedrock 增加了强化微调功能,简化了开发人员构建更智能、更准确的 AI 模型的方式

组织在选择AI模型时可选择通用模型或定制高级模型。强化微调技术通过反馈提升模型性能,平均准确率提高66%。Amazon Bedrock自动化此过程,简化开发,支持高质量输出并降低成本,同时保障数据安全,适合多种业务需求。

Amazon Bedrock 增加了强化微调功能,简化了开发人员构建更智能、更准确的 AI 模型的方式

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-12-08T02:21:32Z
Amazon Bedrock与Amazon SageMaker AI推出模型定制全新功能

亚马逊云科技在2025 re:Invent大会上推出了Amazon Bedrock和SageMaker AI的新功能,简化了AI模型定制流程。Reinforcement Fine Tuning(RFT)提高了模型准确率,定制时间缩短至几天,开发者可选择引导模式或自主模式,平均准确率提升66%。

Amazon Bedrock与Amazon SageMaker AI推出模型定制全新功能

全球TMT-美通国际
全球TMT-美通国际 · 2025-12-05T03:11:49Z
亚马逊云科技宣布Amazon Bedrock AgentCore推出多项新功能

亚马逊云科技在2025 re:Invent大会上推出Amazon Bedrock AgentCore新功能,支持企业安全构建和部署Agent。新功能包括设定操作边界的Policy、简化评估流程的AgentCore Evaluations,以及帮助Agent从经验中学习的episodic记忆功能,以优化决策和处理时间。

亚马逊云科技宣布Amazon Bedrock AgentCore推出多项新功能

全球TMT-美通国际
全球TMT-美通国际 · 2025-12-04T02:18:00Z
如何使用Amazon Lex、Bedrock和S3构建基于检索增强生成(RAG)的AI聊天机器人

本文介绍了如何构建一个基于检索增强生成(RAG)的AI聊天机器人,专门用于回答火星旅行政策的问题。通过使用Amazon S3存储旅行政策文档,聊天机器人能够从知识库中提取准确答案,而非依赖预训练数据。结合Amazon Lex和Bedrock,用户可以创建一个智能且上下文相关的聊天系统。

如何使用Amazon Lex、Bedrock和S3构建基于检索增强生成(RAG)的AI聊天机器人

freeCodeCamp.org
freeCodeCamp.org · 2025-12-03T22:34:26Z
AWS简化了在Bedrock和SageMaker中定制AI模型的过程,无需博士学位。

AWS在拉斯维加斯推出Nova Forge,允许企业使用自有数据定制大型语言模型。同时,SageMaker和Bedrock也增强了模型定制选项,简化开发流程,提高模型性能。

AWS简化了在Bedrock和SageMaker中定制AI模型的过程,无需博士学位。

The New Stack
The New Stack · 2025-12-03T19:30:44Z
Dify集成Amazon Bedrock AgentCore Browser  实现更强大的信息获取和分析能力

Dify是一个开源AI应用开发平台,但在复杂网页交互中遇到困难。Amazon Bedrock推出的AgentCore Browser提供安全的云端浏览器环境,支持动态内容获取和复杂交互。通过集成AgentCore Browser,Dify用户可以实现信息获取和分析的自动化,增强AI应用能力。

Dify集成Amazon Bedrock AgentCore Browser 实现更强大的信息获取和分析能力

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-12-03T08:37:55Z
基于Strands Agents SDK和Amazon Bedrock AgentCore构建商品详情图广告词审查Agent

随着制造业数字化转型,商品详情页的广告图片需经过法务审核以确保合规。为提高审核效率,本文提出基于Strands Agents SDK和Amazon Bedrock的自动化审核方案,利用多Agent模式实现智能审核,加速产品上架。

基于Strands Agents SDK和Amazon Bedrock AgentCore构建商品详情图广告词审查Agent

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-12-03T02:39:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码