小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文介绍了Being-0,一个为人形机器人设计的分层代理框架,旨在提升其在工厂中的自主执行能力。通过结合基础模型和技能库,解决了导航和操作中的不稳定性问题。新连接器模块增强了实时决策能力,使机器人能够高效完成复杂任务。

Being-0——集操作、导航、运动为一体的机器人Agent框架:GPT4o高层感知并推理规划、低层VLM导航适配,最终执行技能库

结构之法 算法之道
结构之法 算法之道 · 2025-04-30T06:09:32Z

KoalaAI 1.0.16预览版发布,新增可调会话面板,优化界面设计和图像创作功能,支持跨平台使用,并提供福利礼包和提示词优化模块,提升用户体验。

KoalaAI 发布1.0.16提供GPT4o免费图生图片模型

dotNET跨平台
dotNET跨平台 · 2025-04-14T23:58:20Z
GPT4o新版图片生成上手:丸辣!你是要毁了设计圈吗!

GPT4o推出的新绘图功能支持自然语言生成图像,角色一致性良好,适合设计师使用。尽管存在中文显示模糊和比例限制等小问题,但整体效果令人满意,降低了作图门槛。

GPT4o新版图片生成上手:丸辣!你是要毁了设计圈吗!

张洪Heo
张洪Heo · 2025-03-28T09:52:28Z

开源模型PhysVLM通过分析游戏视频中的物理故障,提升了AI对物理常识的理解,准确率超越GPT-4o达3.4%。该模型在PhysGame和Video-MME等多个基准测试中表现优异,展现了其在视频理解领域的先进性能。

游戏bug帮大模型学物理!准确率超GPT4o近4个百分点

量子位
量子位 · 2024-12-06T07:05:38Z

本文介绍了一种多轮AI助手应用,通过整合多个AI助手简化复杂工作流程,如市场调研、内容生成和图像创建。使用Tune Studio进行模型编排,Streamlit作为前端界面。每个助手负责特定任务并传递上下文,确保任务准确性和一致性,具有上下文保留和灵活性等优势。

构建多轮助手应用:使用Llama、Claude和GPT4o

DEV Community
DEV Community · 2024-10-18T17:32:13Z
mini-GPT4o来了? 能看、能听、会说,还情感丰富的多模态全能助手EMOVA

香港科技大学、香港大学和华为诺亚方舟实验室合作开发了EMOVA,一个多模态智能助手,能够处理图像、文本和语音,并通过情感控制实现人性化交流。EMOVA结合视觉编码器和语音分词器,支持情感丰富的语音对话,在复杂图像理解和语音生成方面表现优异。

mini-GPT4o来了? 能看、能听、会说,还情感丰富的多模态全能助手EMOVA

机器之心
机器之心 · 2024-10-02T03:34:28Z
首个超越GPT4o级开源模型!Llama 3.1泄密:4050亿参数,下载链接、模型卡都有了

Llama 3.1是一种大型语言模型,在Reddit上泄露。它包括8B、70B和405B的基准测试结果。与之前的版本相比,8B和70B模型显示出显著的性能改进。该模型支持多种语言,用于商业应用和研究。它经过15T+标记的训练,包括公共数据和合成数据。Llama 3.1针对对话使用案例进行了优化,并且在许多开源和闭源聊天模型中表现出色。建议在官方发布之前等待下载模型。

首个超越GPT4o级开源模型!Llama 3.1泄密:4050亿参数,下载链接、模型卡都有了

机器之心
机器之心 · 2024-07-23T03:17:41Z

一篇最新论文揭示了突破大模型安全措施的新漏洞。只要将请求中的时间改成过去,就能让GPT-4o泄露敏感信息。实验结果显示,GPT-4o的越狱成功率最高,达到88%。对于Llama-3的攻击效果稍弱,但成功率也有所增加。作者还发现,将来时间的效果不如过去明显。作者建议使用拒绝数据微调来防御攻击。这些发现对当前的语言模型对齐技术提出了新的挑战。

提示词用上“过去式“,秒破GPT4o等六大模型安全限制!中文语境也好使

量子位
量子位 · 2024-07-19T06:38:23Z

本文介绍了一种免费接入大语言模型(LLM)的方法,利用Cloudflare的AI Worker和Coze平台。用户可以自定义桌宠的性格和对话,通过API与桌宠互动。尽管Coze近期开始收费,但仍提供适合个人使用的强大gpt4o模型。

基于gpt4o的免费桌宠解决方案

晴雀宫
晴雀宫 · 2024-06-07T21:32:25Z

本文介绍了一种免费接入大语言模型(LLM)的方法,利用Cloudflare的AI Worker和Coze平台。用户可以通过API调用gpt4o模型,自定义桌宠性格并进行互动。尽管初期存在兼容性问题,但最终实现了良好的对话体验。近期,Coze开始收费并限制每日调用次数。

基于gpt4o的免费桌宠解决方案

晴雀宫
晴雀宫 · 2024-06-07T21:32:25Z
基于gpt4o的免费桌宠解决方案

本文介绍了将LLM模型接入vpet虚拟桌宠的免费方案。作者尝试了cloudflare的AI worker和coze.com的gpt4o模型,并解决了API调用问题。最后,作者给出了桌宠配置建议。

基于gpt4o的免费桌宠解决方案

十贰的小窝
十贰的小窝 · 2024-06-07T13:32:25Z

事情是这样的,我们公司不是有个读书小组嘛,但是今年大家都忙于工作,忽视了读书这件事,所以我就想着搞个群机器人,让它明天定时向群里推荐一本书,用来唤起大家对读书的兴趣。但在调试的过程中就发现gpt4o老喜欢推荐同样的几本书,这可就勾起我的... 我让gpt4o给我推荐了一千多次书 得到了这些数据最先出现在XINDOO。

我让gpt4o给我推荐了一千多次书 得到了这些数据

XINDOO的博客
XINDOO的博客 · 2024-05-26T14:14:37Z
中文得分世界第一,多项盲测并肩 GPT4o,这个国产大模型怎么就成了 AI 界的黑马?

中国大模型公司零一万物发布的闭源模型Yi-Large在LMSYS盲测竞技场中排名世界第7,中文得分世界第一。LMSYS的Chatbot Arena成为全球大厂硬碰硬的擂台,零一万物成为总榜上唯一一个进入前十的中国大模型企业。LMSYS采用Elo评分系统保证排名客观公正。大模型厂商应积极参与权威评测平台,提升产品竞争力。

中文得分世界第一,多项盲测并肩 GPT4o,这个国产大模型怎么就成了 AI 界的黑马?

爱范儿
爱范儿 · 2024-05-21T10:00:16Z

OpenAI发布了GPT4o模型,响应时间更快,性能出色。Freepik收购了Magnific,Magnific开发了AI图像增强产品。Perplexity、Dexa和Listen Notes提供个性化和精确的搜索结果。LinkedIn团队开发生成式AI产品体验。Deepmind发布了AlphaFold 3,预测生命分子结构和相互作用。Profluence开发AI基因编辑器。Moderna与OpenAI合作加速治疗方法开发。Udio是AI音乐生成器。OpenAI与Stack Overflow合作提高模型处理编程任务能力。Adobe Photoshop更新功能。

GPT4o“全能”模型发布;2人AI团队被收购;3款AI搜索引擎

OneFlow深度学习框架
OneFlow深度学习框架 · 2024-05-14T01:09:09Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码