小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
8B模型做生物实验:实验步骤顺序不乱、剂量无幻觉|ICLR 2026

上海人工智能实验室与复旦、上海交通大学团队提出了Thoth模型,旨在生成可执行的生物实验protocol。该模型通过结构化推理,确保实验步骤的合理性和准确性。团队构建的SciRecipe数据集涵盖27个生物学领域,提升了实验方案生成的可靠性。Thoth在多个评估中表现优异,标志着AI在生命科学研究中的新应用方向。

8B模型做生物实验:实验步骤顺序不乱、剂量无幻觉|ICLR 2026

量子位
量子位 · 2026-05-18T06:52:11Z
Vision-DeepResearch:首个长时序多模态深度研究模型,8B 参数干翻 GPT-5

Vision-DeepResearch是首个长时序多模态深度研究模型,拥有8B参数,超越了GPT-5等闭源模型。它支持多轮推理和多实体搜索,采用创新训练策略,展现了开源模型在智能信息检索和自动化研究助手中的潜力。

Vision-DeepResearch:首个长时序多模态深度研究模型,8B 参数干翻 GPT-5

Micropaper
Micropaper · 2026-02-28T17:50:00Z

蚂蚁推出AlignXplore+,通过文本化用户建模实现个性化,突破传统推荐系统的局限。该模型具备全域通用、极致迁移和实战适配三大特性,能够有效理解用户偏好,提升个性化应用的准确性和鲁棒性。

蚂蚁用8B小模型构建用户“话”像,跨任务跨模型通用且SOTA

量子位
量子位 · 2026-01-31T12:36:45Z

英伟达推出的Orchestrator-8B模型以更低成本和更快速度超越GPT-5,并在HLE人类终极考试中获得更高分数。该模型通过协调多种工具,优化解题过程,展示了小模型在AI领域的潜力。

英伟达巧用8B模型秒掉GPT-5,开源了

量子位
量子位 · 2025-12-06T06:10:21Z

抖音SAIL团队与LV-NUS Lab联合推出的SAIL-VL2多模态大模型在106个数据集上取得了显著突破,尤其在复杂推理任务中表现出色。该模型通过创新架构和数据处理,展现了小参数规模模型的强大能力,具备细粒度视觉感知和复杂推理能力,成为开源领域的领先者。

抖音&LV-NUS开源多模态新模,以小博大刷新SOTA,8B推理比肩GPT-4o

量子位
量子位 · 2025-10-14T03:17:20Z

机器之心数据服务现已上线,提供高效稳定的数据获取服务,简化数据爬取流程。

8B模型可以超过GPT-4o!并行KV Cache压缩支持的128K长度外推方法ParallelComp

机器之心
机器之心 · 2025-06-25T07:42:43Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

开源版MetaQuery来了!OpenUni用1.1B参数媲美BLIP3-o-8B,数据代码完全开源

机器之心
机器之心 · 2025-06-22T12:14:01Z

机器之心数据服务现已上线,提供高效稳定的数据获取服务,简化数据爬取流程。

256块NPU训成8B视频模型、超越Sora等一众闭源!抖音内容技术团队开源ContentV

机器之心
机器之心 · 2025-06-12T06:33:13Z
如何在本地安装Meta Perception LM 8B?

Perception-LM-8B是Meta FAIR团队开发的多模态模型,具备深度理解图像和视频的能力。它结合了轻量级语言解码器和高效视觉编码器,支持视觉问答和视频推理等任务,使用开放数据训练,确保透明性。该模型在图像和视频理解方面表现优异,适合研究和应用。

如何在本地安装Meta Perception LM 8B?

DEV Community
DEV Community · 2025-05-13T08:35:09Z
如何安装思科的Foundation-Sec 8B:终极网络安全AI模型

Foundation-Sec-8B是思科开发的网络安全AI模型,具备威胁映射和漏洞优先级排序功能。该模型基于Llama-3.1-8B,经过丰富的网络安全数据训练,适合本地或云端部署,帮助组织构建隐私保护的安全解决方案。

如何安装思科的Foundation-Sec 8B:终极网络安全AI模型

DEV Community
DEV Community · 2025-05-06T16:33:55Z
NVIDIA AI 推出通用视觉语言模型 Eagle 2.5,仅用 8B 参数就能在视频任务中与 GPT-4o 匹配

Eagle 2.5 是 NVIDIA 推出的视觉语言模型,专为处理长上下文的多模态数据而设计。它通过信息优先采样和渐进式后训练策略,显著提升了视频和图像理解任务的性能,尤其在高分辨率输入下表现突出。该模型强调上下文完整性和数据集多样性,是多模态理解的重要工具。

NVIDIA AI 推出通用视觉语言模型 Eagle 2.5,仅用 8B 参数就能在视频任务中与 GPT-4o 匹配

实时互动网
实时互动网 · 2025-04-23T03:09:24Z
NVIDIA AI 发布 UltraLong-8B:超长上下文语言模型,旨在处理大量文本序列

大型语言模型(LLM)在处理长序列时存在上下文窗口限制。研究提出了一种高效训练方案,将上下文长度扩展至1M、2M和4M个token,同时保持标准任务性能。UltraLong-8B模型在长上下文基准测试中表现优异,展现出强大的检索能力。未来研究将关注安全对齐机制和高级调优策略。

NVIDIA AI 发布 UltraLong-8B:超长上下文语言模型,旨在处理大量文本序列

实时互动网
实时互动网 · 2025-04-14T03:00:15Z
推理延展到真实物理世界,英伟达Cosmos-Reason1:8B具身推理表现超过OpenAI ο1

英伟达推出的Cosmos-Reason1模型专注于物理常识推理,解决视觉问答中的最佳答案缺失问题。该模型通过多阶段训练显著提升物理推理能力,能够拒绝不明确的选项,适用于自动驾驶等实际场景。

推理延展到真实物理世界,英伟达Cosmos-Reason1:8B具身推理表现超过OpenAI ο1

机器之心
机器之心 · 2025-03-25T04:38:18Z
RAG聊天机器人:使用LangChain、Milvus、Fireworks AI 🔥Llama 3.1 8B指令和Cohere嵌入多语言v2.0构建

RAG(检索增强生成)结合大型语言模型与外部知识源,提升对话AI的准确性和相关性。本文介绍了如何使用LangChain、Milvus、Fireworks AI Llama 3.1和Cohere构建RAG聊天机器人,包括安装、设置和优化步骤,实现基于自定义知识库的问答功能。

RAG聊天机器人:使用LangChain、Milvus、Fireworks AI 🔥Llama 3.1 8B指令和Cohere嵌入多语言v2.0构建

DEV Community
DEV Community · 2025-03-03T23:51:21Z
IBM AI 发布 Granite 3.2 8B Instruct 和 Granite 3.2 2B Instruct 模型:提供实验性思维链推理功能

IBM推出Granite 3.2系列大型语言模型,专为企业设计,优化推理效率和指令跟踪,提升模型准确性和响应速度,满足快速响应的企业需求。

IBM AI 发布 Granite 3.2 8B Instruct 和 Granite 3.2 2B Instruct 模型:提供实验性思维链推理功能

实时互动网
实时互动网 · 2025-03-03T03:17:33Z
Nous Research 发布 DeepHermes 3 预览版:基于 Llama-3-8B 的模型,结合深度推理、高级函数调用和无缝对话智能

DeepHermes 3 是 Nous Research 最新的人工智能模型,具备推理与自然语言处理能力,能够在直观响应与深度推理之间灵活切换,提升对话的连贯性和复杂逻辑处理能力,适用于财务报告和客户服务等多种场景。

Nous Research 发布 DeepHermes 3 预览版:基于 Llama-3-8B 的模型,结合深度推理、高级函数调用和无缝对话智能

实时互动网
实时互动网 · 2025-02-18T02:51:55Z
语言模型新范式:首个8B扩散大语言模型LLaDA发布,性能比肩LLaMA 3

LLaDA是一种新型语言生成模型,采用掩码扩散机制,突破了传统自回归模型的局限,展现出在可扩展性、上下文学习和指令遵循等方面的优越性。

语言模型新范式:首个8B扩散大语言模型LLaDA发布,性能比肩LLaMA 3

机器之心
机器之心 · 2025-02-17T05:25:57Z
🚀 通过量化解锁模型效率:深入探讨LLaMA-3.1-8B-Instruct

量化是机器学习中的一种技术,通过降低模型权重和激活的精度,来提高推理速度和减少内存使用。它将高精度数字转换为低精度格式(如8位整数或4位表示),适用于资源受限的设备。尽管量化可以加快模型加载和推理,但过度量化可能会影响准确性,尤其是在复杂任务中。

🚀 通过量化解锁模型效率:深入探讨LLaMA-3.1-8B-Instruct

DEV Community
DEV Community · 2025-02-06T23:12:53Z
ICLR 2025|大模型也需要好奇心,TeleAI 提出探索驱动的对齐方法,8B越级胜70B

AIxiv专栏促进学术交流,报道超过2000篇内容。李学龙教授团队提出COPO方法,增强大型语言模型的探索能力,克服对齐框架的局限性,提高模型性能与安全性。该研究成果已被ICLR 2025录用,验证了在线学习的有效性。

ICLR 2025|大模型也需要好奇心,TeleAI 提出探索驱动的对齐方法,8B越级胜70B

机器之心
机器之心 · 2025-01-30T11:40:51Z

国产AI开源模型MiniCPM-o 2.6在海外受到关注,具备8B参数,能够在iPad上运行,支持实时视频通话和高级语音理解。其多模态能力与GPT-4o相当,能精准识别声音和图像,适合边端设备,推动AI原生应用发展。

全球首次!国产AI开源端侧GPT-4o海外爆火,8B参数iPad就能跑

量子位
量子位 · 2025-01-16T09:59:33Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码