小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

机器之心数据服务现已上线,提供高效稳定的数据获取服务,简化了数据爬取流程。

GPT4核心成员、清华校友赵晟佳任Meta超级智能实验室首席科学家

机器之心
机器之心 · 2025-07-26T09:57:20Z
GPT4规模大模型落地,Meta提ExFM框架:万亿参数基础大模型的工业级落地成为可能

Meta AI研究团队提出ExFM框架,解决了万亿级基础大模型在广告推荐中的高效服务问题。该框架通过外部蒸馏和动态适应机制,实现教师模型与学生模型的解耦,显著降低计算成本和延迟,提升模型性能,推动广告推荐系统优化。

GPT4规模大模型落地,Meta提ExFM框架:万亿参数基础大模型的工业级落地成为可能

机器之心
机器之心 · 2025-03-12T06:24:36Z
Science子刊 | GPT4、Llama等LLM可以调节粒子加速器?仅50%性能优化,未来可期

德国DESY研究人员提出利用大型语言模型(LLM)自主调节粒子加速器,展示了其在调优任务中的潜力。尽管LLM的表现尚未达到最先进算法的水平,但未来有望成为操作员的辅助工具,提高加速器调节效率。

Science子刊 | GPT4、Llama等LLM可以调节粒子加速器?仅50%性能优化,未来可期

机器之心
机器之心 · 2025-01-03T03:56:05Z

该文章介绍了对llama3.1模型进行微调的过程和结果,通过7方面review超过GPT4。微调过程中遇到的问题包括模版冗余后缀、推理结果中存在空项以及模型推理格式问题。最终得出的结论是llama3.1比llama3更强悍,微调超过GPT4。

微调LLama 3.1——七月论文审稿GPT第5.5版:拿早期paper-review数据集微调LLama 3.1

结构之法 算法之道
结构之法 算法之道 · 2024-08-09T09:13:13Z

Meta发布了备受期待的Llama-3.1系列模型,包括405B“超级杯”型号,成为首个能与最强大模型媲美的开源模型。Llama-3.1系列包括8B、70B和405B三个版本,具有128k的扩展上下文长度和支持八种语言。405B模型目前是最大的开源模型,在各种评估指标上超过了GPT-4。SiliconCloud在其平台上推出了Llama-3.1系列模型,使开发者更容易访问和使用这些先进模型。该平台还提供加速推理和实惠的价格。除了Llama-3.1,SiliconCloud还提供各种其他开源语言模型、图像生成模型和代码生成模型。开发者可以免费使用这些模型,消除了开发和大规模推广中的计算成本。SiliconCloud旨在为开发者提供更快、更便宜、更全面的模型API,以实现更流畅的用户体验。

比肩GPT4,没有显卡也能用Llama-3.1-405B

OneFlow深度学习框架
OneFlow深度学习框架 · 2024-08-09T03:54:44Z

研究人员通过将AI的“慢思考”结果蒸馏进“快思考”,使Llama2的表现提升了257%,超过了GPT4,同时降低了推理成本。他们使用了四种不同的系统2方法进行微调,发现这种模式使系统1模型的表现大幅提升,甚至超过了真正的系统2模型。这种蒸馏方法在实时交互和移动设备部署等场景下具有优势。

AI慢思考蒸馏进快思考,Llama2升至GPT4水平,不写过程也能做对题

量子位
量子位 · 2024-07-12T04:04:13Z

深度求索团队更新了DeepSeek-V2模型,新版本DeepSeek-V2-Chat在数学解题、逻辑推理、编程等方面性能提升了16%,对战胜率从41.6%提升到了68.3%。团队还优化了模型的指令跟随能力,提升了用户体验。SiliconCloud平台上线了DeepSeek-V2-Chat的推理加速版,速度快且输出准确。SiliconCloud还提供多种开源大语言模型和代码生成模型。

国产大模型新标杆!比肩GPT4,DeepSeek V2重磅升级

OneFlow深度学习框架
OneFlow深度学习框架 · 2024-07-02T10:10:13Z

上海天鹜科技与长春金赛药业完成全球首款经大模型设计的蛋白质产品开发。英伟达开源最强通用模型Nemotron-4 340B,途深智合开源国内首个自然语言蛋白质大模型TourSynbio™。Cyrus Biotechnology分拆子公司Levitate Bio。GSK与Ochre Bio合作开发肝脏疾病治疗方法。

可实现5千升工业化生产!全球首款经大模型设计的蛋白质产品正式落地;测评指标超过 GPT4!全国首个自然语言蛋白质大模型开源...

HyperAI超神经
HyperAI超神经 · 2024-06-19T03:00:26Z

深度求索开源了DeepSeek-Coder-V2模型,是全球首个在代码、数学能力上超越GPT-4-Turbo等的开源代码大模型。DeepSeek-Coder-V2包含236B与16B两种参数规模,支持338种编程语言。SiliconCloud上线了DeepSeek-Coder-V2开源模型,并提供大模型推理加速服务。新用户还送1亿token。

击败GPT4-Turbo,最强开源代码模型DeepSeek-Coder-V2问世

OneFlow深度学习框架
OneFlow深度学习框架 · 2024-06-19T02:01:52Z

黄仁勋在COMPUTEX上展示了英伟达的最新技术,包括GPT-4模型和Blackware GPU。他强调了GPT-4的训练参数达到了1.8T,展示了Blackware GPU的多GPU集成解决方案。然而,英伟达面临着摩尔定律失效、中心转移和巨头合作等威胁。尽管如此,英伟达仍然是一个轻公司,依靠缩放定律和扩大垄断来保持竞争优势。

黄仁勋AI时代英伟达GPU革命:一场市值2.7万亿美金的狂欢,COMPUTEX 2024重磅发布Blackware GPU,1.8万亿参数GPT4揭秘!

硕鼠的博客站
硕鼠的博客站 · 2024-06-04T01:02:00Z

Open AI 已经扩大了对 GPT-4 的免费访问,而苹果的未来尚不确定。Open AI 正卷入与斯嘉丽·约翰逊的诉讼中。GPT-4O 已经向有限制的免费用户开放。苹果的 WWDC 可能会让人失望。

Open AI 免费GPT4大放送,苹果WWDC翻车预警?

硕鼠的博客站
硕鼠的博客站 · 2024-06-04T00:50:30Z
3种免费使用GPT4的方法

本文介绍了三种免费使用GPT4的方法:COZE、copilot和加州大学伯克利分校的开源AI研究平台。这些方法提供了各种强大功能,如生成图片、总结文档、自动生成配音等。COZE是字节跳动开发的AI工具开发平台,提供全功能的GPT4模型;copilot是微软开发的日常办公助手,可以在Edge浏览器和Bing搜索上使用;加州大学伯克利分校的平台包含了常用的大模型。

3种免费使用GPT4的方法

迷途小书童
迷途小书童 · 2024-05-17T03:32:06Z

使用基于 transformer 的大型语言模型(LLMs)的 ChatGPT 作为研究对象,通过分析 BERT 隐藏单元的激活模式,发现其在不同层次上根据文体变异(1)和叙事内容(4-5)进行聚类,揭示了 LLMs 内部的区别任务处理机制,为深入研究人类语言处理和认知过程提供了潜力。

大型语言模型中的叙事处理分析:使用 GPT4 测试 BERT

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-03T00:00:00Z

最近,一个名为“gpt2-chatbot”的神秘AI模型在大模型竞技场上引起了广泛关注。它展现出了惊人的能力,可能超越了备受瞩目的GPT-4模型。有人认为它可能是OpenAI的GPT-2模型的版本,也有人认为它可能是GPT系列的下一个版本。无论如何,它的出现预示着AI技术的飞跃。

【AI新突破】GPT2模型现身,实力或超越GPT4,奥特曼确认,引发热议!

dotNET跨平台
dotNET跨平台 · 2024-05-01T23:55:21Z
AI驱动开发:从Prompt到Product(直播)

作者计划通过直播展示使用GPT4编写产品并开源代码。过去几年中,作者使用AI驱动开发产品,并与ChatGPT合作开发了一个产品。2024年,作者尝试用ChatGPT开发复杂功能并重构技术架构。直播内容包括功能设计、技术架构和代码编写。每周直播2-3次,持续数月。通过直播,作者希望探索AI在产品开发中的边界。

AI驱动开发:从Prompt到Product(直播)

构建我的被动收入
构建我的被动收入 · 2024-05-01T00:00:00Z

山姆·奥特曼在斯坦福大学演讲中提到了人工智能的快速发展和GPT4的标杆地位,以及即将发布的GPT5和缩放法则的重要性。他认为免费、无广告的GPT是更好的途径。他还讨论了创新、创业和人与人工智能的关系。他强调了社会需要为技术进步做好准备,并表示人类总会有更大的创新。

Sam Altman在斯坦福大学的全面演讲解析:详细探讨GPT4设定的AI新标准和对GPT5的期待,以及人工智能的未来社会影响和商业模式变革

硕鼠的博客站
硕鼠的博客站 · 2024-04-29T00:35:39Z
coze+coze-discord-proxy+ChatNextWebUI实现AI自由

本文介绍了使用扣子(coze)和coze-discord-proxy实现AI自由的方法,包括注册coze账号、构建机器人、搭建coze-discord-proxy以免费使用GPT4和绘画。同时,还介绍了使用宝塔搭建反向代理和cloudflare代理来保证安全性,并提及了将接口集成到ChatNextWebUI中使用的方法。

coze+coze-discord-proxy+ChatNextWebUI实现AI自由

plus studio
plus studio · 2024-03-31T19:12:00Z

本文介绍了Mixtral-8x7B模型的训练和推理过程,包括环境配置、训练代码和API接口部署。在使用LLaMA-Factory进行模型微调时,需要注意量化位和闪存注意力的设置,以避免运行时错误。

七月论文审稿GPT第4版:通过paper-review数据集微调Mixtral-8x7b,对GPT4胜率超过80%

结构之法 算法之道
结构之法 算法之道 · 2024-03-27T16:04:20Z

美司法部力促TikTok出售,CycleGAN作者领衔条件分散模型取得新成就,OpenAI有望在今年夏季推出GPT-5,黄仁勋对话Transformer论文七大作者,快手CEO程一笑表示自研大模型有决心半年内达到GPT4.0水平。

首位脑机患者直播用意念玩游戏;快手自研大模型有信心半年内达 GPT4 水平丨RTE 开发者日报 Vol.169

六虎
六虎 · 2024-03-22T00:22:40Z

360安全大模型3.0发布会在京举行,潘剑锋表示该框架超过GPT4在多个专业任务效果上。框架实现了语言、规划、判别、道德和记忆五大功能中枢,通过智能体框架调用安全知识和工具,提供更强大的安全专家能力。

革新行业的“杀手级”产品,360安全大模型3.0发布

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2024-03-20T11:34:06Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码