小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
沉浸式翻译 immersive translate
Dify.AI

GPT4核心成员、清华校友赵晟佳任Meta超级智能实验室首席科学家

机器之心
机器之心 · 2025-07-26T09:57:20Z
GPT4规模大模型落地,Meta提ExFM框架:万亿参数基础大模型的工业级落地成为可能

Meta AI研究团队提出ExFM框架,解决了万亿级基础大模型在广告推荐中的高效服务问题。该框架通过外部蒸馏和动态适应机制,实现教师模型与学生模型的解耦,显著降低计算成本和延迟,提升模型性能,推动广告推荐系统优化。

GPT4规模大模型落地,Meta提ExFM框架:万亿参数基础大模型的工业级落地成为可能

机器之心
机器之心 · 2025-03-12T06:24:36Z

Understanding the latest project to build speech-to-speech with open source technologies.

Striving for Open Source Modular GPT4-o with Hugging Face’s Speech To Speech

KDnuggets
KDnuggets · 2025-01-07T13:00:07Z
Science子刊 | GPT4、Llama等LLM可以调节粒子加速器?仅50%性能优化,未来可期

德国DESY研究人员提出利用大型语言模型(LLM)自主调节粒子加速器,展示了其在调优任务中的潜力。尽管LLM的表现尚未达到最先进算法的水平,但未来有望成为操作员的辅助工具,提高加速器调节效率。

Science子刊 | GPT4、Llama等LLM可以调节粒子加速器?仅50%性能优化,未来可期

机器之心
机器之心 · 2025-01-03T03:56:05Z

Meta发布了备受期待的Llama-3.1系列模型,包括405B“超级杯”型号,成为首个能与最强大模型媲美的开源模型。Llama-3.1系列包括8B、70B和405B三个版本,具有128k的扩展上下文长度和支持八种语言。405B模型目前是最大的开源模型,在各种评估指标上超过了GPT-4。SiliconCloud在其平台上推出了Llama-3.1系列模型,使开发者更容易访问和使用这些先进模型。该平台还提供加速推理和实惠的价格。除了Llama-3.1,SiliconCloud还提供各种其他开源语言模型、图像生成模型和代码生成模型。开发者可以免费使用这些模型,消除了开发和大规模推广中的计算成本。SiliconCloud旨在为开发者提供更快、更便宜、更全面的模型API,以实现更流畅的用户体验。

比肩GPT4,没有显卡也能用Llama-3.1-405B

OneFlow深度学习框架
OneFlow深度学习框架 · 2024-08-09T03:54:44Z

研究人员通过将AI的“慢思考”结果蒸馏进“快思考”,使Llama2的表现提升了257%,超过了GPT4,同时降低了推理成本。他们使用了四种不同的系统2方法进行微调,发现这种模式使系统1模型的表现大幅提升,甚至超过了真正的系统2模型。这种蒸馏方法在实时交互和移动设备部署等场景下具有优势。

AI慢思考蒸馏进快思考,Llama2升至GPT4水平,不写过程也能做对题

量子位
量子位 · 2024-07-12T04:04:13Z

深度求索团队更新了DeepSeek-V2模型,新版本DeepSeek-V2-Chat在数学解题、逻辑推理、编程等方面性能提升了16%,对战胜率从41.6%提升到了68.3%。团队还优化了模型的指令跟随能力,提升了用户体验。SiliconCloud平台上线了DeepSeek-V2-Chat的推理加速版,速度快且输出准确。SiliconCloud还提供多种开源大语言模型和代码生成模型。

国产大模型新标杆!比肩GPT4,DeepSeek V2重磅升级

OneFlow深度学习框架
OneFlow深度学习框架 · 2024-07-02T10:10:13Z

上海天鹜科技与长春金赛药业完成全球首款经大模型设计的蛋白质产品开发。英伟达开源最强通用模型Nemotron-4 340B,途深智合开源国内首个自然语言蛋白质大模型TourSynbio™。Cyrus Biotechnology分拆子公司Levitate Bio。GSK与Ochre Bio合作开发肝脏疾病治疗方法。

可实现5千升工业化生产!全球首款经大模型设计的蛋白质产品正式落地;测评指标超过 GPT4!全国首个自然语言蛋白质大模型开源...

HyperAI超神经
HyperAI超神经 · 2024-06-19T03:00:26Z

深度求索开源了DeepSeek-Coder-V2模型,是全球首个在代码、数学能力上超越GPT-4-Turbo等的开源代码大模型。DeepSeek-Coder-V2包含236B与16B两种参数规模,支持338种编程语言。SiliconCloud上线了DeepSeek-Coder-V2开源模型,并提供大模型推理加速服务。新用户还送1亿token。

击败GPT4-Turbo,最强开源代码模型DeepSeek-Coder-V2问世

OneFlow深度学习框架
OneFlow深度学习框架 · 2024-06-19T02:01:52Z

KLING is the latest AI video generator that could rival OpenAI's Sora, OpenAI is restarting its robotics research group, and more!

LWiAI Podcast #170 - new Sora rival, OpenAI robotics, understanding GPT4, AGI by 2027?

Last Week in AI
Last Week in AI · 2024-06-10T02:18:23Z

黄仁勋在COMPUTEX上展示了英伟达的最新技术,包括GPT-4模型和Blackware GPU。他强调了GPT-4的训练参数达到了1.8T,展示了Blackware GPU的多GPU集成解决方案。然而,英伟达面临着摩尔定律失效、中心转移和巨头合作等威胁。尽管如此,英伟达仍然是一个轻公司,依靠缩放定律和扩大垄断来保持竞争优势。

黄仁勋AI时代英伟达GPU革命:一场市值2.7万亿美金的狂欢,COMPUTEX 2024重磅发布Blackware GPU,1.8万亿参数GPT4揭秘!

硕鼠的博客站
硕鼠的博客站 · 2024-06-04T01:02:00Z

Open AI 已经扩大了对 GPT-4 的免费访问,而苹果的未来尚不确定。Open AI 正卷入与斯嘉丽·约翰逊的诉讼中。GPT-4O 已经向有限制的免费用户开放。苹果的 WWDC 可能会让人失望。

Open AI 免费GPT4大放送,苹果WWDC翻车预警?

硕鼠的博客站
硕鼠的博客站 · 2024-06-04T00:50:30Z
3种免费使用GPT4的方法

本文介绍了三种免费使用GPT4的方法:COZE、copilot和加州大学伯克利分校的开源AI研究平台。这些方法提供了各种强大功能,如生成图片、总结文档、自动生成配音等。COZE是字节跳动开发的AI工具开发平台,提供全功能的GPT4模型;copilot是微软开发的日常办公助手,可以在Edge浏览器和Bing搜索上使用;加州大学伯克利分校的平台包含了常用的大模型。

3种免费使用GPT4的方法

迷途小书童
迷途小书童 · 2024-05-17T03:32:06Z

ElevenLabs previews music-generating AI model, New Microsoft AI model may challenge GPT-4 and Google Gemini, and more!

LWiAI Podcast #166 - new AI song generator, Microsoft's GPT4 efforts, AlphaFold3, xLSTM, OpenAI Model Spec

Last Week in AI
Last Week in AI · 2024-05-12T21:15:37Z

使用基于 transformer 的大型语言模型(LLMs)的 ChatGPT 作为研究对象,通过分析 BERT 隐藏单元的激活模式,发现其在不同层次上根据文体变异(1)和叙事内容(4-5)进行聚类,揭示了 LLMs 内部的区别任务处理机制,为深入研究人类语言处理和认知过程提供了潜力。

大型语言模型中的叙事处理分析:使用 GPT4 测试 BERT

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-03T00:00:00Z

最近,一个名为“gpt2-chatbot”的神秘AI模型在大模型竞技场上引起了广泛关注。它展现出了惊人的能力,可能超越了备受瞩目的GPT-4模型。有人认为它可能是OpenAI的GPT-2模型的版本,也有人认为它可能是GPT系列的下一个版本。无论如何,它的出现预示着AI技术的飞跃。

【AI新突破】GPT2模型现身,实力或超越GPT4,奥特曼确认,引发热议!

dotNET跨平台
dotNET跨平台 · 2024-05-01T23:55:21Z

山姆·奥特曼在斯坦福大学演讲中提到了人工智能的快速发展和GPT4的标杆地位,以及即将发布的GPT5和缩放法则的重要性。他认为免费、无广告的GPT是更好的途径。他还讨论了创新、创业和人与人工智能的关系。他强调了社会需要为技术进步做好准备,并表示人类总会有更大的创新。

Sam Altman在斯坦福大学的全面演讲解析:详细探讨GPT4设定的AI新标准和对GPT5的期待,以及人工智能的未来社会影响和商业模式变革

硕鼠的博客站
硕鼠的博客站 · 2024-04-29T00:35:39Z

该文章讨论了使用专家来提高推理速度的方法。作者提出了一种使用两名专家的方法,以减少计算量。同时,作者还提到了使用更多专家可能会对模型产生负面影响。该模型是一种开放权重模型,具有宽松的许可证,并在成本/性能权衡方面表现最佳。

七月论文审稿GPT第4版:通过paper-review数据集微调Mixtral-8x7b,对GPT4胜率超过80%

结构之法 算法之道
结构之法 算法之道 · 2024-03-27T16:04:20Z

美司法部力促TikTok出售,CycleGAN作者领衔条件分散模型取得新成就,OpenAI有望在今年夏季推出GPT-5,黄仁勋对话Transformer论文七大作者,快手CEO程一笑表示自研大模型有决心半年内达到GPT4.0水平。

首位脑机患者直播用意念玩游戏;快手自研大模型有信心半年内达 GPT4 水平丨RTE 开发者日报 Vol.169

六虎
六虎 · 2024-03-22T00:22:40Z
使用Coze实现免费使用GPT4和DALL·E 3绘画

广大网友研究出了使用免费ChatGPT-4的方法,通过Coze和Discord实现API请求GPT4+DALL·E 3。Coze是AI Bot开发平台,支持搭建各类问答Bot,并发布到社交平台和通讯软件上。需要本地PC能科学上网,部署Coze代理服务器,使用外网服务器,需要域名和证书。

使用Coze实现免费使用GPT4和DALL·E 3绘画

文武科技柜
文武科技柜 · 2024-02-07T06:38:24Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码