小红花·文摘

机器之心数据服务现已上线，提供高效稳定的数据获取服务，简化了数据爬取流程。

GPT4核心成员、清华校友赵晟佳任Meta超级智能实验室首席科学家

机器之心 ·

GPT4规模大模型落地，Meta提ExFM框架：万亿参数基础大模型的工业级落地成为可能

机器之心 ·

Science子刊 | GPT4、Llama等LLM可以调节粒子加速器？仅50%性能优化，未来可期

机器之心 ·

该文章介绍了对llama3.1模型进行微调的过程和结果，通过7方面review超过GPT4。微调过程中遇到的问题包括模版冗余后缀、推理结果中存在空项以及模型推理格式问题。最终得出的结论是llama3.1比llama3更强悍，微调超过GPT4。

微调LLama 3.1——七月论文审稿GPT第5.5版：拿早期paper-review数据集微调LLama 3.1

结构之法算法之道 ·

Meta发布了备受期待的Llama-3.1系列模型，包括405B“超级杯”型号，成为首个能与最强大模型媲美的开源模型。Llama-3.1系列包括8B、70B和405B三个版本，具有128k的扩展上下文长度和支持八种语言。405B模型目前是最大的开源模型，在各种评估指标上超过了GPT-4。SiliconCloud在其平台上推出了Llama-3.1系列模型，使开发者更容易访问和使用这些先进模型。该平台还提供加速推理和实惠的价格。除了Llama-3.1，SiliconCloud还提供各种其他开源语言模型、图像生成模型和代码生成模型。开发者可以免费使用这些模型，消除了开发和大规模推广中的计算成本。SiliconCloud旨在为开发者提供更快、更便宜、更全面的模型API，以实现更流畅的用户体验。

比肩GPT4，没有显卡也能用Llama-3.1-405B

OneFlow深度学习框架 ·

研究人员通过将AI的“慢思考”结果蒸馏进“快思考”，使Llama2的表现提升了257%，超过了GPT4，同时降低了推理成本。他们使用了四种不同的系统2方法进行微调，发现这种模式使系统1模型的表现大幅提升，甚至超过了真正的系统2模型。这种蒸馏方法在实时交互和移动设备部署等场景下具有优势。

AI慢思考蒸馏进快思考，Llama2升至GPT4水平，不写过程也能做对题

量子位 ·

深度求索团队更新了DeepSeek-V2模型，新版本DeepSeek-V2-Chat在数学解题、逻辑推理、编程等方面性能提升了16%，对战胜率从41.6%提升到了68.3%。团队还优化了模型的指令跟随能力，提升了用户体验。SiliconCloud平台上线了DeepSeek-V2-Chat的推理加速版，速度快且输出准确。SiliconCloud还提供多种开源大语言模型和代码生成模型。

国产大模型新标杆！比肩GPT4，DeepSeek V2重磅升级

OneFlow深度学习框架 ·

上海天鹜科技与长春金赛药业完成全球首款经大模型设计的蛋白质产品开发。英伟达开源最强通用模型Nemotron-4 340B，途深智合开源国内首个自然语言蛋白质大模型TourSynbio™。Cyrus Biotechnology分拆子公司Levitate Bio。GSK与Ochre Bio合作开发肝脏疾病治疗方法。

可实现5千升工业化生产！全球首款经大模型设计的蛋白质产品正式落地；测评指标超过 GPT4！全国首个自然语言蛋白质大模型开源...

HyperAI超神经 ·

深度求索开源了DeepSeek-Coder-V2模型，是全球首个在代码、数学能力上超越GPT-4-Turbo等的开源代码大模型。DeepSeek-Coder-V2包含236B与16B两种参数规模，支持338种编程语言。SiliconCloud上线了DeepSeek-Coder-V2开源模型，并提供大模型推理加速服务。新用户还送1亿token。

击败GPT4-Turbo，最强开源代码模型DeepSeek-Coder-V2问世

OneFlow深度学习框架 ·

黄仁勋在COMPUTEX上展示了英伟达的最新技术，包括GPT-4模型和Blackware GPU。他强调了GPT-4的训练参数达到了1.8T，展示了Blackware GPU的多GPU集成解决方案。然而，英伟达面临着摩尔定律失效、中心转移和巨头合作等威胁。尽管如此，英伟达仍然是一个轻公司，依靠缩放定律和扩大垄断来保持竞争优势。

黄仁勋AI时代英伟达GPU革命：一场市值2.7万亿美金的狂欢，COMPUTEX 2024重磅发布Blackware GPU，1.8万亿参数GPT4揭秘！

硕鼠的博客站 ·

Open AI 已经扩大了对 GPT-4 的免费访问，而苹果的未来尚不确定。Open AI 正卷入与斯嘉丽·约翰逊的诉讼中。GPT-4O 已经向有限制的免费用户开放。苹果的 WWDC 可能会让人失望。

Open AI 免费GPT4大放送，苹果WWDC翻车预警？

硕鼠的博客站 ·

3种免费使用GPT4的方法

迷途小书童 ·

使用基于 transformer 的大型语言模型（LLMs）的 ChatGPT 作为研究对象，通过分析 BERT 隐藏单元的激活模式，发现其在不同层次上根据文体变异（1）和叙事内容（4-5）进行聚类，揭示了 LLMs 内部的区别任务处理机制，为深入研究人类语言处理和认知过程提供了潜力。

大型语言模型中的叙事处理分析：使用 GPT4 测试 BERT

BriefGPT - AI 论文速递 ·

最近，一个名为“gpt2-chatbot”的神秘AI模型在大模型竞技场上引起了广泛关注。它展现出了惊人的能力，可能超越了备受瞩目的GPT-4模型。有人认为它可能是OpenAI的GPT-2模型的版本，也有人认为它可能是GPT系列的下一个版本。无论如何，它的出现预示着AI技术的飞跃。

【AI新突破】GPT2模型现身，实力或超越GPT4，奥特曼确认，引发热议！

dotNET跨平台 ·

AI驱动开发：从Prompt到Product（直播）

构建我的被动收入 ·

山姆·奥特曼在斯坦福大学演讲中提到了人工智能的快速发展和GPT4的标杆地位，以及即将发布的GPT5和缩放法则的重要性。他认为免费、无广告的GPT是更好的途径。他还讨论了创新、创业和人与人工智能的关系。他强调了社会需要为技术进步做好准备，并表示人类总会有更大的创新。

Sam Altman在斯坦福大学的全面演讲解析：详细探讨GPT4设定的AI新标准和对GPT5的期待，以及人工智能的未来社会影响和商业模式变革

硕鼠的博客站 ·

coze+coze-discord-proxy+ChatNextWebUI实现AI自由

plus studio ·

本文介绍了Mixtral-8x7B模型的训练和推理过程，包括环境配置、训练代码和API接口部署。在使用LLaMA-Factory进行模型微调时，需要注意量化位和闪存注意力的设置，以避免运行时错误。

七月论文审稿GPT第4版：通过paper-review数据集微调Mixtral-8x7b，对GPT4胜率超过80%

结构之法算法之道 ·

美司法部力促TikTok出售，CycleGAN作者领衔条件分散模型取得新成就，OpenAI有望在今年夏季推出GPT-5，黄仁勋对话Transformer论文七大作者，快手CEO程一笑表示自研大模型有决心半年内达到GPT4.0水平。

首位脑机患者直播用意念玩游戏；快手自研大模型有信心半年内达 GPT4 水平丨RTE 开发者日报 Vol.169

六虎 ·

360安全大模型3.0发布会在京举行，潘剑锋表示该框架超过GPT4在多个专业任务效果上。框架实现了语言、规划、判别、道德和记忆五大功能中枢，通过智能体框架调用安全知识和工具，提供更强大的安全专家能力。

革新行业的“杀手级”产品，360安全大模型3.0发布

FreeBuf网络安全行业门户 ·