小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Google Research unveiled TurboQuant, a novel quantization algorithm that compresses large language models’ Key-Value caches by up to 6x. With 3.5-bit compression, near-zero accuracy loss, and no...

Google’s TurboQuant Compression May Support Faster Inference, Same Accuracy on Less Capable Hardware

InfoQ
InfoQ · 2026-04-15T16:53:00Z

Madelyn Olson discusses the evolution of Valkey's data structures, moving away from "textbook" pointer-chasing HashMaps to more cache-aware designs. She explains the implementation of "Swedish"...

Presentation: When Every Bit Counts: How Valkey Rebuilt Its Hashtable for Modern Hardware

InfoQ
InfoQ · 2026-04-07T13:40:00Z
译:  Hardware Memory Models (Memory Models, Part 1)

本文探讨了硬件内存模型对多线程程序的影响。随着多核处理器的普及,程序员需理解内存一致性问题及硬件和编译器优化对程序行为的影响。顺序一致性是理想模型,但现代硬件常偏离此模型,导致程序在不同平台上表现不一致。文章还讨论了通过内存屏障等手段确保程序正确性的方法。

译: Hardware Memory Models (Memory Models, Part 1)

Steins;Lab
Steins;Lab · 2025-09-30T14:54:32Z

本研究探讨了DeepSeek-V3在扩展大型语言模型时的硬件限制,并提出了一种新颖的硬件感知模型设计方法。通过引入多头潜在注意力机制和FP8混合精度训练,DeepSeek-V3实现了高效的训练和推理,推动了下一代AI系统的发展。

In-Depth Exploration of DeepSeek-V3: Scaling Challenges and Hardware Reflections on AI Architectures

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-14T00:00:00Z

本研究展示了一种新型量子回声状态网络(QESN),用于在噪声环境中预测混沌状态。实验结果表明,该方法在长期时间序列预测中表现优异,显示了量子计算在机器学习中的应用潜力。

Quantum Observers: A NISQ Hardware Demonstration of Chaotic State Prediction Using Quantum Echo-State Networks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-11T00:00:00Z

本文探讨在无额外计算资源的情况下,大型语言模型(LLM)能力的提升。作者提出了一个分类框架,区分依赖计算与独立于计算的创新,结果表明,计算独立的创新在资源受限环境中显著提升了性能。

LLM-e Hypothesis: Can the Capabilities of Large Language Models Improve Without Hardware Advancements?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-07T00:00:00Z

本研究提出了一种层次稀疏注意力(HSA)机制,解决了递归神经网络(RNN)在随机访问历史上下文方面的局限性。结合HSA与Mamba形成的RAMba在6400万上下文中实现了完美的密码检索准确率,展示了其在长上下文建模中的潜力。

Random Long-Context Access for Mamba via Hardware-aligned Hierarchical Sparse Attention

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-23T00:00:00Z

本文探讨了摩尔定律在现代计算中的局限性,强调硬件与软件协同设计对满足性能需求的重要性,并指出打破传统界限有助于重新定义计算机设计原则,推动新一代计算的进步。

Beyond Moore's Law: Harnessing the Redshift of Generative AI through Effective Hardware-Software Co-Design

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-09T00:00:00Z

本研究提出了CARE模型,通过QLoRA微调Phi3.5-mini,实现了在极少硬件和数据下的快速学习,解决了大语言模型在特定领域问答的时间和成本问题。CARE在电信、医疗和银行等领域表现良好,尤其在医疗基准测试中显示出提供基本医疗建议的潜力。

CARE: A Multi-Domain Chatbot Fine-Tuned with QLoRA for Fast Learning on Minimal Hardware

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-18T00:00:00Z

本研究提出了一种基于大型语言模型(LLM)的优化框架,能够自动重构代码以应对硬件设计的挑战。实验结果表明,该模型在成功率、效率和设计质量上优于传统LLM,为硬件设计提供了新的视角。

Can Inference Models Reason About Hardware? An Active High-Level Synthesis Perspective

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-17T00:00:00Z

本研究提出了一种三层解耦架构,解决了大语言模型应用中的平台孤岛、硬件集成碎片化和标准化接口缺乏的问题,从而提升了应用效率,并为安全可扩展的AI部署提供了新视角。

The Next Frontier of Large Language Model Applications: Open Ecosystems and Hardware Collaboration

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-06T00:00:00Z
我看 It's time for operating systems to rediscover hardware

演讲者Timothy Roscoe在USENIX ATC '21和OSDI '21的主题演讲中强调,操作系统应重新关注硬件。

我看 It's time for operating systems to rediscover hardware

ネコのメモ帳
ネコのメモ帳 · 2025-03-06T00:00:00Z

Hardware.Info 是一个跨平台的硬件信息查询库,支持 Windows、Linux 和 macOS,能够获取电池、CPU、内存和存储等硬件信息,提供详细数据。尽管存在查询延迟和数据无效的问题,但可通过适当配置加以解决。

Net跨平台硬件信息查询库 Hardware.Info:全面获取系统硬件详情

dotNET跨平台
dotNET跨平台 · 2025-02-14T00:02:53Z

本研究将卡拉茨巴算法扩展至矩阵乘法,设计了高效的硬件架构,显著降低了额外加法复杂度,提高了深度学习加速器的性能。

Karatsuba Matrix Multiplication and Its Efficient Custom Hardware Implementation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-15T00:00:00Z

Software-defined hardware is reshaping multiple industries as advances in AI enable new capabilities and dramatically reduce development costs.

Software-defined hardware in the age of AI

McKinsey Insights & Publications
McKinsey Insights & Publications · 2025-01-03T00:00:00Z

本研究开发了MIDInfinite,一个可在普通硬件上实时生成音乐的应用,采用Anticipatory Music Transformer模型,每秒生成51个音符。

Locally Deploying Large-Scale Music AI Models on Standard Hardware

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-14T00:00:00Z

本文介绍了Humanoid Shadowing Transformer(HST)的低级控制策略。文章详细解释了HST代码的结构和各个部分的功能。其中,PPO类是HST的核心部分,包括了初始化函数、测试模式函数、训练模式函数、动作选择函数、环境步骤处理函数、回报计算函数和更新函数。更新函数中包括了自适应KL惩罚的过程、计算代理损失和价值损失的过程以及梯度下降更新模型参数的过程。最后,文章提到了HIT部分,但未给出具体内容。

HumanPlus(斯坦福人形机器人)的代码解读与复现关键:从HST到HIT、HardWare

结构之法 算法之道
结构之法 算法之道 · 2024-06-19T02:40:58Z
Technical Requirements for Smart Hardware Product Managers

本文介绍智能硬件产品经理的技术要求,包括硬件设计、嵌入式软件、业务后台、第三方对接和市场竞品分析。提供了Spencer的回答作为参考。

Technical Requirements for Smart Hardware Product Managers

Power's Wiki
Power's Wiki · 2023-10-02T09:06:05Z
STM32F4 Hardware Development

本文介绍了STM32F4的最小系统,包括电源、时钟、复位、启动模式和调试管理。

STM32F4 Hardware Development

Power's Wiki
Power's Wiki · 2023-10-02T03:46:33Z
Hardware Testing on X86 Platform 🚧

本文对X86平台硬件进行了多项测试,包括接口速率、通信、启动选项、安全性等方面。同时还进行了USB3.0/2.0过流保护的安全性测试。

Hardware Testing on X86 Platform 🚧

Power's Wiki
Power's Wiki · 2023-10-02T03:46:33Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码