标签

 硬件 

相关的文章:

提供硬件设计库查询、AI开发、对象检测与事件数据、光学设施等相关内容的列表页。

AMD 的统一 AI 软件堆栈可能为其他 Vulkan/SPIR-V 硬件带来福音

原文约1200字,阅读约需3分钟。发表于:

本月早些时候,AMD 谈论了更多关于其统一人工智能软件栈(Unified AI Software Stack)的计划,该计划将在未来几个月内推出,以提供一个统一的软件视图,将人工智...

AMD计划推出统一人工智能软件栈,使用LLVM的MLIR中间表示法将人工智能工作卸载到不同设备上。MLIR转换为SPIR-V的工作正在进行中,一旦完成,可用于其他显卡/设备。这将使AMD的AI软件堆栈适用于非AMD GPU。这是AMD创新软件时代的一部分。

AMD 的统一 AI 软件堆栈可能为其他 Vulkan/SPIR-V 硬件带来福音
相关推荐 去reddit讨论

Quasar-ViT: 面向硬件的量化感知架构搜索视觉 Transformer

原文约500字,阅读约需2分钟。发表于:

研究论文提出了 Quasar-ViT,这是一个面向硬件的量化感知架构搜索框架,用于设计高效 ViT 模型以在硬件上实现,并保持准确性。它通过训练一个超网络,使用适应性的量化方案、混合精度权重纠缠和超网络层缩放技术,然后应用高效的面向硬件的搜索算法,结合硬件延迟和资源建模,在不同推理延迟目标下确定一系列最优的子网络。最后,我们在 FPGA...

研究论文提出了Quasar-ViT,一个面向硬件的量化感知架构搜索框架,用于设计高效ViT模型并保持准确性。通过训练超网络,使用适应性的量化方案和超网络层缩放技术,确定一系列最优的子网络。在FPGA平台上实现了高速推理和较高的准确性。

相关推荐 去reddit讨论

.NET9 PreView6硬件内部生成和浮点SMID运算

原文约2400字,阅读约需6分钟。发表于:

前言本篇是.NET9 PreView6性能优化的第三篇,也是最后一篇,承接前两篇:1.NET9 PreView6 RyuJIT代码布局改进(HIR)2.NET9 PreView6 循环优化和地址暴露注意,.NET9 PreView6并没有对AOT进行重大更新。在.NET9 PreView2里面曾经对AOT进行了自举模式,参考:.NET9 AOT ILC的重大变化.NET9 AOT ILC的重大变...

本文介绍了.NET9 PreView6的性能优化,包括硬件内部生成和恒定折叠。硬件内部生成通过传递常量参数来优化API,恒定折叠则在编译时将可计算的表达式替换为常量。这些优化可以提高代码执行速度。

相关推荐 去reddit讨论

集成硬件架构与设备位置搜索

原文约200字,阅读约需1分钟。发表于:

通过使用新颖算法,在硬件加速器架构和设备部署策略之间进行协同优化,改善计算资源、内存使用和数据分配的平衡,实现深度学习训练的分布式执行。

本文提出了一种使用序列到序列模型来预测 TensorFlow 计算图中哪些操作应该在哪些可用设备上运行的方法,并以预测的放置方式的执行时间作为奖励信号来优化序列到序列模型参数。结果表明该模型在不同任务中能够发现优于手动设置和传统算法方法的设备放置方案。

相关推荐 去reddit讨论

HDLCopilot: 自然语言硬件设计库查询

原文约300字,阅读约需1分钟。发表于:

HDLCopilot 是一个基于 LLM 的 PDK 查询系统,允许工程师使用自然语言格式简化与 PDK 的交互,提高信息检索的准确性和效率,从而成为硬件设计过程中强大的助手,提高工作效率并减少人为错误。

本研究提出了一种自动化设计数据增强框架,通过生成与Verilog和EDA脚本对齐的高质量自然语言,改善了LLM在Verilog代码生成和EDA脚本生成任务中的表现。实验结果显示,使用该增强方法对Llama2-13B和Llama2-7B模型进行微调后,Verilog生成的准确性从58.8%提高到70.6%。与GPT-3.5相比,13B模型(ChipGPT-FT)在Verilog生成和EDA脚本生成方面表现更好。

相关推荐 去reddit讨论

PaddleX 3.0-beta重磅开源:多场景低代码AI开发,本地多硬件全兼容

原文约4000字,阅读约需10分钟。发表于:

6月27日,PaddleX 3.0-beta 开源版本发布,该版本聚焦7大主流AI场景,精选68个飞桨优质模型,构建了16条产业级模型产线,包含了多项能力的显著升级,旨在助力企业开发者以低成本、零门槛的方式,有效解决产业中的实际问题。2023年12月,飞桨正式推出了端云协同的低代码开发工具——PaddleX。这款一站式AI开发工具集成了飞桨开发套件多年积累的模型训练、推理全流程开发的优势能力。同时...

飞桨于6月27日发布了PaddleX 3.0-beta开源版本,聚焦7大主流AI场景,提供低代码开发工具,支持多硬件纯离线使用。

相关推荐 去reddit讨论

在神经形态学和边缘 AI 硬件上有效部署混合 SNN

原文约500字,阅读约需1分钟。发表于:

本研究探讨了神经形态计算和边缘计算相结合的潜力,创建了一个适用于处理动态视觉传感器捕获数据的多功能机器学习系统。通过混合使用 PyTorch 和 Lava 框架构建和训练了混合模型,融合脉冲神经网络(SNNs)和人工神经网络(ANNs)。该研究还解决了在硬件上部署这种混合结构的挑战,并在 Intel 的神经形态处理器 Loihi 和 Jetson Nano...

本研究探讨了神经形态计算和边缘计算相结合的潜力,创建了一个适用于处理动态视觉传感器捕获数据的多功能机器学习系统。通过混合使用PyTorch和Lava框架构建和训练了混合模型,融合脉冲神经网络(SNNs)和人工神经网络(ANNs)。研究结果表明,混合脉冲神经网络在所有指标上均优于基准人工神经网络模型,并在准确性和延迟方面优于基准脉冲神经网络模型。

相关推荐 去reddit讨论

PowerYOLO: 硬件高效对象检测与事件数据的混合精度模型

原文约300字,阅读约需1分钟。发表于:

PowerYOLO 是一种混合精度解决方案,通过使用动态视觉传感器、Powers-of-Two 量化和批量归一化融合方案,将内存复杂性减少近 8 倍,实现了对 GEN1 DVS 数据集 mAP 为 0.301 的高准确性,成为了新的技术标准。

本文综述了YOLO目标检测算法的演进,重点介绍了YOLOv5、YOLOv8和YOLOv10,分析了它们的架构改进、性能提升和边缘部署适用性。研究结果显示YOLO在准确性、效率和实时性能方面取得了进展,并强调了在资源受限环境中的适用性。提供了模型复杂性和检测准确性之间的权衡,为选择特定边缘计算应用的最合适的YOLO版本提供指导。

相关推荐 去reddit讨论

震惊!谷歌在Chromium里预留私有API 可以让谷歌网站读取更多PC硬件信息

原文约1200字,阅读约需3分钟。发表于:

#科技资讯 震惊!谷歌在 Chromium 预留私有 API 可以让谷歌网站读取更多 PC 硬件信息,例如 CPU/GPU 使用率和日志记录等。该 API 仅面向谷歌主域名开放,其他基于 Chromium 的浏览器包括 Microsoft Edge 和 Brave 等也被发现存在这个 API,显然微软可能也没注意到这个问题。查看全文:https://ourl.co/104867

谷歌在Chromium预留了私有API,可以读取更多PC硬件信息,可能违反了欧盟最新的数字市场法案。谷歌可以利用这个API优化Google Meet在PC上的表现效果,而Zoom无法获得详细的CPU/GPU使用信息。

相关推荐 去reddit讨论

五分钟——配置OpenGlass的硬件

原文约5200字,阅读约需13分钟。发表于:

就在五月份,一个名为Open Glass的开源项目在Meta的黑客松上吸引了大量的关注。因为通过20美金左右的硬件成本,结合大语言多模态模型的能力,实现了很多炫酷的功能。 在Youtube有个简短的演示视频:OpenGlass Demo - Meta AI LLaMa Hackathon - 12th May 2024 - YouTube 从LLM的开发角度看,其实在这个基础之上还可以...

五月份,Meta黑客松上的开源项目Open Glass受到了广泛关注。该项目利用低成本硬件和多模态模型实现了多种功能。项目已在github.com/BasedHardware/OpenGlass开源,提供代码和介绍。只需配置硬件和安装Arduino开发环境,即可上传示例固件代码到开发板。

相关推荐 去reddit讨论