BriefGPT - AI 论文速递 ·

Spectro-ViT：使用频谱图的 GABA 编辑 MRS 重建的视觉 Transformer 模型

💡 原文中文，约700字，阅读约需2分钟。

📝

内容提要

研究发现Vision Transformers（ViTs）中存在量化伪像，提出了一种零样本方法SRT来改善预训练ViTs处理空间量化的方式。SRT可以有效地超分辨率预训练ViTs的特征，捕捉到更多的局部细粒度结构。在不同任务中，SRT都能提高模型性能。此外，SRT还适用于非密集预测任务，产生了一致的改进效果。

🎯

关键要点

研究发现Vision Transformers（ViTs）中存在量化伪像，源于图像令牌化步骤。
提出了一种零样本方法SRT，旨在改善预训练ViTs处理空间量化的方式。
SRT通过子标记空间平移扰动输入图像获得特征集合，有效超分辨率预训练ViTs的特征。
SRT能够捕捉更多局部细粒度结构，这些结构在令牌化过程中可能被忽视。
SRT适用于任何层和任务，无需微调，特别在单目深度预测中表现明显。
在三种不同架构上，SRT在RMSE和RMSE-log指标上分别提高了4.7%和14.9%。
在半监督视频目标分割中，SRT平均提高了2.4%的F&J分数。
SRT在无监督显著区域分割上平均提高了2.1%的maxF指标。
尽管SRT基于像素级特征操作，但也适用于非密集预测任务，如图像检索和目标发现，分别提高了2.6%和1.0%。

🏷️

继续阅读

伊朗声称使用巡航导弹摧毁亚马逊AWS巴林数据中心不过目前全是AI图无法分辨真伪
#云计算伊朗声称使用巡航导弹成功摧毁亚马逊 AWS 巴林数据中心，不过目前全是 AI 图无法分辨真伪。正常来说只要发生袭击肯定会有现场居民拍照发网上，只...
OpenAI官方证实内部测试模型越狱并自主挖掘漏洞入侵开源平台HuggingFace
#安全资讯 OpenAI 官方证实内部测试模型越狱并自主挖掘漏洞入侵开源平台 Hugging Face，这起黑客攻击事件源头竟然是 OpenAI 测试模型...
法院批准A社与作者和出版社的15亿美元和解协议初步解决A社使用盗版图书训练模型问题
#人工智能法院批准 A 社与作者和出版社的 15 亿美元和解协议，初步解决 A 社使用盗版书籍训练模型的集体诉讼案件。法庭文件显示，A 社建立拥有 70...
有传言称谷歌正在研发名为Frozen v2的芯片将AI模型部分蚀刻到芯片上提高吞吐量
#人工智能谷歌也尝试将模型权重直接蚀刻到硅晶片中，谷歌正在研发的 Frozen v2 芯片 token 吞吐量是谷歌现有 TPU 单元的 6~10 倍。...
RoboTTT——面向机器人策略的上下文扩展：将TTT集成至VLA中以推理时建立记忆信息，从而将视觉-运动上下文扩展到 8K 个时间步
摘要：本文提出RoboTTT方法，通过将测试时训练（TTT）机制整合到机器人基础模型中，实现了8K时间步的长视觉-运动上下文建模。该方法采用快速权重机制，...
GitHub Increased Instant Navigation from 4% to 22% by Rethinking Client Side Architecture
GitHub redesigned GitHub Issues navigation using a client-side architecture t...

内容提要

关键要点

标签

继续阅读