小红花·文摘

本研究提出DINT变换器，改进了DIFF变换器在全局上下文建模和数值稳定性方面的不足，通过差分-积分机制增强了对全局依赖的捕捉能力。实验结果表明，DINT在长上下文语言建模和关键信息检索中表现优异。

Differential-Integral Transformer

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法，解决现有引用视频对象分割（RVOS）在短视频片段中缺乏全局上下文的问题。通过引入自然语言理解和时间建模，增强了Segment-Anything 2（SAM2）模型，使其在流式场景中有效工作，保持上下文信息，并在多个基准测试中取得优异成果。

SAMWISE: Infusing Intelligence into Text-Driven Video Segmentation

BriefGPT - AI 论文速递 ·

JavaScript 是如何工作的？

DEV Community ·

本研究探讨了语言模型在图像生成中的应用，揭示了图像标记与文本标记的随机性差异对训练的挑战。小模型在捕捉全局上下文方面有限，而大模型则显著提升，为视觉生成领域的设计提供了重要见解。

阐明用于图像生成的语言模型设计空间

BriefGPT - AI 论文速递 ·

晚分块的真正含义与误解：第二部分

Jina AI ·

研究人员提出了局部关注Mamba（LaMamba）模型，结合自注意和Mamba的优势，以线性复杂度捕捉全局上下文和局部细节。LaMamba在ImageNet数据集上超越了DiT的性能，同时使用更少的计算资源和参数。

LaMamba-Diff: 基于本地注意力和 Mamba 的线性时间高保真扩散模型

BriefGPT - AI 论文速递 ·

我们提出了一种自我监督学习框架，名为LC-MAE，能够利用全局上下文理解视觉表示，提高准确率。在ImageNet-1K上，LC-MAE实现了84.2%的top-1准确率，比基准模型提高了0.6%。在下游任务中也取得了显著性能提升。

增强掩模自编码器的伪标记

BriefGPT - AI 论文速递 ·

该文章讨论了基于Transformer的架构在自然语言处理中的输入大小限制问题，并提出了一种解决方案。通过将长文档分块并保持全局上下文，以查询定义话题，开发的系统使用预训练的BERT模型来估计给定文本跨度形成关键短语的概率。实验结果表明，在长文档上，使用查询的较短上下文大小胜过没有查询的较长上下文。

LumberChunker: 长篇叙述文档切割

BriefGPT - AI 论文速递 ·

我们提出了一种自我监督学习框架，称为LC-MAE，能够利用全局上下文理解视觉表示，减少输入的空间冗余。LC-MAE在ImageNet-1K上使用ViT-B实现了84.2%的top-1准确率，比基准模型提高了0.6%。在语义分割和细粒度视觉分类任务中表现出色，并在鲁棒性评估指标上取得了优异结果。

将 LLaMA 解码器调整为视觉 Transformer

BriefGPT - AI 论文速递 ·

LC-MAE是一种自我监督学习框架，利用全局上下文理解视觉表示，减少输入的空间冗余。在ImageNet-1K上使用ViT-B实现了84.2%的top-1准确率，比基准模型提高了0.6%。在下游任务中，LC-MAE取得了显著的性能提升，并在多个鲁棒性评估指标上表现优异。

SS-MAE：用于多源遥感图像分类的空间 - 频谱屏蔽自编码器

BriefGPT - AI 论文速递 ·

该研究基于2D TransUNet体系结构，引入基于Transformer的编码器和解码器，实现全局上下文提取和候选区域精炼，适用于医学任务。实验证明，TransUNet在医学应用中表现出色，超越竞争对手。

SeUNet-Trans: 医学图像分割的简单而有效的 UNet-Transformer 模型

BriefGPT - AI 论文速递 ·

本文介绍了Django中的上下文处理器，它是一个接收HttpRequest对象并返回包含上下文变量字典的Python函数。通过定义全局上下文，开发者可以在所有模板中访问这些变量，从而简化网站开发。文中还提供了创建和配置上下文处理器的示例代码。

Django 4.2 复习笔记(九)使用Django的上下文处理器（context processor）

碎言博客 ·