小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文讨论了PPO中的clip和penalty机制,强调其在强化学习中的重要性。clip限制策略更新幅度,确保重要性采样有效,避免策略偏离;penalty通过引入KL惩罚,平衡奖励与维持现状的关系。两者共同提升了策略更新的稳定性和效率。

对 PPO-clip/penalty 一种理解

学习让我快乐
学习让我快乐 · 2026-02-16T16:00:00Z
索尼 LinkBuds Clip 耳夹式开放真无线耳机体验 - TDS REVIEW

LinkBuds Clip 是索尼新推出的耳夹式耳机,采用环保包装,配有灵动枕以适应不同耳廓。设计简约,佩戴稳定,支持 IPX4 防水,通话质量优秀。续航表现良好,音质出色,适合日常使用。整体评价为 IV 级,期待未来改进。

索尼 LinkBuds Clip 耳夹式开放真无线耳机体验 - TDS REVIEW

少数派
少数派 · 2026-02-11T07:31:26Z

DeepSeek发布了新OCR模型DeepSeek-OCR 2,采用轻量化Qwen2-0.5B模型,性能接近Gemini-3 Pro。该模型通过DeepEncoder V2实现视觉标记智能重排,提升PDF转Markdown的准确性,基于OmniDocBench v1.5测试显示性能提升3.73%。

DeepSeek开源全新OCR模型!弃用CLIP改用Qwen轻量小模型,性能媲美Gemini-3 Pro

量子位
量子位 · 2026-01-28T06:16:01Z
WPF 使用 HLSL + Clip 实现高亮歌词光照效果

本文介绍了如何通过WPF和HLSL实现歌词高亮效果。通过编写着色器、结合文本排版和动画,解决了文本模糊和性能问题,最终封装为用户控件,支持高亮颜色和模式自定义。

WPF 使用 HLSL + Clip 实现高亮歌词光照效果

dotNET跨平台
dotNET跨平台 · 2026-01-19T00:02:46Z
OpenAI CLIP:通过文本学习零样本图像识别的模型

CLIP是OpenAI开发的神经网络,通过学习4亿对图像和文本,实现无标注数据的图像分类。它通过匹配图像与文本描述,克服了传统计算机视觉的局限性,具有灵活性和高效性,广泛应用于AI领域。

OpenAI CLIP:通过文本学习零样本图像识别的模型

ByteByteGo Newsletter
ByteByteGo Newsletter · 2025-12-29T16:30:45Z
FPO——流匹配策略梯度:避开复杂的对数似然计算,通过「最大化基于CFM损失计算优势加权比率」做策略优化,兼容PPO-CLIP

本文讨论了流策略优化(FPO)在强化学习中的应用,强调其通过条件流匹配损失替代传统高斯似然损失,从而提高策略表达能力。FPO有效处理多峰决策问题,适用于复杂任务,如机器人控制,并通过优化证据下界(ELBO)简化计算过程,提升学习效率。

FPO——流匹配策略梯度:避开复杂的对数似然计算,通过「最大化基于CFM损失计算优势加权比率」做策略优化,兼容PPO-CLIP

结构之法 算法之道
结构之法 算法之道 · 2025-11-25T09:59:55Z

本文探讨了大型行为模型(LBM)在波士顿动力人形Atlas中的应用,强调其在复杂任务中的表现。LBM通过多任务数据集训练,提升了机器人在动态环境中的自主互动能力。研究表明,LBM在微调新任务时仅需少量数据,并且在应对环境变化时表现更为稳健。尽管取得了一定进展,仍面临评估标准化和数据收集等挑战。

LBM——大型行为模型助力波士顿人形Atlas完成多任务灵巧操作:CLIP编码图像与语义,之后DiT去噪扩散生成动作

结构之法 算法之道
结构之法 算法之道 · 2025-08-29T13:36:25Z

本文介绍了图像生成技术的发展,重点讨论了CLIP和BLIP及其变体的结构与训练方法。CLIP通过对比学习实现图像与文本的匹配,BLIP结合理解与生成能力,提升多模态任务表现。BLIP2引入Q-Former模块,优化视觉与语言对齐,InstructBLIP增强指令遵循能力,适应不同任务需求。

图文对比学习的发展史:从CLIP、BLIP、BLIP2、InstructBLIP到具身模型常用的SigLIP

结构之法 算法之道
结构之法 算法之道 · 2025-08-22T15:13:18Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

OpenAI提出的CLIP,被Meta联合谢赛宁、刘壮,扩展到全球300+语言

机器之心
机器之心 · 2025-07-31T06:23:31Z
Pebblebee的AirTag替代品现在还可以作为紧急警报

Pebblebee推出了Clip定位追踪器的新安全功能“Alert”,可与Apple和Google网络兼容。按下按钮可触发警报和闪光灯,通知附近的人并向紧急联系人发送位置通知。此功能为免费更新,未来将支持多个联系人,并计划增加实时位置追踪。

Pebblebee的AirTag替代品现在还可以作为紧急警报

The Verge
The Verge · 2025-07-14T16:00:00Z

四个月前,我们发布了Moonlight,在16B的MoE模型上验证了Muon优化器的有效性。在Moonlight中,我们确认了给Muon添加Weight Decay的必要性,同时提出了通过Upd...

QK-Clip:让Muon在Scaleup之路上更进一步

科学空间|Scientific Spaces
科学空间|Scientific Spaces · 2025-07-12T06:07:00Z

本文介绍了CSS中的clip-path函数,重点阐述了path()与shape()的区别。shape()函数支持百分比和CSS数学函数,解决了path()在尺寸适应上的局限,提供了更灵活的剪裁方式。作者还提供了在线转换工具,方便开发者使用。

CSS小图标剪裁终极解决方案clip-path shape()函数

张鑫旭
张鑫旭 · 2025-06-30T08:35:52Z
对比定位语言-图像预训练

CLIP方法用于训练视觉编码器生成图像和文本表示,但在细粒度视觉表示上有不足。本文提出CLOC方法,通过区域-文本对比损失提升CLIP的定位能力。CLOC引入可提示嵌入,设计视觉丰富的标注框架,生成大规模区域-文本伪标签,增强MLLMs在指代和定位任务中的表现。

对比定位语言-图像预训练

Apple Machine Learning Research
Apple Machine Learning Research · 2025-06-30T00:00:00Z
CLIP-UP:一种简单高效的稀疏上循环Mixture-of-Experts CLIP训练方案

Mixture-of-Experts (MoE)模型在提升模型能力和控制推理成本方面至关重要。我们提出了一种高效的训练策略CLIP-Upcycling(CLIP-UP),将预训练的密集CLIP模型转化为稀疏MoE架构。实验结果表明,CLIP-UP显著降低了训练复杂性和成本,稀疏CLIP B/16模型在COCO和Flickr30k基准测试中分别超越密集模型7.2%和6.6%。该方法在不同规模上表现良好,为构建高效CLIP模型提供了可行方案。

CLIP-UP:一种简单高效的稀疏上循环Mixture-of-Experts CLIP训练方案

Apple Machine Learning Research
Apple Machine Learning Research · 2025-05-27T00:00:00Z

本研究提出了一种名为AdaptCLIP的方法,用于在开放场景中识别新颖视觉领域的异常。该方法通过交替学习视觉和文本表示,结合上下文和对齐残差特征的比较学习,克服了现有方法的灵活性不足,并在多个异常检测基准上表现优异。

AdaptCLIP: A Universal Visual Anomaly Detection Method Adapted from CLIP

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-15T00:00:00Z

本研究针对社交媒体平台上AI生成图像的真实性验证难题,探索了CLIP嵌入是否蕴含能指示AI生成的信息。通过提取可视嵌入并用于轻量级网络,本研究在CIFAKE基准上实现了95%的准确率,强调了在特定图像类型下的分类挑战,揭示了该领域值得深入探讨的新问题。

CLIP嵌入用于AI生成图像检测:轻量级分类器的少量学习研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-15T00:00:00Z

本研究提出了Endo-CLIP框架,旨在解决结肠镜图像分析中的背景干扰和医学术语模糊问题。实验结果表明,该框架在息肉检测与分类方面优于现有方法,准确性更高。

Endo-CLIP: A Stepwise Self-Supervised Pretraining on Raw Colonoscopy Records

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-14T00:00:00Z

该研究提出了细粒度CLIP(FG-CLIP),通过生成16亿对长文本与图像,增强了模型对细微语义差异的识别能力。实验结果表明,FG-CLIP在多个任务中超越了原始CLIP及其他方法,有效提升了模型性能。

FG-CLIP:细粒度视觉与文本对齐

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-08T00:00:00Z

本研究解决了CLIP模型在多样化下游任务中容易受到对抗扰动攻击的安全隐患。我们提出了一种创新性的方法X-Transfer,通过生成一种通用对抗扰动(UAP),实现了跨数据、跨领域、跨模型和跨任务的一次性攻击效果,即“超转移性”。实验结果显示,X-Transfer在对抗转移性方面显著超越了现有最先进的方法,树立了CLIP模型的对抗转移性新基准。

X-Transfer攻击:迈向可超转移的CLIP对抗攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-08T00:00:00Z

本研究提出了一种新颖的视觉令牌化方法TokLIP,旨在解决多模态统一中的高计算开销和理解性能问题。通过语义化向量量化和CLIP语义融合,TokLIP实现了高效的数据处理,提升了视觉令牌的语义理解和生成能力,适用于自回归Transformer的任务。

TokLIP: Combining Visual Tokens with CLIP for Multimodal Understanding and Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-08T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码