小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
ASA 音频隐写技术:一种不依赖深度学习的音频 – 图像隐写方案

隐写术是一种将秘密信息隐藏于非机密载体的技术。印度研究团队提出了一种新型音频隐写技术ASA,结合声谱图与图像嵌入,能够高效、安全地隐藏音频。该方法不依赖深度学习,具有高存储效率和良好音质,但在高频细节重建和兼容性方面存在不足。

ASA 音频隐写技术:一种不依赖深度学习的音频 – 图像隐写方案

实时互动网
实时互动网 · 2025-12-12T06:37:50Z
深入探讨Google Cloud上BigQuery的图像嵌入与向量搜索

本文介绍了如何利用BigQuery的机器学习能力,通过图像嵌入技术构建AI驱动的裙子搜索。图像嵌入将图像转化为高维数值表示,支持基于视觉相似性的搜索。用户可上传图片或文本描述,快速找到相似裙子,从而提升在线购物体验和销售效率。

深入探讨Google Cloud上BigQuery的图像嵌入与向量搜索

KDnuggets
KDnuggets · 2025-07-29T16:00:13Z

本研究评估了电子商务中图像嵌入的基础模型,发现全面微调模型表现优异,而文本-图像和自监督嵌入在较少训练下也能达到相似效果。顶层微调被证实为降低计算成本的有效替代方案,为嵌入选择和微调策略提供了实用指导。

Benchmarking Image Embeddings for E-Commerce: Evaluating Off-the-Shelf Foundation Models, Fine-Tuning Strategies, and Practical Trade-offs

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-10T00:00:00Z

本文提出了一种新方法,通过优化图像嵌入,改善基础医学分割模型在特定病变上的表现。实验结果显示,该方法在三个数据集上提升了约3%的Dice得分,同时计算复杂度减少了7倍,具有重要的应用潜力。

Test-time Adaptation for Foundation Medical Segmentation Model without Parametric Updates

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-02T00:00:00Z
实施多模态检索增强生成系统

多模态检索增强生成(RAG)系统结合文本、音频和图像数据,提升大语言模型(LLM)的输出准确性。通过实时检索外部知识,RAG系统增强生成的准确性。本文介绍了使用CLIP生成图像嵌入、利用Whisper进行音频转录,并将数据存储在ChromaDB中,最终使用Qwen-VL模型生成基于多模态数据的文本响应。

实施多模态检索增强生成系统

MachineLearningMastery.com
MachineLearningMastery.com · 2025-02-12T11:00:32Z

本研究提出了一种高效的医疗图像分类方法,利用预训练模型生成图像嵌入,并应用简单的线性分类器,显著提高分类性能,最大提升达到87%。该方法减少了计算资源需求,为医疗影像分析提供了更优方案。

Embeddings Are All You Need! Achieving High-Performance Medical Image Classification through Training-Free Embedding Analysis

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z

本文研究了跨域少样本分类中原型与图像嵌入的差距,指出现有方法的等同变换限制了优化。提出了对比原型-图像自适应(CoPA)方法,通过不同变换缩小差距,在Meta-Dataset上效果显著。

关注跨域微调中原型与图像之间的差距

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z

本研究探讨了在曲线里曼尼流形中提高图像嵌入表现的方法,实验结果表明新模型在保留全局地理信息和网络分析方面优于传统嵌入。研究还展示了动态边缘曲率和Ricci流等方法在数据挖掘中的应用潜力。

图形抚平:朝向大规模图形的正确几何分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-31T00:00:00Z

本研究利用独立分量分析技术揭示了单词和图像嵌入的规律,发现语义轴在不同语言和算法中一致存在,从而提高了模型的可解释性并促进了模型压缩。同时,研究提出了Axis Tour新方法以优化词嵌入空间,增强低维嵌入的构建效果。

探索使用 ICA 的内部和外部语言一致性嵌入

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-18T00:00:00Z

本研究提出了一种增强多模式大型语言模型可解释性的方法,结合图像嵌入和开放世界定位模型,改善文本与物体定位输出。通过特征混合方法提升视觉能力,构建了多模态几何数据集Geo170K,并在多个基准测试中展示了显著的性能提升,强调了多模态理解的重要性和应用潜力。

使用多模态大型语言模型解决组合问题:一个关于旅行推销员问题的案例研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-11T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码