小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Modal 提供免费的 GLM-5.1 模型到月底,但限速 1

Modal 是一个云AI算力平台,提供免费的 GLM-5.1 模型,参数为746B,使用限制为每次只能有一个并发请求,免费使用到4月30日。测试时可能遇到限速问题,建议用户在热度过去后再尝试。

Modal 提供免费的 GLM-5.1 模型到月底,但限速 1

小众软件
小众软件 · 2026-04-15T08:19:16Z

In this article, the author explores how hierarchical agentic RAG systems coordinate specialized workers through structured orchestration to improve accuracy, reliability, and explainability in...

Article: Building Hierarchical Agentic RAG Systems: Multi-Modal Reasoning with Autonomous Error Recovery

InfoQ
InfoQ · 2026-04-09T09:00:00Z
电子商务搜索中的稀疏嵌入微调 | 第二部分:在Modal上训练SPLADE

本文讨论了在电子商务搜索中微调稀疏嵌入的方法,重点介绍了使用亚马逊ESCI数据集训练SPLADE模型的过程。强调了数据格式化的重要性,以及通过SpladeLoss实现对比学习与稀疏性正则化的平衡。此外,使用Modal的持久存储解决了检查点管理问题,确保了训练过程的稳定性。

电子商务搜索中的稀疏嵌入微调 | 第二部分:在Modal上训练SPLADE

Qdrant - Vector Database
Qdrant - Vector Database · 2026-03-09T00:00:00Z
Jamsocket的会话状态基础设施与Modal合并,迎来新家

保罗·巴特勒和泰勒·鲍德温在生成艺术领域相识后创立了Jamsocket,旨在解决浏览器性能不足的问题。Jamsocket提供实时协作和数据密集型应用的基础设施,支持会话状态管理。尽管面临开发者思维转变的挑战,Jamsocket通过开源和简化接口吸引用户。最近,Jamsocket与Modal合并,扩展产品线,提升性能和可扩展性。

Jamsocket的会话状态基础设施与Modal合并,迎来新家

The New Stack
The New Stack · 2025-07-10T16:00:45Z
在Modal上部署Magistral vLLM服务器

Modal是一个无服务器平台,用户可以快速构建和部署Python应用。通过单个命令,用户可配置系统需求并将应用部署到云端。本文介绍了Modal的设置、vLLM服务器的创建与安全部署,以及使用CURL和OpenAI SDK进行测试。Modal简化了云基础设施管理,适合初学者和数据科学家。

在Modal上部署Magistral vLLM服务器

KDnuggets
KDnuggets · 2025-06-17T14:00:29Z

本研究提出了一种新方法,结合外生时间序列特征与静态特征,以提升医疗领域时间序列预测模型的透明性和可解释性。实验结果表明,该方法在保持预测准确性的同时,增强了模型的可解释性和鲁棒性。

Robust Multi-Modal Forecasting: Integrating Static and Dynamic Features

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z

本研究针对语音LLM在上下文推理和副语言理解方面的不足,提出了一种新框架,通过实际语音数据生成问答数据集。研究结果显示,语音LLM在同理推理任务中的局限性,强调了对相关数据集和更强模型的需求。

Creation of Contextual Paralinguistic Data for Multi-Modal Speech LLM: Data Condensation and Spoken QA Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本研究提出了一种新的跨模态对齐方法——结构引导跨模态对齐(SGCMA),旨在提升大型语言模型在时间序列预测中的应用。该方法通过学习状态转移图结构和语义对齐,显著提高了预测性能和泛化能力。

Enhancing the Application of Large Language Models in Time Series Forecasting via Structure-Guided Cross-Modal Alignment

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本研究提出了一种名为PI-VAD的框架,用于弱监督视频异常检测。通过引入五种附加模态来增强RGB特征,从而提高异常检测的可靠性。PI-VAD在多个数据集上表现出色,展示了有效整合多模态信息的潜力。

Just Dance with $π$! A Poly-modal Inductor for Weakly-supervised Video Anomaly Detection

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本研究提出了一种基于最佳运输的图匹配方法(GM-OT),旨在解决从预训练语言模型向声学特征学习转移语言知识时的对齐挑战。该方法通过将语言和声学序列建模为结构化图,提升了知识迁移效率,显著提高了自动语音识别模型的性能。

Cross-modal Knowledge Transfer Learning for Automatic Speech Recognition Based on Optimal Transport Graph Matching

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

2025年NLPCC共享任务4旨在推动医学教学视频中的多模态、多语言和多跳问题回答研究。新挑战M4IVQA评估模型在处理视频与文本数据、理解多语言查询及合理回答方面的能力,促进医疗场景中的多模态推理系统创新,提高医疗教育平台的效率。

Overview of the NLPCC 2025 Shared Task 4: Multi-modal, Multilingual, and Multi-hop Medical Instructional Video Question Answering Challenge

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-11T00:00:00Z

本研究提出了一种名为Biomed-DPT的双模态提示调优技术,旨在提升生物医学图像分类的提示学习效果。通过结合临床提示、领域适应提示和视觉提示中的零向量软提示,该方法显著提高了分类准确率。

Biomed-DPT: A Dual-Modal Prompt Tuning Technique for Biomedical Vision-Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-08T00:00:00Z

本研究提出VITA-Audio,一种高效的大规模语音模型,解决了现有模型在流媒体生成首个音频令牌时的高延迟问题。通过引入轻量级的多模态交叉令牌预测模块,该模型显著提高了推理速度,具备实时对话能力,并在多个任务中表现优异。

VITA-Audio: Fast Interleaved Cross-Modal Token Generation for Efficient Large-Scale Speech Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-06T00:00:00Z

本研究提出了一种多尺度跨模态融合网络(MSFNet-CPD),旨在提高农业害虫识别的准确性。该方法结合视觉和文本特征,并构建了两个新数据集(CTIP102和STIP102)。实验结果表明,MSFNet-CPD在多个检测基准上优于现有技术,展现出良好的应用潜力。

MSFNet-CPD: A Multi-Scale Cross-Modal Fusion Network for Crop Pest Detection

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-05T00:00:00Z

本研究提出了一种新训练目标,通过对语义表示施加约束,增强正样本对齐。同时,针对BERT模型的注意力沉没现象,提出交叉注意力结构,以提升CLS标签的注意力和池化质量。该方法在多个语义文本相似度任务中表现优异。

JTCSE: Joint Tensor Modal Constraints and Cross-Attention for Unsupervised Contrastive Learning of Sentence Embeddings

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-05T00:00:00Z

本研究提出CLIP-KOA框架,通过结合图像和文本信息,利用对称损失和一致性损失,提高膝关节骨关节炎(KOA)的诊断准确性。结果表明,该方法在KOA严重度预测中达到了71.86%的最佳准确率,增强了医疗预测的可靠性。

CLIP-KOA: Enhancing Knee Osteoarthritis Diagnosis through Multi-Modal Learning and Symmetry-Aware Loss Functions

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-28T00:00:00Z

本研究提出了PolyTouch触觉传感器,旨在提高机器人在非结构化家庭环境中的灵巧操作能力。该传感器集成了视觉和听觉等多种感知功能,显著增强了家用机器人的灵活性和可靠性。

PolyTouch: A Robust Multi-Modal Tactile Sensor for Contact-Rich Manipulation Using Tactile-Diffusion Strategies

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-27T00:00:00Z

本研究提出了一种跨模态注意力机制,旨在解决将触觉与音频整合到机器人模型中的高维问题,识别信息量最大的模态,并训练层次策略以应对复杂的操控任务。

Modal Selection and Skill Segmentation through Cross-Modal Attention

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-20T00:00:00Z

本研究提出了一种新的生成式跨模态检索框架SemCORE,解决了现有方法在语义信息方面的不足。通过结构化自然语言标识符和生成语义验证策略,SemCORE提升了语义理解能力,并在多个数据集上显著提高了检索性能。

SemCORE: A Semantic-Enhanced Generative Cross-Modal Retrieval Framework

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-17T00:00:00Z

本研究提出了CDUPatch,解决了双模态对抗补丁攻击在不同物理场景中的有效性不足问题。通过颜色变化引起的热量吸收差异,实现了跨模态补丁的统一优化,实验结果表明该方法在真实环境中表现优异。

Color-Driven Universal Adversarial Patch Attack for Dual-Modal Visible-Infrared Detectors

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-15T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码