小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
将jieba-rs的速度提升至2.4倍

jieba-rs在2025年进行了性能优化,核心分词速度提升至原来的2.4倍。HMM路径处理时间从2.85微秒降至1.32微秒,非HMM路径从2.21微秒降至0.94微秒。主要改进包括使用线程局部存储、减少内存分配和优化正则表达式使用,这些改动显著提高了处理效率,尤其是在处理大量句子时。

将jieba-rs的速度提升至2.4倍

Messense Lv
Messense Lv · 2026-04-19T14:56:57Z
LightOnOCR-2-1B:基于 RLVR 训练实现高精度端到端 OCR;Google Streetview 国家街景图像:基于世界级地理映射技术的全景图像开源库

LightOn公司发布了LightOnOCR-2-1B模型,采用端到端视觉-语言架构,参数仅10亿,性能超过90亿参数模型,显著提升复杂文档处理效率,适用于多种应用场景。

LightOnOCR-2-1B:基于 RLVR 训练实现高精度端到端 OCR;Google Streetview 国家街景图像:基于世界级地理映射技术的全景图像开源库

HyperAI超神经
HyperAI超神经 · 2026-02-09T06:31:16Z
DeepSeek-OCR 2大模型开源,重塑文档AI的认知逻辑

深度求索团队发布的DeepSeek-OCR 2模型在文档理解能力上取得了91.09%的得分。其核心创新“视觉因果流”提升了模型对复杂文档结构的理解,增强了处理效率和准确性,适用于多种文档类型,为未来多模态人工智能提供了新方向。

DeepSeek-OCR 2大模型开源,重塑文档AI的认知逻辑

TechWeb 全站精华
TechWeb 全站精华 · 2026-01-27T09:17:52Z
RAG 教程笔记(Task02)

当前主流的RAG文档加载器包括PyMuPDF、TextLoader和DirectoryLoader,适用于不同文档格式。文本分块是RAG流程的关键,分块策略包括固定大小、递归字符和语义分块,旨在提升信息检索的精度和处理效率。

RAG 教程笔记(Task02)

程序员充电站
程序员充电站 · 2025-12-19T15:05:29Z
Fluent Bit条件日志处理器指南

Fluent Bit是一个开源数据收集代理,支持日志、指标和追踪的处理与转发。版本4新增条件日志处理功能,允许根据日志内容进行选择性处理,增强上下文信息,提高处理效率。

Fluent Bit条件日志处理器指南

The New Stack
The New Stack · 2025-09-24T15:00:37Z
Uber Eats如何去重数亿产品图像

Uber Eats通过重新设计图像处理管道,采用内容可寻址缓存,减少冗余处理和存储成本。新系统利用图像哈希识别内容,支持在稳定URL下更新图像,从而提高处理效率和可靠性。

Uber Eats如何去重数亿产品图像

ByteByteGo Newsletter
ByteByteGo Newsletter · 2025-08-05T15:30:44Z

本研究评估了17个大型语言模型在文本摘要方面的性能,结果显示不同模型在准确性、质量和处理效率上存在显著差异,强调了根据特定需求选择合适模型的重要性。

文本摘要的实证比较:大型语言模型的多维评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-06T00:00:00Z
消息队列:如何实现流量削峰和平谷?

消息队列(MQ)广泛应用于消息发布和系统解耦,但直接调用和MQ推送无法有效控制流量,可能导致下游系统崩溃。通过上游或下游队列进行流量缓冲,以及优化下游系统的处理效率,可以解决这一问题。

消息队列:如何实现流量削峰和平谷?

DEV Community
DEV Community · 2025-03-21T01:33:30Z

本研究提出了一种名为DynamicVis的动态视觉感知基础模型,旨在提升遥感图像分析的泛化能力。该模型结合动态区域感知技术,增强了跨任务知识迁移能力,提高了高分辨率遥感图像的处理效率,并在多个任务中展现出良好的灵活性和效率。

DynamicVis: An Efficient and General Visual Foundation Model for Remote Sensing Image Understanding

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-20T00:00:00Z
使用OpenAI模型生成嵌入的最佳文本分块方法

在使用OpenAI嵌入模型时,文本分块是关键步骤,确保文本在令牌限制内并保留上下文。最佳实践包括基于令牌的分块、设置合适的块大小、添加重叠和使用逻辑分隔符。通过TypeScript实现分块和嵌入生成可提高处理效率和嵌入质量。

使用OpenAI模型生成嵌入的最佳文本分块方法

DEV Community
DEV Community · 2025-02-02T01:56:49Z

该研究提出了一种轻量级深度学习模型,能够自动检测体育视频中的精彩片段,显著减少人工干预。通过结合音频和视频源,模型实现了高准确率,提高了处理效率和鲁棒性。

Automated Detection of Sports Highlights Based on Deep Learning from Audio and Video Sources

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-27T00:00:00Z
VideoChat-Flash:针对长文本视频建模的分层压缩技术,可在计算量减少 100 倍的情况下处理长文本视频

本文介绍了一种新型的分层视频标记压缩方法HiCo及其在VideoChat-Flash中的应用,旨在提高长上下文视频的处理效率。该方法通过压缩视频信息,减少计算量,同时保留关键数据,显著提升了模型在短视频和长视频理解上的表现,超越了现有的SOTA模型。

VideoChat-Flash:针对长文本视频建模的分层压缩技术,可在计算量减少 100 倍的情况下处理长文本视频

实时互动网
实时互动网 · 2025-01-20T03:42:47Z

本研究提出了一种大型合成数据集和动态视觉标记压缩架构,旨在解决视频分析中的数据集不足和处理效率低的问题。该方法在多个视频任务上取得了先进的结果,并为多图像理解建立了新基准。

Dynamic Visual Language Model: Simple Dynamic Visual Token Compression for Video Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z

本研究提出SparseAccelerate动态稀疏注意力方法,旨在降低大语言模型在长上下文窗口下的计算成本,显著提升处理效率。

Sparse Acceleration: Efficient Long Context Inference on Mid-Range GPUs

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-09T00:00:00Z

本研究探讨视觉语言模型(VLMs)处理视觉信息的机制。分析表明,查询令牌有效存储全局图像信息,中层对跨模态信息流的影响显著,细粒度视觉属性和对象细节通过空间定位从图像中提取。这些发现为提升VLMs的视觉处理效率提供了新思路。

What’s in the Image? A Deep Dive into the Visual Capabilities of Vision-Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-26T00:00:00Z

本文探讨了京东物流Excel导入功能的设计思路,提出四个方案应对数据唯一性校验和处理效率问题:方案一为同步导入,存在内存压力和用户体验差;方案二引入线程池和MQ,提升效率但不适合实际场景;方案三在单服务器处理,压力大;方案四适用于大数据量和高时效性场景,采用异步处理和JMQ。强调合理使用中间件和适配业务场景的重要性。

EXCEL导入—设计与思考

京东科技开发者
京东科技开发者 · 2024-11-20T02:27:54Z

本研究提出了P/D-Serve系统,解决了在大规模语言模型上的性能可靠性问题。通过P/D组织和动态调整策略,提高了处理效率,实现了吞吐量、首次返回时间和D2D传输时间的显著提升,展现出吞吐量增长潜力。

P/D-Serve: 大规模服务解耦的大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-15T00:00:00Z

本文介绍了一种利用早期退出神经网络在嵌入式设备上进行深度学习推理的新技术,以提高处理资源有限的嵌入式平台上数据流的处理效率。通过在隐藏层之间添加分类器分支,能够更明智地决定何时终止推理,减少计算成本并最大限度地保持准确性。该技术适用于通用硬件并可与传统优化相结合,使其适用于资源有限的嵌入式平台。这种效率提升使得在资源受限平台上进行实时雷达数据处理成为可能,并在智能家居、物联网和人机交互等领域推出了新的应用。

陶器记录仪:感知长久并繁荣

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-05T00:00:00Z

本文介绍了一种利用早期退出神经网络在嵌入式设备上进行深度学习推理的新技术,以提高处理资源有限的嵌入式平台上数据流的处理效率。该技术能够智能地决定何时终止推理,减少计算成本并最大限度地保持准确性。该技术适用于通用硬件,并可与传统优化相结合,使其适用于资源有限的嵌入式平台。这种效率提升使得在资源受限平台上进行实时雷达数据处理成为可能,并在智能家居、物联网和人机交互等领域推出了新的应用。

微多普勒雷达分类的深度神经网络的鲁棒性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-21T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码