小红花·文摘 - 小红花技术领袖俱乐部

本文探讨了优化spaCy以提高自然语言处理效率的三种技巧：选择性加载和禁用组件以减少计算开销，使用nlp.pipe进行高吞吐量批处理以利用多核并行处理，以及通过EntityRuler实现混合命名实体识别。这些方法显著提升了处理速度和准确性，满足特定业务需求。

提高文本处理和实体识别效率的三种SpaCy技巧

KDnuggets ·

【案例共创】基于spaCy的NER模型构建与深度EDA解析：Twitter情感短语提取

【案例共创】基于spaCy的NER模型构建与深度EDA解析：Twitter情感短语提取

华为云官方博客 ·

使用spaCy探索自然语言处理（NLP）🚀

使用spaCy探索自然语言处理（NLP）🚀

DEV Community ·

使用正则表达式和spaCy在提示中屏蔽机密数据

使用正则表达式和spaCy在提示中屏蔽机密数据

DEV Community ·

spaCy简介：强大的自然语言处理库

spaCy简介：强大的自然语言处理库

DEV Community ·

提炼你的大型语言模型，超越其性能：spaCy创始人在InfoQ DevSummit Munich的分享

提炼你的大型语言模型，超越其性能：spaCy创始人在InfoQ DevSummit Munich的分享

InfoQ ·

本研究使用Spacy和roBERTa对人道主义文本进行地理标记，并提出了FeatureRank的地理编码方法。研究发现，人道主义领域的数据不仅提高了分类器性能，还减轻了现有工具的偏见。为了确保现有的NER系统适用于人道主义领域的部署，需要更多来自非西方文件的资源。

毋遺一處：提升人道主義文件的地理定位

BriefGPT - AI 论文速递 ·