小红花·文摘 - 小红花技术领袖俱乐部

Scikit-Ollama用于Scikit-LLM/Ollama集成

Scikit-Ollama用于Scikit-LLM/Ollama集成

MachineLearningMastery.com ·

使用Scikit-LLM与开源语言模型

使用Scikit-LLM与开源语言模型

MachineLearningMastery.com ·

Scikit-LLM与传统文本分类器的比较：何时应使用LLM？

Scikit-LLM与传统文本分类器的比较：何时应使用LLM？

MachineLearningMastery.com ·

在PyCharm中使用词袋模型

在PyCharm中使用词袋模型

The JetBrains Blog ·

如何在一个Scikit-learn管道中结合LLM嵌入、TF-IDF和元数据

如何在一个Scikit-learn管道中结合LLM嵌入、TF-IDF和元数据

MachineLearningMastery.com ·

LLM嵌入与TF-IDF与词袋模型：在Scikit-learn中哪种效果更好？

LLM嵌入与TF-IDF与词袋模型：在Scikit-learn中哪种效果更好？

MachineLearningMastery.com ·

第721期：使用zstd、可调用对象、Gemini等进行分类（2026年2月10日）

第721期：使用zstd、可调用对象、Gemini等进行分类（2026年2月10日）

PyCoder’s Weekly ·

ML.NET 可通过文本分类和命名实体识别（NER）提取人名和地名。实现步骤包括安装必要的包、准备预训练模型、定义数据结构、构建 ML 管道并进行预测。尽管 ML.NET 在 NER 生态中不如 Python 库丰富，但适合于已有 .NET 技术栈的轻量集成场景。

ML.NET实现人名、地名的提取

dotNET跨平台 ·

如何使用Natural库在JavaScript中进行基本的自然语言处理

如何使用Natural库在JavaScript中进行基本的自然语言处理

The New Stack ·

如何在项目中使用自然语言处理技术和工具 [完整手册]

如何在项目中使用自然语言处理技术和工具 [完整手册]

freeCodeCamp.org ·

为什么以及何时使用句子嵌入而非词嵌入

为什么以及何时使用句子嵌入而非词嵌入

MachineLearningMastery.com ·

谷歌DeepMind推出EmbeddingGemma，一个开放的设备嵌入模型

谷歌DeepMind推出EmbeddingGemma，一个开放的设备嵌入模型

InfoQ ·

谷歌推出Gemma 3开源模型，参数仅2.7亿，支持本地运行，适合文本分类和数据提取等任务，具备低能耗和快速微调的特点，保障用户隐私。

谷歌版小钢炮开源！0.27B大模型，4个注意力头，专为终端而生

量子位 ·

提示词注入攻击已成为大模型的主要威胁。研究表明，TokenBreak可以绕过文本分类模型的检测，通过巧妙修改输入词汇而不改变其含义。BERT等模型易受攻击，而Unigram模型相对安全，因此建议在提示词检测中优先使用Unigram模型。

加一个字母就可以绕过AI围栏，新的漏洞：TokenBreak

FreeBuf网络安全行业门户 ·

一种测试人工智能系统文本分类能力的新方法

一种测试人工智能系统文本分类能力的新方法

MIT News - Artificial intelligence ·

使用决策树理解文本

使用决策树理解文本

MachineLearningMastery.com ·

使用Scikit-LLM进行零样本和少样本分类

使用Scikit-LLM进行零样本和少样本分类

MachineLearningMastery.com ·

VisualStudio.Extensibility：编辑器分类与用户提示更新

VisualStudio.Extensibility：编辑器分类与用户提示更新

Visual Studio Blog ·

本文提出了一种基于强化学习的自动提示生成方法PRL，旨在解决有效提示工程的挑战。该方法能够生成新型示例，并在文本分类、简化和摘要等任务中取得优异表现，显著提升各项任务的效果。

PRL: Prompts from Reinforcement Learning

BriefGPT - AI 论文速递 ·

本研究提出了一种名为KO的神经网络优化器，基于动力学理论和偏微分方程模拟。KO通过粒子系统演化重新构思参数更新，增强参数多样性，有效减缓参数凝聚现象。实验结果显示，KO在图像和文本分类任务中的表现优于传统优化器，如Adam和SGD，准确率更高。

KO：基于动力学的神经网络优化器与偏微分方程模拟方法

BriefGPT - AI 论文速递 ·