小红花·文摘 - 小红花技术领袖俱乐部

本文介绍了解决SemEval 2023 Task 2的体系结构和系统，评估了传统的条件随机场模型和经过自定义头部微调的大型语言模型（LLM）。通过新的想法提高了模型性能，包括衰减辅助损失、三元标记混合和任务最优头部。最终模型在开发数据上达到了0.85/0.84的微观和宏观F1值，并在测试数据上达到了0.67/0.61。证明了预训练的LLM和额外特征/损失/模型工程技术的结合可以显著提高宏观F1分数。

PaDeLLM-NER：大型语言模型中的并行解码用于命名实体识别

BriefGPT - AI 论文速递 ·

本文介绍了解决SemEval 2023 Task 2：MultiCoNER II问题的体系结构和系统，并评估了传统的条件随机场模型和经过自定义头部微调的大型语言模型（LLM）。通过新的想法和技术改进，如衰减辅助损失、三元标记混合和任务最优头部，提高了模型性能。最终模型在开发数据上达到了0.85/0.84的微观和宏观F1值，并在测试数据上达到了0.67/0.61。证明了预训练的LLM结合额外特征/损失/模型工程技术可以显著提高宏观F1分数。

多语言马来西亚嵌入：利用大型语言模型进行语义表示

BriefGPT - AI 论文速递 ·

本文介绍了解决SemEval 2023 Task 2：MultiCoNER II问题的体系结构和系统，评估了传统的条件随机场模型和经过自定义头部微调的大型语言模型（LLM），并比较了两种方法。通过新想法提高了LLM的性能，包括衰减辅助损失、三元标记混合和任务最优头部。最终模型在开发数据上达到了0.85/0.84的微观和宏观F1值，并在测试数据上达到了0.67/0.61。通过增强额外特征/损失/模型工程技术，可以显著提高宏观F1分数。

大型语言模型不是你所需的全部

BriefGPT - AI 论文速递 ·