小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
CSS 中的标点悬挂及其现状

标点悬挂是一种排版技术,使标点超出段落边界,提升阅读体验。虽然在西文排版中常见,但中文传统上不常用。CSS 的 hanging-punctuation 属性定义了这一行为,目前仅 Safari 部分支持,其他浏览器尚未实现,期待未来更广泛应用。

CSS 中的标点悬挂及其现状

delphij's Chaos
delphij's Chaos · 2025-10-27T04:48:41Z

本研究提出了一种名为Sadeed的小型语言模型,旨在解决阿拉伯语标点问题。Sadeed通过在高质量数据集上的微调,表现优越,超越传统模型,并引入新的评估基准SadeedDiac-25,推动阿拉伯语自然语言处理的发展。

Advancing Arabic Diacritization Through Small Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-30T00:00:00Z

本研究解决了大型语言模型(LLMs)在上下文信息存储中对某些小型标记(如标点符号、虚词)的低估问题。论文提出了一种新方法,通过分析发现删除这些标记会显著降低模型性能,同时开发了LLM显微镜工具包,以帮助评估标记级别的非线性特征,并可视化中间层的贡献。这一发现强调了这些看似无关的标记在维持上下文理解中的重要性。

LLM显微镜:揭示标点在变压器上下文记忆中的隐含作用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-20T00:00:00Z

本研究解决了语言翻译过程中标点符号特征变化的问题,指出詹姆斯·乔伊斯的《芬尼根的守灵夜》在不同语言间保持了标点特征的高度稳定性。通过分析多种语言的翻译,研究表明该作品的标点分布在统计特征上基本保持不变,进一步确认其作为超语言作品的特征。

詹姆斯·乔伊斯的《芬尼根的守灵夜》中的标点模式在很大程度上是翻译不变的

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-22T00:00:00Z

本研究解决语音识别文本缺乏标点的问题,影响理解。通过开发标点预测模型,使用HerBERT模型微调,在Poleval 2022任务中取得71.44的加权F1分数,提高文本理解准确性。

使用变换器进行波兰文本标点预测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-06T00:00:00Z

本研究解决了标点恢复模型仅在结构良好的脚本语料上评估的问题,并引入了非正式语音源的标点恢复数据集SponSpeech,提高了模型在实际应用中的有效性。

自发式非正式语音数据集用于标点恢复

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-17T00:00:00Z

本论文介绍了一种基于预训练掩码语言模型的条件联合建模框架,用于提高医学领域 ASR 系统的识别准确率。实验结果显示,该模型相对于基线模型在字典和会话样式语料库上有5%的绝对改进和10%的ASR输出优化。

一种轻量高效的用于设备上流式音频识别的标点和词形预测模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-18T00:00:00Z

最近的研究发展提出了可在GPU上加速的适用于机器学习流程的可微分物理模拟器。这种模拟器可以用于拟合标记点无遮挡运动捕捉数据的反向运动学,并改善了重新投影误差。

可微生物力学打开无标点运动捕捉的机会

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-27T00:00:00Z

非监督学习在预训练模型中起重要作用。最新的大型语言模型在对话能力方面表现出色,但在捕捉句法和语义结构方面有所滞后。研究发现,标点恢复可以提高与结构相关的任务性能,改善结构理解和产生更健壮的自然语言表示。

标点恢复提升结构理解无需监督

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-13T00:00:00Z

本文介绍了一个名为 LibriSpeech-PC 的基准测试,用于评估端到端自动语音识别模型在标点和大小写预测方面的能力,同时提出了一种名为 PER 的新型评估指标,专注于标点符号,并提供了初步的基准模型。

LibriSpeech-PC: 评估端到端自动语音识别模型标点和大小写能力的基准测试

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-04T00:00:00Z

本论文介绍了一种基于预训练掩码语言模型的条件联合建模框架,用于提高医学领域ASR系统的识别准确率。通过自适应技术和数据增强方法,该模型在字典和会话样式语料库上相对于基线模型实现了约5%的绝对改进和约10%的ASR输出优化。

一种适用于中文医学标点恢复的小型且快速的 BERT 模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-24T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码