BriefGPT - AI 论文速递 ·

Mining Word Boundaries from Speech-Text Parallel Data for Cross-Domain Chinese Word Segmentation

💡 原文英文，约100词，阅读约需1分钟。

📝

内容提要

本研究针对中文分词中的词边界识别问题，采用语音-文本平行数据和Montreal Forced Aligner工具进行字符级对齐，提出了一种基于概率的过滤策略，实验结果表明该方法有效提升了分词性能。

🎯

🏷️

代理协调已经过时
文章讨论了现代AI代理的构建理念，指出以2024年的思维方式构建代理是错误的。随着模型在长期任务上的改进，过度的代理协调可能会降低模型性能。2026年的竞...
蛰伏的大半年
自从去年11月19日发布了一篇文章以后，我有大半年时间没有写文章了。这大半年，我选择了蛰伏。当时我的想法是，等 […]
Node.js 26: Temporal API Enabled by Default, V8 14.6, and a Round of Deprecations
Node.js 26 has been released, featuring the Temporal API enabled by default, ...
用 Option 给 macOS 操作加点料
Option 做的就和它图标 ⌥ 所展示的那样——展示菜单和选项的另一面。查看全文
Amazon Bedrock AgentCore 数据持久化文件系统：Session Storage 和 Amazon EFS / S3 Files
AgentCore 提供的三种持久化文件系统——Managed Session Storage、Amazon EFS、Amazon S3 Files，从按...
MPS芯源系统推出新一代高压离线电源解决方案
MPS芯源系统推出新一代高压离线电源解决方案HF1070，支持高达1080V直流输入，适用于三相智能电表和工业变频器等高压应用。该器件集成1700V Si...