BriefGPT - AI 论文速递 ·

PhayaThaiBERT：用未吸收外借词增强预训练泰语语言模型

💡 原文中文，约300字，阅读约需1分钟。

📝

内容提要

本文介绍了从维基百科数据中创建特定语言BERT模型的自动化流程，并引入了42个新的模型。评估结果显示，这些特定语言模型在某些语言方面有显著改进。初步结果为了解特定语言模型的最佳条件提供了第一步。

🎯

🏷️

深入探讨语言模型的校准：Platt缩放、等距回归与温度缩放
大型语言模型（LLMs）普遍存在误校准问题，导致信心分数与实际正确率不符。传统的后处理校准方法包括温度缩放、Platt缩放和等距回归，但由于LLMs的复杂...
这是你的笔记本电脑……在人工智能时代
We're now deep into developer conference season, and one of the themes so...
当你的手机在机场被扣押时会发生什么
Even if you've done nothing wrong, it's never a good idea to hand you...
Gemma 4 QAT模型：优化移动设备和笔记本电脑的模型压缩效率
Gemma 4 Quantization-Aware Training (QAT)
纽约州立法者通过了一项为期一年的新数据中心禁令
The New York State legislature passed a one-year moratorium on new large data...
我们在2026年5月发布的最新AI新闻
谷歌在2026年5月推出了多个AI相关产品，包括Gemini 3.5和Gemini Omni，旨在提升日常生活便利性。新应用Google Health和F...