lowinli's blog ·

bigbird长文本预训练模型介绍

📝

内容提要

本博客翻译自huggingface blog。文末有惊喜前言基于Transformer的模型已经被证明了在许多NLP任务中的价值，但这类模型的时间复杂度、内存使用复杂度都是$n^2$（n为序列长度），因此当序列长度超过常规的512时，模型对算力的要求将会大幅提高。最近的一些文章Longformer, Performer, Reformer, Clustered...

➡️

继续阅读

Atlassian旗下软件(Jira/Confluence等)将从8月17日开始收集客户数据用于训练模型
知名软件公司Atlassian近期更新数据贡献政策，自2026年8月17日起将使用客户在Jira、Confluence等云产品中的数据训练AI模型。企业版...
AI抵制浪潮兴起：数据投毒与虚假信息如何反击模型训练
人们通过投喂垃圾数据和散布虚假信息来抵制AI数据抓取，旨在提高数据采集成本，迫使科技公司改变做法。Reddit社区“毒泉”鼓励用户向爬虫提供无用数据，以影...
零样本文本分类入门
零样本文本分类是一种无需特定任务训练数据即可标记文本的方法。模型通过将标签转化为自然语言陈述，判断输入文本与这些陈述的匹配程度。这种方法适用于快速原型开发...
亚马逊云科技助力企业安全部署OpenClaw
亚马逊云科技支持企业安全部署OpenClaw，尽管该工具自发布以来迅速流行，但也带来了安全隐患。恶意Skill数量激增，攻击者可通过“提示词注入”控制系统...
黑芝麻智能发布华山A2000家族四款高算力芯片
黑芝麻智能发布了华山A2000家族四款高算力芯片，专为下一代AI模型设计，满足智能驾驶需求。芯片包括A2000N、A2000L、A2000U和A2000X...
PlayStation的年龄验证限制将于2026年在英国主机上实施
索尼将于2026年6月在英国和爱尔兰实施PlayStation的年龄验证要求，未完成验证的用户将无法使用语音聊天、消息和其他社交功能。用户可通过手机号码、...