开发者jola分享了在M4 MacBook Pro上运行Qwen 3.5-9B(Q4_K_S量化版)本地大语言模型的经验,尽管该模型无法完成复杂任务,但它提升了开发者的参与度,成为一种可控的离线助手,适合24GB内存的用户。
Subquadratic公司推出了一种新模型,支持高达1200万tokens的上下文窗口,声称在检索效率上超越现有模型。其选择性注意力架构在计算和内存上实现线性扩展,速度比传统模型快52倍。公司计划未来推出5000万tokens的模型,并提供API和编码工具。尽管面临挑战,Subquadratic在多个基准测试中表现优异,吸引了投资者关注。
GitHub Copilot将于2026年6月1日起实施按量计费模式,因应对不断上涨的成本。每个订阅套餐将获得相应的AI信用点,使用量按tokens计算。开发者可提前了解费用并选择购买额外信用点。不同订阅的信用点和费用已公布,企业用户可共享未使用的信用点。
以色列理工学院的研究团队提出了一种名为 Task Tokens 的方法,旨在高效适配行为基础模型(BFM)到特定任务。该方法通过减少可训练参数和提高收敛速度,保持了模型的灵活性和泛化能力。实验表明,Task Tokens 在多种任务中表现优异,尤其在应对环境变化时展现出更强的鲁棒性。
人工智能Claude Opus 4.6和Claude Code近期性能显著下降,用户和开发者对此表示不满。开发者指出模型在复杂任务中的表现不佳,指令遵循能力下降,错误率上升。Anthropic承认调整了模型的努力程度以减少算力消耗,导致用户配额消耗加快,部分开发者质疑此举是为降低成本以准备上市,若不解决算力问题,可能会失去用户。
阿里云宣布自2026年4月13日起停止Coding Plan Lite版的续费和升级,现有订阅到期后结束。这一调整反映了整体涨价趋势,开发者将面临更高的Tokens购买成本。其他云服务商也在缩减基础订阅权益,未来AI模型使用费用将持续增加。
火山引擎的Coding Plan被指不透明,采用按调用次数和Tokens双重计费,导致用户配额迅速消耗。用户发现使用速度快于其他平台,客服解释高Tokens消耗会减少可调用次数,建议关注配额使用情况。
豆包大模型日均Token使用量已突破120万亿,增速显著,使用企业达140家,显示行业积极布局。火山引擎的Seedance 2.0已开启公测,AI发展速度的衡量标准愈发明显。
飞书推出云 OpenClaw 服务器,限免至2026年3月31日,首日提供400万Tokens,后续每日100万Tokens。用户可轻松部署和更换大模型,AI故障时可由飞书接管。活动面向已注册用户,具体使用情况待定。
扩散模型Mercury 2成为最快的生成模型,生成速度达到每秒1009个tokens,比传统自回归模型快5倍。其并行优化机制提升了生成速度,并在性能和成本上具有优势。Inception Labs专注于扩散模型,致力于突破速度与成本的瓶颈。
抱歉,提供的文本内容不足以进行总结。请提供更详细的文章内容。
阿里发布的Qwen3.5-Plus大模型参数达到3970亿,性能超越Gemini 3和GPT-5.2,百万Tokens仅需0.8元,支持201种语言,具备强大的多模态能力,能够处理复杂视觉信息,提升开发效率,推动开源模型的普及。
蚂蚁技术研究院推出的LLaDA2.1扩散模型在编程任务中实现892 tokens/秒的速度,标志着研究模型向实用工具的转变。其双模式设计允许用户根据需求选择速度或质量,克服了传统模型的局限性。LLaDA2.1在速度和质量上均表现优异,开源版本提供了轻量化选择。
抱歉,您提供的文本内容过于简短,无法进行有效的总结。请提供更详细的文章内容。
“星河产业应用创新奖”将于2025年增设“AI+法律服务”赛道,旨在推动法律行业的创新与应用。参赛项目可利用人工智能技术解决法务问题,并获得资源支持和曝光机会。近期在厦门举办的私享会汇聚行业专家,探讨AI在法律服务中的应用,促进技术交流与合作。
上海发布的Minimax M2开源模型以61分成为开源模型第一,突破智力、成本和速度的限制。其编程能力和推理速度优于Claude 3.5,成本仅为8%。M2支持多种工具调用,表现出色,目前限时免费使用。
麦肯锡因AI技术迅速发展裁员超过5000人,传统咨询模式受到冲击。AI工具如Lilli提升工作效率,取代初级顾问岗位。尽管如此,资深顾问的隐性知识仍然重要,咨询行业面临转型挑战。
谷歌每月处理的Tokens达到1.3千万亿,相当于近30亿本《红楼梦》的内容。这一数据体现了谷歌AI的强大实力,Tokens消耗量已成为行业竞争的新指标,影响模型的理解能力和商业价值。
OpenAI公布了30家Tokens消耗超万亿的企业客户,包括多邻国、OpenRouter和Canva等。这些公司因高频交互和复杂任务,日均消耗Tokens达10亿,反映了AI应用的真实需求。
中国电信天翼AI构建了超过10万亿tokens的高质量数据集,存储量达350TB,支持AI模型训练。其星辰MaaS平台通过数据精炼和智能应用,提升各行业效率,推动AI技术落地,助力国家战略与市场需求。
完成下面两步后,将自动完成登录并继续当前操作。