OpenAI 和 Google 发布了新轻量模型:GPT-5.3 Instant 和 Gemini 3.1 Flash-Lite。前者提升了交互的自然度和准确性,适合高质量内容需求;后者则注重速度和成本,适合实时任务。两者各具优势,满足不同应用场景。
本研究提出了SpecReason方案,旨在解决推理时间中的高延迟问题。该方法通过轻量模型推测中间步骤,减少对重模型的依赖,实现了1.5-2.5倍的速度提升和1.0-9.9%的准确性提高。
本研究通过代理关系图方法提出了一种新的无标注监督模式,实现了选择性知识的蒸馏,提高了轻量模型在CIFAR-100和ImageNet-1K数据集上的准确率。
完成下面两步后,将自动完成登录并继续当前操作。