DeepSeek V4发布,获得好评。主要创新包括百万token上下文开源、KV cache大幅缩减、mHC强化残差连接和hybrid attention架构,提升长文处理效率。训练数据量翻倍,模型参数显著增加,表现超越多款闭源模型。未来将继续探索新技术,推动开源进程。
完成下面两步后,将自动完成登录并继续当前操作。