DeepSeek发布了新模型DeepSeek-OCR,采用光学压缩技术,将文本转为图像,压缩率可达10倍,准确率超过97%。该模型通过DeepEncoder提取特征,支持多分辨率输入,具备深度解析能力,适用于STEM领域。团队还探索AI的“遗忘”机制,以提高超长上下文处理效率。
该研究提出了一种解码算法,用于生成开放性文本。该算法采用遗忘机制和长度惩罚,以解决过度惩罚导致的过短句子问题。实验结果表明,该方法有效地提高了生成高质量句子的能力。
完成下面两步后,将自动完成登录并继续当前操作。