高文院士指出,中国AVS标准实现了历史性跨越,下一代AVS4将结合传统与AI技术,提升编码性能,进一步降低码率,推动超高清视频产业发展,助力中国科技自立自强。
GPT-5.1在API平台发布,提升了智能与速度,动态调整思考时间,简化任务时更快省token。新模式“无推理”适合低延迟需求,新增的apply_patch和shell工具增强了代码编辑与命令执行能力,编码性能表现优异,开发者反馈积极。
Anthropic推出了Claude Opus 4和Claude Sonnet 4两个新AI模型。Claude Opus 4在编码性能上超越Gemini 2.5 Pro和OpenAI o3,得分达到72.5%。该模型能够自主工作七小时,具有200K的上下文窗口,适合编程任务,尤其在复杂项目中表现出色。
谷歌DeepMind推出了Gemini Diffusion模型,这是一个先进的文本扩散模型,能够快速将随机噪声转化为连贯的文本或代码,并保持良好的编码性能。团队将继续优化该模型以降低延迟。
谷歌推出Gemini 2.0 Flash-Lite模型,专为大规模文本输出优化,性能优于1.5 Flash,但不支持图像和音频输出。Gemini 2.0 Pro是最佳编码性能模型,尽管基准测试提升有限,但实际应用表现更佳,且在文本理解和代码生成方面优于GPT-4。
谷歌发布了最新的AI模型Gemini 2.0 Pro,具备卓越的编码性能和处理复杂提示的能力,支持2百万个token的上下文窗口,并能调用谷歌搜索等工具。用户可通过生成API密钥,使用Msty应用程序本地访问该模型。
12月,我们发布了Gemini 2.0 Flash的实验版本,提升了开发者的低延迟和性能。现已向所有用户开放的2.0 Flash,此外还推出了专注于编码性能的2.0 Pro实验版和成本效益高的2.0 Flash-Lite。所有模型支持多模态输入,未来将有更多更新。
开源音频压缩格式WavPack发布5.8版本,新增多线程支持,提升了编码和解码性能,解决了低比特率和高采样率下的量化噪声问题,并优化了DNS算法。
Cinegy 发布新版 Cinecoder SDK,解决 H.264 隔行编码问题,支持最新 NVIDIA GPU,提升编码性能与效率,满足广播行业高清流需求。
Amazon Bedrock推出Claude 3.5模型系列的新功能,包括升级版Claude 3.5 Sonnet,增强了软件工程能力,支持计算机操作,提升编码性能。这些新功能可用于自动化软件测试和创建高级聊天机器人,预计将推动AI应用的发展。
AV1是新一代视频编码格式,具有更高的压缩效率和编码性能。本文提出了一种基于JND的感知RDO方案,考虑了人类视觉系统的特性,提高了视频的主观感知质量。实验证明,该方案在相同质量下平均节省了3.93%的比特率。
完成下面两步后,将自动完成登录并继续当前操作。