即构科技发布了实时互动AI Agent 2.7和云端实时语音识别v2.0,新增支持文本输出的语音智能体、透传自定义业务信息及优化语音打断机制,云端语音识别支持多语言和无限用户数量。
谷歌推出Gemini 2.0 Flash-Lite模型,专为大规模文本输出优化,性能优于1.5 Flash,但不支持图像和音频输出。Gemini 2.0 Pro是最佳编码性能模型,尽管基准测试提升有限,但实际应用表现更佳,且在文本理解和代码生成方面优于GPT-4。
OpenAI发布了一个API,提供通用的文本输入和输出接口,用户可用于各种英语任务。现已开放申请,以便将API集成到产品或开发新应用。
完成下面两步后,将自动完成登录并继续当前操作。