OpenAI展示了一种新的多模态AI模型,可以与用户交谈并识别物体。该模型比现有的分离转录和文本到语音模型更快、更准确地解释图像和音频。它可以帮助客服代理商更好地理解呼叫者的语调或是否在讽刺,并且理论上可以帮助学生解决数学问题或翻译现实世界的标志。该模型可能在回答某些问题方面超过GPT-4 Turbo,但仍有可能自信地出错。OpenAI可能还准备了一个新的内置ChatGPT功能,可以打电话。CEO Sam Altman明确否认即将发布的公告与比GPT-4更好的模型无关。GPT-5可能会在今年年底公开发布。
雷朋的Meta智能眼镜现在具备多模态人工智能功能,可以识别物体、读取不同语言的标志并提供地标信息。然而,人工智能并不总是准确的,可能需要一些行为调整才能有效工作。这款眼镜在外出时最有用,因为它可以快速回答问题,无需拿出手机。虽然人工智能功能并非必需,但这款眼镜仍然可以作为直播眼镜、POV相机和开放式耳机正常使用。
完成下面两步后,将自动完成登录并继续当前操作。