实时互动行业周刊【第 6 期】

实时互动行业周刊【第 6 期】

💡 原文中文,约3000字,阅读约需7分钟。
📝

内容提要

微软、OpenAI、英特尔、谷歌、英伟达等科技巨头成立开源大模型安全联盟CoSAI。微软亚洲研究院提出Q-Sparse实现了LLMs激活的完全稀疏性。GPT-4o mini团队中有5位华人面孔。摄像头拉流方法越来越行不通。风噪抑制方案解析。

🎯

关键要点

  • 微软、OpenAI、英特尔、谷歌、英伟达等科技巨头成立开源大模型安全联盟CoSAI,专注于AI大模型安全部署和应用。

  • 微软亚洲研究院提出Q-Sparse,实现了LLMs激活的完全稀疏性,优化了推理效能。

  • OpenAI的GPT-4o mini团队中有5位华人面孔,团队表现出色,超越了Gemini 1.5 Flash和Claude 3 Haiku。

  • 摄像头拉流方案在许多项目中逐渐失效,需探讨原因。

  • 风噪抑制方案的解析,介绍了几种应对风噪的技术。

  • IM和RTC技术在融合通信中的应用,特别是与大模型结合的关键议题。

  • 介绍如何利用SRT协议构建手机APP的直播Demo。

  • 探讨大模型的多模态和语音流式技术,解析相关论文。

  • 提出AVS3率失真优化量化的快速算法,适用于4K@30fps性能要求。

  • 七牛云基于AV1的转码系统实践,AV1标准在码率和生态支持上具有优势。

  • 分析常见的6种音频编码的特性及应用场景。

  • 提出分层端到端人脸图像编码模型,支持高压缩比和多种视觉分析任务。

  • 详解OpenGL ES中的三维空间矩阵变换,包括旋转、平移和缩放。

  • Vulkan物理设备的定义及其在系统中的角色。

  • 苹果获得姿势感知系统专利,提升3D内容和音频用户体验。

  • LTE-M、NB-IoT、LTE Cat-1的选择指南,适应不同用例需求。

  • NVIDIA Broadcast应用提升直播和远程工作音视频质量。

  • Vodafone与RingCentral扩大战略合作,利用AI提升客户体验。

  • 探讨Web和手机互动直播的创新机会,改善体育观看体验。

➡️

继续阅读