实时互动行业周刊【第 10 期】

实时互动行业周刊【第 10 期】

💡 原文中文,约3300字,阅读约需8分钟。
📝

内容提要

这篇文章涵盖了实时互动行业的各个方面,包括人工智能、音视频技术、编解码和图像/视觉等。其中提到了知网起诉AI搜索侵权、Nature揭露论文被卖给AI、全球首个AI流媒体音乐App的发布、大模型的多语言能力、英伟达开源新大模型、音视频技术中的动画系统和音频技术在虚拟现实中的应用等。

🎯

关键要点

  • 知网起诉AI搜索侵权,认为其未经许可搜到学术文献。
  • Nature揭露论文被高价卖给AI,出版商获利而作者无收入。
  • 全球首个AI流媒体音乐App发布,音乐由AI生成。
  • 大模型在未使用多语言平行语料库的情况下展现多语言能力。
  • 英伟达开源新大模型,训练数据减少40倍,算力节省1.8倍。
  • 音视频技术中常用的动画系统有Lottie和PAG,降低开发工作量。
  • 音频技术在虚拟现实和增强现实中增强用户体验。
  • GB/T28181协议在公共安全领域的视频监控中越来越受欢迎。
  • VSFA算法用于自动识别和剔除低质UGC视频。
  • 视频人像分割技术在视频创作中有广泛应用潜力。
  • RK平台H264编码参数调试中遇到马赛克问题。
  • ETC1压缩纹理技术用于减少移动设备的纹理存储内存占用。
  • Vulkan是平台无关的图形API,不能直接与特定窗口系统交互。
  • 高通分享glTF 2.0扩展在AR/VR中的应用。
  • Tom Boellstorff教授探讨虚拟世界的文化内涵。
  • 虚拟音乐活动的形式正在从听觉体验转向视听盛宴。
  • 抖音利用火山引擎打造智能观赛新体验,提升奥运会直播效果。
  • 流媒体的兴起改变了现场体育赛事的观众接触方式。
  • 谷歌前CEO批评公司散漫制度,认为会输给OpenAI和创业公司。
➡️

继续阅读