💡
原文中文,约3300字,阅读约需8分钟。
📝
内容提要
这篇文章涵盖了实时互动行业的各个方面,包括人工智能、音视频技术、编解码和图像/视觉等。其中提到了知网起诉AI搜索侵权、Nature揭露论文被卖给AI、全球首个AI流媒体音乐App的发布、大模型的多语言能力、英伟达开源新大模型、音视频技术中的动画系统和音频技术在虚拟现实中的应用等。
🎯
关键要点
- 知网起诉AI搜索侵权,认为其未经许可搜到学术文献。
- Nature揭露论文被高价卖给AI,出版商获利而作者无收入。
- 全球首个AI流媒体音乐App发布,音乐由AI生成。
- 大模型在未使用多语言平行语料库的情况下展现多语言能力。
- 英伟达开源新大模型,训练数据减少40倍,算力节省1.8倍。
- 音视频技术中常用的动画系统有Lottie和PAG,降低开发工作量。
- 音频技术在虚拟现实和增强现实中增强用户体验。
- GB/T28181协议在公共安全领域的视频监控中越来越受欢迎。
- VSFA算法用于自动识别和剔除低质UGC视频。
- 视频人像分割技术在视频创作中有广泛应用潜力。
- RK平台H264编码参数调试中遇到马赛克问题。
- ETC1压缩纹理技术用于减少移动设备的纹理存储内存占用。
- Vulkan是平台无关的图形API,不能直接与特定窗口系统交互。
- 高通分享glTF 2.0扩展在AR/VR中的应用。
- Tom Boellstorff教授探讨虚拟世界的文化内涵。
- 虚拟音乐活动的形式正在从听觉体验转向视听盛宴。
- 抖音利用火山引擎打造智能观赛新体验,提升奥运会直播效果。
- 流媒体的兴起改变了现场体育赛事的观众接触方式。
- 谷歌前CEO批评公司散漫制度,认为会输给OpenAI和创业公司。
➡️