实时互动网 ·

实时互动行业周刊【第 10 期】

💡 原文中文，约3300字，阅读约需8分钟。

📝

内容提要

这篇文章涵盖了实时互动行业的各个方面，包括人工智能、音视频技术、编解码和图像/视觉等。其中提到了知网起诉AI搜索侵权、Nature揭露论文被卖给AI、全球首个AI流媒体音乐App的发布、大模型的多语言能力、英伟达开源新大模型、音视频技术中的动画系统和音频技术在虚拟现实中的应用等。

🎯

关键要点

知网起诉AI搜索侵权，认为其未经许可搜到学术文献。
Nature揭露论文被高价卖给AI，出版商获利而作者无收入。
全球首个AI流媒体音乐App发布，音乐由AI生成。
大模型在未使用多语言平行语料库的情况下展现多语言能力。
英伟达开源新大模型，训练数据减少40倍，算力节省1.8倍。
音视频技术中常用的动画系统有Lottie和PAG，降低开发工作量。
音频技术在虚拟现实和增强现实中增强用户体验。
GB/T28181协议在公共安全领域的视频监控中越来越受欢迎。
VSFA算法用于自动识别和剔除低质UGC视频。
视频人像分割技术在视频创作中有广泛应用潜力。
RK平台H264编码参数调试中遇到马赛克问题。
ETC1压缩纹理技术用于减少移动设备的纹理存储内存占用。
Vulkan是平台无关的图形API，不能直接与特定窗口系统交互。
高通分享glTF 2.0扩展在AR/VR中的应用。
Tom Boellstorff教授探讨虚拟世界的文化内涵。
虚拟音乐活动的形式正在从听觉体验转向视听盛宴。
抖音利用火山引擎打造智能观赛新体验，提升奥运会直播效果。
流媒体的兴起改变了现场体育赛事的观众接触方式。
谷歌前CEO批评公司散漫制度，认为会输给OpenAI和创业公司。

❓

延伸问答

知网起诉AI搜索的原因是什么？

知网起诉AI搜索是因为其未经许可搜到学术文献的题目和摘要，认为这构成了严重侵权。

Nature揭露了哪些关于论文的内幕？

Nature揭露一些论文被高价卖给AI进行训练，出版商因此获利上亿，而作者却没有收入。

全球首个AI流媒体音乐App的特点是什么？

该App的音乐完全由AI生成，支持无限流式播放，用户可以持续收听。

英伟达开源的新大模型有什么优势？

英伟达的新大模型训练数据减少40倍，算力节省1.8倍，提升了训练效率。

音频技术在虚拟现实中的作用是什么？

音频技术通过增强用户的听觉体验，提升虚拟现实和增强现实中的沉浸感。

GB/T28181协议在公共安全领域的应用为何越来越受欢迎？

GB/T28181协议解决了公共安全领域大规模视频监控设备的联网需求，因此越来越受欢迎。

🏷️

标签

人工智能图像/视觉实时互动行业编解码音视频技术

➡️

继续阅读

酷哇科技亮相WAIC 2026，解密行业首个双层智能体世界模型
机器人真正需要的世界模型，并不是单一物理世界模型，而是物理世界模型与人类社会世界模型的统一
Architecting offline-first generative AI applications for edge deployments using AWS services
According to Siemens’ 2024 report The True Cost of Downtime, Fortune 500 comp...
Automate custom PII detection at scale with Amazon Macie and Step Functions
Organizations in regulated industries like financial services, insurance, hea...
AI 成本战的隐性成本与降本五层：从"成功率悖论"到"系统复杂度"（中） - 张善友
今天很多 AI 降本，表面上看是在压 token，本质上是在压复杂度
What’s New in RustRover 2026.2
RustRover 2026.2 adds endpoint discovery and route–handler navigation for axu...
10 Newsletters Keeping You Ahead in AI
Cut through AI noise with 10 curated newsletters covering daily news, technic...