微软与腾讯技术交锋,TRELLIS引领3D生成领域多格式支持新方向
💡
原文中文,约5500字,阅读约需14分钟。
📝
内容提要
腾讯推出的Hunyuan3D生成模型是首个支持文字和图像生成3D的开源大模型,微软随后发布TRELLIS框架,增强了3D资产生成的竞争。两个模型均已上线hyper.ai,用户可在线体验。
🎯
关键要点
- 腾讯推出Hunyuan3D生成模型,是首个支持文字和图像生成3D的开源大模型。
- 微软发布TRELLIS框架,增强了3D资产生成的竞争。
- 两个模型均已上线hyper.ai,用户可在线体验。
- hyper.ai官网更新了优质公共数据集、教程和社区文章。
- VSI-Bench数据集包含超过5k个问题-答案对,覆盖290个真实室内场景。
- Facial Feature Extraction Dataset用于检测脸部特征,包含750张图像。
- Sentiment and Emotion Analysis Dataset包含422,000个情绪分析句子。
- Eurus-2-RL-Data数据集用于强化学习训练,包含455k个数学问题。
- Medical o1 Reasoning SFT数据集旨在提升医学推理任务的表现。
- MCTS中文文本简化数据集是中文文本简化任务上规模最大的数据集。
- educhat-sft-002-data-osm数据集包含400万个教育领域对话数据点。
- GOAT算数任务微调数据集包含约170万个用于算术任务的合成数据。
- NaturalProofs数学推理数据集用于研究自然语言中的数学推理。
- TransGPT-pt&sft数据集为交通领域的对话数据集,包含34.6万条文本数据。
- Hunyuan3D和TRELLIS提供在线生成3D资产的教程和示例。
- ChatGLM-6B是一个支持中英双语的对话语言模型,用户可本地部署。
- NLTK是用于自然语言处理的流行平台,提供多种文本处理功能。
- Audio LDM是一种文本到音频的生成模型,能够生成真实音频样本。
- ShowUI模型支持网页和手机应用的用户界面自动化。
- HyperAI超神经提供丰富的公共资源和学习材料,致力于数据科学领域的发展。
❓
延伸问答
Hunyuan3D生成模型的主要特点是什么?
Hunyuan3D是首个支持文字和图像生成3D的开源大模型,具备高质量的3D资产生成能力。
TRELLIS框架的优势是什么?
TRELLIS框架支持多格式输出,包括辐射场、3D高斯和网格,提供了灵活的3D资产生成解决方案。
如何在线体验Hunyuan3D和TRELLIS模型?
用户可以通过hyper.ai官网在线体验Hunyuan3D和TRELLIS模型,分别访问https://go.hyper.ai/Rsrno和https://go.hyper.ai/JE5s5。
hyper.ai官网提供哪些公共数据集?
hyper.ai官网提供多个公共数据集,包括VSI-Bench、情感情绪分析数据集、医学推理数据集等,涵盖多种应用场景。
TRELLIS框架的开发背景是什么?
TRELLIS框架是微软团队于2024年开发的,旨在通过学习图结构数据的特征,提升3D资产生成的可解释性。
Hunyuan3D和TRELLIS的应用场景有哪些?
Hunyuan3D和TRELLIS可用于游戏开发、虚拟现实、建筑设计等领域,帮助用户生成高质量的3D资产。
➡️