微软与腾讯技术交锋,TRELLIS引领3D生成领域多格式支持新方向

💡 原文中文,约5500字,阅读约需14分钟。
📝

内容提要

腾讯推出的Hunyuan3D生成模型是首个支持文字和图像生成3D的开源大模型,微软随后发布TRELLIS框架,增强了3D资产生成的竞争。两个模型均已上线hyper.ai,用户可在线体验。

🎯

关键要点

  • 腾讯推出Hunyuan3D生成模型,是首个支持文字和图像生成3D的开源大模型。
  • 微软发布TRELLIS框架,增强了3D资产生成的竞争。
  • 两个模型均已上线hyper.ai,用户可在线体验。
  • hyper.ai官网更新了优质公共数据集、教程和社区文章。
  • VSI-Bench数据集包含超过5k个问题-答案对,覆盖290个真实室内场景。
  • Facial Feature Extraction Dataset用于检测脸部特征,包含750张图像。
  • Sentiment and Emotion Analysis Dataset包含422,000个情绪分析句子。
  • Eurus-2-RL-Data数据集用于强化学习训练,包含455k个数学问题。
  • Medical o1 Reasoning SFT数据集旨在提升医学推理任务的表现。
  • MCTS中文文本简化数据集是中文文本简化任务上规模最大的数据集。
  • educhat-sft-002-data-osm数据集包含400万个教育领域对话数据点。
  • GOAT算数任务微调数据集包含约170万个用于算术任务的合成数据。
  • NaturalProofs数学推理数据集用于研究自然语言中的数学推理。
  • TransGPT-pt&sft数据集为交通领域的对话数据集,包含34.6万条文本数据。
  • Hunyuan3D和TRELLIS提供在线生成3D资产的教程和示例。
  • ChatGLM-6B是一个支持中英双语的对话语言模型,用户可本地部署。
  • NLTK是用于自然语言处理的流行平台,提供多种文本处理功能。
  • Audio LDM是一种文本到音频的生成模型,能够生成真实音频样本。
  • ShowUI模型支持网页和手机应用的用户界面自动化。
  • HyperAI超神经提供丰富的公共资源和学习材料,致力于数据科学领域的发展。

延伸问答

Hunyuan3D生成模型的主要特点是什么?

Hunyuan3D是首个支持文字和图像生成3D的开源大模型,具备高质量的3D资产生成能力。

TRELLIS框架的优势是什么?

TRELLIS框架支持多格式输出,包括辐射场、3D高斯和网格,提供了灵活的3D资产生成解决方案。

如何在线体验Hunyuan3D和TRELLIS模型?

用户可以通过hyper.ai官网在线体验Hunyuan3D和TRELLIS模型,分别访问https://go.hyper.ai/Rsrno和https://go.hyper.ai/JE5s5。

hyper.ai官网提供哪些公共数据集?

hyper.ai官网提供多个公共数据集,包括VSI-Bench、情感情绪分析数据集、医学推理数据集等,涵盖多种应用场景。

TRELLIS框架的开发背景是什么?

TRELLIS框架是微软团队于2024年开发的,旨在通过学习图结构数据的特征,提升3D资产生成的可解释性。

Hunyuan3D和TRELLIS的应用场景有哪些?

Hunyuan3D和TRELLIS可用于游戏开发、虚拟现实、建筑设计等领域,帮助用户生成高质量的3D资产。

➡️

继续阅读