微软与腾讯技术交锋,TRELLIS引领3D生成领域多格式支持新方向;超5k问题对!VIS-Bench让AI学会「空间记忆」...
💡
原文中文,约5900字,阅读约需14分钟。
📝
内容提要
去年11月,腾讯推出Hunyuan3D生成模型,成为首个支持文字和图像生成3D的开源大模型。微软随后发布TRELLIS框架,增强3D资产生成的竞争。两者均已上线hyper.ai,用户可在线体验。
🎯
关键要点
- 腾讯推出Hunyuan3D生成模型,支持文字和图像生成3D,是首个开源大模型。
- 微软发布TRELLIS框架,增强3D资产生成的竞争,支持多格式输出。
- Hunyuan3D和TRELLIS均已上线hyper.ai,用户可在线体验。
- hyper.ai官网更新了10个优质公共数据集、6个优质教程、8篇社区文章和5条热门百科词条。
- VSI-Bench数据集包含超过5k个问题-答案对,覆盖290个真实室内场景。
- Facial Feature Extraction Dataset用于检测脸部特征,包含750张图像。
- Sentiment and Emotion Analysis Dataset包含422,000个情绪分析句子。
- Eurus-2-RL-Data数据集专用于强化学习训练,包含455k个数学问题和27k个编程问题。
- Medical o1 Reasoning SFT数据集旨在提升医学大语言模型的推理能力。
- MCTS中文文本简化数据集是中文文本简化任务上规模最大的数据集。
- educhat-sft-002-data-osm数据集包含400万个教育领域对话数据点。
- GOAT算数任务微调数据集包含170万个合成数据,用于算术任务。
- NaturalProofs数学推理数据集用于研究自然语言中的数学推理。
- TransGPT-pt&sft交通对话预训练数据集包含34.6万条交通领域文本数据。
- Hunyuan3D和TRELLIS提供在线生成3D资产的教程和Demo。
- ChatGLM-6B是一个支持中英双语的对话语言模型,用户可在消费级显卡上运行。
- NLTK是流行的自然语言处理平台,提供多种文本处理功能。
- Audio LDM能够生成真实的音频样本,支持文本到音频的转换。
- ShowUI模型支持自动化用户界面任务,能够解析屏幕截图和用户指令。
- HyperAI超神经提供丰富的公共资源,致力于成为国内数据科学领域的基础设施。
➡️