本文介绍了一款基于ERNIE-Image的儿童绘本生成器,旨在解决家长故事库存不足的问题。该工具通过输入故事文本,自动生成插画,支持中文渲染和多种样式选择,提升亲子互动,帮助孩子理解抽象概念,使用简单,几分钟即可完成个性化绘本制作。
在《西游记》的灵感下,AI文生图模型ERNIE-Image与艺术家方佳翮合作,重构中国神话视觉作品。方佳翮将传统元素与现代电影艺术相结合,创造出神秘而史诗感的视觉效果。AI成为其创作的重要伙伴,推动传统神话的数字化与共享,同时鼓励用户参与生成自己的神话作品,展示想象力。
LeMiCa加速框架显著提升ERNIE-Image文生图模型的生成速度,达到2倍以上,同时保持画质几乎无损。该框架通过全局路径优化,避免了传统加速方法的误差放大问题,用户只需简单代码即可实现加速,提升创作效率。
本文介绍了如何在AMD GPU上运行ERNIE-Image。通过ROCm和Hugging Face Diffusers,用户可以在Docker环境中部署,步骤包括拉取Docker镜像、安装依赖、准备模型权重和运行推理。ROCm兼容CUDA接口,简化了模型部署过程,使开发者在非CUDA环境中也能使用主流框架进行图像生成。
本文介绍了如何在没有CUDA环境的情况下,通过ComfyUI和OpenVINO在Intel平台上本地运行ERNIE-Image模型。该项目简化了安装和使用流程,用户只需按照步骤准备模型、启动ComfyUI并添加节点,即可快速生成图像,适合希望快速验证工作流的开发者。
ERNIE-Image通过AI技术为传统非遗工艺提供新的数字表达方式,能够精准还原蛋雕、烙画等细腻工艺,激发创作灵感。非遗传承人称赞其在效果呈现和设计稿还原度上的高效性,助力传统艺术现代化。
ERNIE-Image是一个开源的文生图模型,基于8B参数的DiT架构,适用于多种视觉风格,特别适合海报和漫画内容的生产。它提供标准和极速两种模型,支持新手用户通过ComfyUI进行部署和使用,用户可轻松生成高质量图像。
百度发布了ERNIE-Image和ERNIE-Image-Turbo开源模型,前者为完整版本,后者为高效蒸馏版,推理速度更快。用户可在星河社区免费体验,适用于海报制作等实际场景,模型使用简单,适合开发者快速上手。
ERNIE-Image是百度文心团队开发的开源文生图模型,基于8B参数的Diffusion Transformer架构,支持多种视觉风格,适合海报和漫画等内容生产。该模型在Hugging Face上开源,支持多语言生成,降低了创作门槛,鼓励用户参与创作。
Eigent是首个基于CAMEL-AI构建的多智能体工作流桌面应用,集成了百度文心大模型ERNIE 5.0,旨在提升工作效率。它支持多智能体并行执行、自定义智能体和本地部署,确保数据隐私。通过自动化生成调研报告,用户能够快速完成信息收集与文档交付,显著提高生产力。
厦门智融合科技凭借其「首创君专利文本智能体」获得2025年星河产业应用创新奖法律服务赛道TOP1。该智能体结合文心大模型与飞桨技术,推动知识产权法律服务智能化,提升专利撰写效率,降低国际侵权风险,为中国企业全球化发展提供法律支持。
厦门智融合科技凭借其首创的君专利文本智能体,获得2025年星河产业应用创新奖法律服务赛道TOP1。该技术结合文心大模型与飞桨,推动知识产权法律服务的智能化,解决语言转化、法律尺度和合规风险等问题,提高专利文本解析和可专利性分析的效率,帮助企业降低侵权风险,促进全球创新发展。
ERNIE 是基于 PaddlePaddle 的多模态预训练模型,支持文本、图像和视频输入,具备高效的训练和推理能力。bknd 提供全功能后端,适用于多种环境。Kotatsu 是安卓漫画阅读器,支持多来源和离线下载。cupp 生成个性化密码字典,iflow-cli 是智能命令行助手,自动化编程任务。
凯通科技通过自研模型和PaddleOCR-VL,构建了智能解析架构,解决了CAD图纸解析中的多模态信息融合、逻辑单元分割和领域知识闭环等挑战。该系统提升了图纸解析效率和准确率,降低了非专业人员使用图纸的门槛,推动了业务创新与协同效率。
文心大模型与LLaMA-Factory合作,支持ERNIE-4.5模型的微调。用户可通过简化流程和4-bit量化训练快速完成微调。案例展示了宝可梦角色识别任务,训练效果显著提升,模型适应性增强。
PaddleFormers将简化多模态模型的训练与应用,帮助开发者提升业务能力,推动其在更多场景中的应用。
2025年9月,百度文心开源创新大赛Dev Day在加州、费城和悉尼举行,吸引近300名开发者参与。活动包括技术分享和实战Workshop,聚焦文心4.5系列开源模型,展示全球开发者的创意与技术潜力。初赛已收集近170份作品,进入决赛阶段。活动将于11月30日在东京继续进行。
百度于11月11日开源ERNIE-4.5-VL-28B-A3B-Thinking模型,具备3B激活参数,性能媲美顶级大模型。该模型在视觉语言理解、文档解析和跨模态推理方面表现优异,支持“图像思考”等创新功能,已在多个平台发布,适合商业使用。
百度的ERNIE-4.5-21B-A3B-Thinking模型在HuggingFace模型趋势榜上排名第一,具备21B参数和3B激活的轻量设计,支持复杂推理任务,表现接近顶级模型。
百度文心4.5系列模型开源,ERNIE-4.5-VL视觉语言模型具备强大的图文视频理解能力,支持100多种语言,适用于文档处理、视频管理和文化传承等场景,提升生活与工作效率。
完成下面两步后,将自动完成登录并继续当前操作。