ERNIE-Image通过AI技术为传统非遗工艺提供新的数字表达方式,能够精准还原蛋雕、烙画等细腻工艺,激发创作灵感。非遗传承人称赞其在效果呈现和设计稿还原度上的高效性,助力传统艺术现代化。
ERNIE-Image是一个开源的文生图模型,基于8B参数的DiT架构,适用于多种视觉风格,特别适合海报和漫画内容的生产。它提供标准和极速两种模型,支持新手用户通过ComfyUI进行部署和使用,用户可轻松生成高质量图像。
百度发布了ERNIE-Image和ERNIE-Image-Turbo开源模型,前者为完整版本,后者为高效蒸馏版,推理速度更快。用户可在星河社区免费体验,适用于海报制作等实际场景,模型使用简单,适合开发者快速上手。
ERNIE-Image是百度文心团队开发的开源文生图模型,基于8B参数的Diffusion Transformer架构,支持多种视觉风格,适合海报和漫画等内容生产。该模型在Hugging Face上开源,支持多语言生成,降低了创作门槛,鼓励用户参与创作。
Eigent是首个基于CAMEL-AI构建的多智能体工作流桌面应用,集成了百度文心大模型ERNIE 5.0,旨在提升工作效率。它支持多智能体并行执行、自定义智能体和本地部署,确保数据隐私。通过自动化生成调研报告,用户能够快速完成信息收集与文档交付,显著提高生产力。
厦门智融合科技凭借其「首创君专利文本智能体」获得2025年星河产业应用创新奖法律服务赛道TOP1。该智能体结合文心大模型与飞桨技术,推动知识产权法律服务智能化,提升专利撰写效率,降低国际侵权风险,为中国企业全球化发展提供法律支持。
厦门智融合科技凭借其首创的君专利文本智能体,获得2025年星河产业应用创新奖法律服务赛道TOP1。该技术结合文心大模型与飞桨,推动知识产权法律服务的智能化,解决语言转化、法律尺度和合规风险等问题,提高专利文本解析和可专利性分析的效率,帮助企业降低侵权风险,促进全球创新发展。
ERNIE 是基于 PaddlePaddle 的多模态预训练模型,支持文本、图像和视频输入,具备高效的训练和推理能力。bknd 提供全功能后端,适用于多种环境。Kotatsu 是安卓漫画阅读器,支持多来源和离线下载。cupp 生成个性化密码字典,iflow-cli 是智能命令行助手,自动化编程任务。
凯通科技通过自研模型和PaddleOCR-VL,构建了智能解析架构,解决了CAD图纸解析中的多模态信息融合、逻辑单元分割和领域知识闭环等挑战。该系统提升了图纸解析效率和准确率,降低了非专业人员使用图纸的门槛,推动了业务创新与协同效率。
文心大模型与LLaMA-Factory合作,支持ERNIE-4.5模型的微调。用户可通过简化流程和4-bit量化训练快速完成微调。案例展示了宝可梦角色识别任务,训练效果显著提升,模型适应性增强。
PaddleFormers将简化多模态模型的训练与应用,帮助开发者提升业务能力,推动其在更多场景中的应用。
2025年9月,百度文心开源创新大赛Dev Day在加州、费城和悉尼举行,吸引近300名开发者参与。活动包括技术分享和实战Workshop,聚焦文心4.5系列开源模型,展示全球开发者的创意与技术潜力。初赛已收集近170份作品,进入决赛阶段。活动将于11月30日在东京继续进行。
百度于11月11日开源ERNIE-4.5-VL-28B-A3B-Thinking模型,具备3B激活参数,性能媲美顶级大模型。该模型在视觉语言理解、文档解析和跨模态推理方面表现优异,支持“图像思考”等创新功能,已在多个平台发布,适合商业使用。
百度的ERNIE-4.5-21B-A3B-Thinking模型在HuggingFace模型趋势榜上排名第一,具备21B参数和3B激活的轻量设计,支持复杂推理任务,表现接近顶级模型。
百度文心4.5系列模型开源,ERNIE-4.5-VL视觉语言模型具备强大的图文视频理解能力,支持100多种语言,适用于文档处理、视频管理和文化传承等场景,提升生活与工作效率。
文心ERNIE-4.5-VL视觉语言模型实现了多模态交互,具备强大的图文和视频理解能力,支持100多种语言。其轻量级版本在多个基准测试中表现优异,适应多种场景,能够快速响应基础任务并深度解决复杂问题。
百度发布ERNIE 4.5-21B-A3B-Base,这是一个强大的开源大语言模型,具备多模态能力,支持文本、图像、音频和视频处理,翻译任务表现优异,用户可通过DigitalOcean一键部署,简化AI应用开发。
本期播客讨论了AI领域的最新动态,包括Cloudflare推出的AI数据抓取器阻止功能、Meta的超级智能实验室招聘、Anthropic面临的人才流失及其新经济项目,以及百度和腾讯发布的开源AI模型的性能和应用潜力。
2020年,中国团结应对挑战,百度AI积极贡献科技力量,助力抗疫、复工复产,推动创新与高质量发展,深入生活各方面。
文章讨论了对单一排行榜的过度依赖可能导致系统游戏和过拟合,而非真正的技术进步。OpenAI因其聊天机器人的过于迎合性格回滚了GPT-4o更新。阿里巴巴推出Qwen3 AI模型,百度发布ERNIE X1 Turbo和4.5 Turbo,并提到多家公司在AI领域的进展和新工具。
完成下面两步后,将自动完成登录并继续当前操作。