小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

OpenLess 是一个开源的跨平台语音输入工具,基于 Rust、Tauri、React 和 TypeScript 构建,支持 macOS、Windows 和 Linux。它旨在通过语音快速生成清晰的提示词,适合整理想法和撰写草稿。核心功能包括全局语音输入、提示词整理和多种输出模式,且关注用户隐私,支持自部署。

OpenLess — 开源跨平台语音输入与提示词生成工具

Rust.cc
Rust.cc · 2026-04-29T14:51:17Z
第6章:工具篇——使用 RunningHub(ComfyUI)生成短剧

本章介绍了使用RunningHub(ComfyUI)生成短剧的工具和流程。ComfyUI是一个开源的AI视频创作引擎,支持多种主流模型,并允许用户灵活调整每个环节,适合有一定技术基础的用户。

第6章:工具篇——使用 RunningHub(ComfyUI)生成短剧

王欣的博客
王欣的博客 · 2026-04-29T11:35:00Z

阿里巴巴于4月27日发布了视频生成模型HappyHorse 1.0,面向专业创作者和普通用户开放测试。该模型支持文本和图像生成视频,最长可生成15秒的视频,支持多种语言。720P视频生成费用为0.9元/秒,千问App内为0.44元/秒。

派早报:阿里巴巴发布视频生成模型 HappyHorse 1.0 等

少数派
少数派 · 2026-04-28T00:55:37Z
Luma 视频生成 API 对接说明

Luma 视频生成 API 允许用户通过输入提示词生成高质量视频。用户需注册获取凭证,支持自定义首尾帧和视频扩展功能,并提供异步回调以处理较长生成请求。

Luma 视频生成 API 对接说明

静觅
静觅 · 2026-04-27T20:48:14Z
第5章:工具篇——使用小云雀Agent生成短剧

本文介绍了使用小云雀Agent制作短剧的全流程,包括剧本编写、角色设计、分镜生成、视频合成及后期剪辑。小云雀作为导演助理,解决了传统AI视频工具在角色一致性、分镜逻辑和合成繁琐等方面的问题,简化了制作过程。

第5章:工具篇——使用小云雀Agent生成短剧

王欣的博客
王欣的博客 · 2026-04-27T14:00:00Z
从流行趋势研判到面料企划生成,打造纺织 AI 场景化落地样板间

大模型技术正在推动传统纺织行业的数字化转型。4月24日,上海举行了纺织AI智能体应用活动,汇聚了多家纺织企业的技术精英。活动旨在探索AI在纺织行业的应用,通过实战工作坊,参与者学习搭建AI智能体工作流,展示AI在设计、研发和市场营销中的实际应用,提升了纺织企业的生产力和创新能力。

从流行趋势研判到面料企划生成,打造纺织 AI 场景化落地样板间

百度大脑
百度大脑 · 2026-04-27T11:11:50Z

蚂蚁集团 InclusionAI 的论文《LLaDA2.0-Uni: Unifying Multimodal Understanding and Generation with Diffusion Large Language...

一分钟读论文:《用扩散语言模型统一多模态理解与生成》

Micropaper
Micropaper · 2026-04-26T00:00:00Z
【洞察微瑕】YOLO11+QWEN-VL实现墙体裂缝检测与文字报告生成

本文探讨了多模态视觉算法在建筑结构健康监测中的应用,特别是裂缝检测。提出了一种结合YOLO11和QWEN-VL的两阶段检测框架,前者用于实时裂缝检测,后者负责结果审核和报告生成。这种方法提升了检测效率和可解释性,为智能运维提供了新方案。

【洞察微瑕】YOLO11+QWEN-VL实现墙体裂缝检测与文字报告生成

gloomyfish
gloomyfish · 2026-04-25T14:03:57Z
OpenClaw v2026.4.23发布:GPT-5.5 落地,图像生成与智能体上下文全面升级

OpenClaw 2026.4.23版本接入GPT-5.5,提升了图像生成能力和智能体上下文机制。新增Codex OAuth和OpenRouter双通道,简化API管理。分支上下文机制允许子智能体继承主会话历史,避免信息丢失。超时控制和本地嵌入模型长度可调,适应不同资源环境。集成Telegram、Slack和WhatsApp优化了消息稳定性,提升用户体验。

OpenClaw v2026.4.23发布:GPT-5.5 落地,图像生成与智能体上下文全面升级

极道
极道 · 2026-04-24T21:55:00Z
第4篇:导演思维 + AI素材生成全流程 - 怎么用AI从0做出短剧/漫剧?

本文讨论了利用AI制作短剧的全流程,强调剧本质量、场景设计、角色一致性和镜头运用的重要性。剧本是制作的基础,场景数量应控制在5到10个,角色需保持一致性,镜头的景别、角度和运镜方式直接影响AI生成效果。

第4篇:导演思维 + AI素材生成全流程 - 怎么用AI从0做出短剧/漫剧?

王欣的博客
王欣的博客 · 2026-04-24T02:00:00Z

OpenAI 发布了全新的图像生成模型 Images 2.0,显著提升了图像生成的细节、逻辑和可用性。新模型减少了中文字符的乱码,提升了文本渲染质量,支持多语言和复杂指令理解,能够批量生成风格一致的图像,推动内容生产效率和行业变革。

OpenAI推出图像生成模型Images 2.0 图像细节和逻辑都有显著提升

蓝点网
蓝点网 · 2026-04-22T06:34:17Z
从手动配置到自然语言生成规则:一个 Android AI 工具的重构实录

该项目利用AI技术构建了一个Wi-Fi场景规则生成与执行系统。用户可以通过自然语言配置规则,系统将其转化为结构化的JSON格式,支持上下文管理和规则持久化。最终实现了独立的规则引擎,能够在Wi-Fi环境变化时自动执行规则并反馈结果。

从手动配置到自然语言生成规则:一个 Android AI 工具的重构实录

u3blog
u3blog · 2026-04-22T05:43:50Z
ViVa——基于视频生成模型的机器人RL价值估计:比原先基于VLM的价值函数,能更好的在动态交互环境中对当前进度和未来走势下所带来的回报做估计

本文探讨了觉-语言-动作(VLA)模型在机器人学习中的应用,提出了一种视频生成式价值模型(ViVa),通过预测未来状态来改进价值估计。ViVa结合预训练的视频生成模型、当前观测和本体感知,评估任务进展,提升机器人在复杂环境中的操作能力。研究表明,该方法在真实世界任务中表现优越,能够有效跟踪任务进度并处理新颖物体。

ViVa——基于视频生成模型的机器人RL价值估计:比原先基于VLM的价值函数,能更好的在动态交互环境中对当前进度和未来走势下所带来的回报做估计

结构之法 算法之道
结构之法 算法之道 · 2026-04-16T05:50:55Z
三体协创:码道智能生成、MaaS大模型与鸿蒙云手机的融合开发实践

本案例介绍了如何利用华为云码道智能生成技术快速构建鸿蒙原生应用。开发者可通过DevEco Studio和DevEco Testing工具实现端云协同开发,适合企业、个人开发者和高校学生,预计时长60分钟。通过华为云MaaS平台集成大语言模型,支持智能回复功能,整个过程无需手动编码。

三体协创:码道智能生成、MaaS大模型与鸿蒙云手机的融合开发实践

华为云官方博客
华为云官方博客 · 2026-04-15T12:30:00Z
在线教程丨港大团队开源个人学习助手DeepTutor,多智能体协作实现覆盖理解/推理/生成的交互式学习

香港大学数据智能实验室推出的开源学习助手DeepTutor,旨在解决学习者在知识获取和研究中的痛点。该平台结合多智能体架构与知识检索,支持自然语言交互,提供文档问答、可视化学习和习题生成等功能,帮助用户高效学习和研究。

在线教程丨港大团队开源个人学习助手DeepTutor,多智能体协作实现覆盖理解/推理/生成的交互式学习

HyperAI超神经
HyperAI超神经 · 2026-04-14T09:37:53Z
超越向量检索:构建确定性的三层图形增强生成系统

本文介绍了一种基于知识图谱和向量数据库的确定性三层检索增强生成系统。该系统通过严格的数据层次结构,优先使用绝对图形事实,解决检索冲突,减少事实幻觉。实现步骤包括构建轻量级四元组存储、集成向量数据库和使用命名实体识别进行查询,旨在提高信息检索的准确性和可预测性。

超越向量检索:构建确定性的三层图形增强生成系统

MachineLearningMastery.com
MachineLearningMastery.com · 2026-04-10T21:34:00Z
仅需 3 秒音频实现「配音自由」,Mistral 开源语音大模型 Voxtral-4B-TTS-2603;多项全能!Capybara 一站式搞定图、视频生成与指令编辑

Mistral发布了Voxtral-4B-TTS-2603模型,旨在提升多语言语音生成的自然度和效率。该模型结合了语义自回归和声学流匹配,支持低延迟本地运行,展现出良好的泛化能力。

仅需 3 秒音频实现「配音自由」,Mistral 开源语音大模型 Voxtral-4B-TTS-2603;多项全能!Capybara 一站式搞定图、视频生成与指令编辑

HyperAI超神经
HyperAI超神经 · 2026-04-08T06:29:50Z

本文介绍了两个MySQL工具:MySQL Advisor和MySQL随机数据生成器。MySQL Advisor用于性能调优,提供可操作的建议,帮助分析配置和状态输出;MySQL随机数据生成器则快速生成测试数据,适用于性能测试和查询优化。这两个工具正在积极开发中,欢迎用户反馈。

MySQL性能调优和测试数据生成工具

Planet MySQL
Planet MySQL · 2026-04-06T14:00:00Z
微软高管警告,生成性AI正在削弱初级开发者的培养管道

微软的开发者指出,过度依赖生成性AI可能阻碍初级开发者的培养,影响人才管道。企业应重视初级工程师的招聘与培训,建议通过导师制度提升他们的判断力和技能,以确保行业的可持续发展。

微软高管警告,生成性AI正在削弱初级开发者的培养管道

The New Stack
The New Stack · 2026-04-02T18:52:12Z
利用计算机视觉和生成性人工智能自动化安全监控

过去几十年,美国工作场所安全显著改善,职业伤害率下降超过60%。然而,全球每年仍有3.95亿工人遭受非致命伤害。传统监控方法在实时监控个人防护装备合规性方面存在局限性。计算机视觉和生成性AI技术能够提供持续的自动化监控,提升安全管理效率。

利用计算机视觉和生成性人工智能自动化安全监控

AWS Architecture Blog
AWS Architecture Blog · 2026-04-01T18:59:02Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码