小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

我们发布了Gemini 2.5 Flash和Pro文本转语音模型的重大升级,提升了表达能力、语速控制和多说话者对话的自然性,适用于有声书和电子学习等场景。开发者可在Google AI Studio中使用这些新模型。

提升Gemini文本转语音模型的控制能力和功能

The Keyword
The Keyword · 2025-12-10T17:00:00Z
手

今晚我练习了MIDI琴,感受到手指的准确度提高。通过实践,我意识到设计是为人服务的,同时反思了自己与工具的关系,思考手的控制能力与局限性。

手

子虚栈
子虚栈 · 2025-08-04T14:57:14Z

本文介绍了physical intelligence公司推出的实时动作分块技术,旨在提升视觉-语言-动作模型(VLA)的实时控制能力。该技术通过异步机制和修复方法,解决了模型推理延迟和动作不连贯的问题,使机器人能够更精确地执行复杂任务。

实时动作分块RTC——为解决高延迟,让π0.5也可以点燃火柴、插入网线:执行当前动作分块时生成下一个分块,且已执行的冻结 未执行的则补全

结构之法 算法之道
结构之法 算法之道 · 2025-07-15T08:43:07Z

网络安全研究人员发现更新版LightSpy间谍软件,能够从社交媒体提取数据,并感染Windows和苹果系统。其功能包括收集Wi-Fi信息、截图和位置信息,支持多平台操作。新指令增强了监控能力。此外,针对印度用户的恶意软件SpyLend伪装成金融应用,实施贷款诈骗。

间谍软件LightSpy升级:新增100+指令,跨平台控制能力大幅提升

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2025-02-25T13:37:00Z
嵌入空间中的交互式导航

文章讨论了在嵌入空间中进行交互式导航的概念,以提高生成模型的精确度。当前的文本提示方式灵活性不足,难以满足专业需求。理想情况下,用户应能直接调整嵌入空间中的目标,如通过旋钮控制光照强度。此外,创意工作者通常采用多层次的方法,建议训练模型生成多个层次以增强控制和迭代能力。

嵌入空间中的交互式导航

snarfed.org
snarfed.org · 2025-01-23T22:09:58Z

本文提出了Diffusion as Shader(DaS)方法,旨在解决视频生成中的精确控制问题,提升生成视频的时间一致性和控制能力,适用于多种任务。

扩散作为着色器:3D感知视频扩散用于多样化视频生成控制

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-07T00:00:00Z

本文介绍了一系列新方法,如LucidDreaming、MIG和Direct3D,旨在提高3D生成的控制能力和质量。这些技术解决了几何不一致性和属性泄漏问题,提升了生成结果的视觉质量和一致性,为用户提供了更大的创作自由度,推动了3D内容创作的进步。

3DIS:基于深度驱动的解耦实例合成用于文本到图像生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z
iOS 18(和AI)将赋予Siri更多应用控制能力

苹果计划为Siri进行大规模的AI更新,以实现语音控制特定的iPhone应用程序功能。改进后的Siri将作为iOS 18的更新于明年推出,支持数百个命令。苹果还计划允许Siri在一个请求中处理多个任务。目前尚不清楚该技术的工作方式。

iOS 18(和AI)将赋予Siri更多应用控制能力

The Verge
The Verge · 2024-05-30T21:11:51Z

本文提出了一种基于条件扩散模型的统一框架,用于图像到图像的转换。通过四个具有挑战性的任务的测试,证明了该框架在上色、修复、裁剪和JPEG恢复方面的优越性。研究还揭示了L2和L1损失对扩散目标的影响,以及自我关注在神经结构中的重要性。提出了一个基于ImageNet的统一评估协议,用于推进图像到图像翻译研究。展示了通用的多任务扩散模型的执行效果与任务特定的专家模型相当或更好。

在野外应用具有控制能力的视觉语言模型进行照片逼真图像修复

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-15T00:00:00Z

本文介绍了将去噪扩散模型应用于图像融合领域的方法,通过设计两种不同的条件注入模块来生成融合图像。实验结果表明该方法具有最先进的结果和良好的泛化性能,可激发其他工作的灵感并深入了解该领域。

MatFuse: 控制能力的扩散模型材料生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-22T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码