标签

 模型 

相关的文章:

phodal -

生成式 AI 应用落地小结:高估的模型能力,低估的工程实施

虽然 ChatGPT 已经诞生了一周年,但是大量的人依旧对于生成式 AI 没有足够的认识。在研发领域,Thoughtworks 一直在与不同的大型企业合作,保持开放性的探索。

AI生成摘要 Thoughtworks has been collaborating with large enterprises to explore and build open-source projects in the field of generative AI. They have developed Unit Mesh as part of their open-source AI development system. Unlike other areas where generative AI is applied, many companies have transitioned from a workshop development approach to a standardized one. Thoughtworks believes that the experience in IDEs can be applied to other software development scenarios. They have explored different models and techniques to enhance coding and writing experiences, such as strong contextual generation, custom AI actions, and integration with existing frameworks. They emphasize the need for multiple models to assist with different subtasks and the continuous fine-tuning of models based on user feedback. Overall, generative AI can enhance productivity but should be seen as a comprehensive assistant rather than a one-stop solution.

相关推荐 去reddit讨论

爱范儿 -

Sam Altman 最新专访:曝光回归内幕,首度回应 Q* 模型

一年前的今天,OpenAI 发布了 ChatGPT#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。 爱范儿 | 原文链接 · 查看评论 · 新浪微博

AI生成摘要 OpenAI宣布首席执行官Sam Altman回归,并加入微软作为非投票观察员。Altman在接受采访时拒绝回答为何被解雇的问题。他表示回来的动力是对公司使命的热爱。Altman还表示员工支持对公司的影响很大,公司对安全工作的方法不会改变。关于Q*模型突破的报道,Altman表示进展将继续迅速,但安全和有益性仍然是重要关注点。Altman学到了公司可以在没有他的情况下正常运转。

相关推荐 去reddit讨论

BriefGPT - AI 论文速递 -

ART・V: 基于扩散模型的自回归文本到视频生成

ART・V 是一个高效的自回归视频生成框架,使用扩散模型逐帧生成视频,并通过简化连续帧之间的运动来避免建模复杂的远程运动,同时保留预训练图像扩散模型的高保真生成能力。通过结合文本、图像等多种提示,ART・V 可以生成任意长度的视频,具有高度的多功能性和灵活性。通过引入掩蔽扩散模型和使用初始帧作为条件,ART・V 进一步提升了生成一致性和生成的视觉质量,能够在短时间内生成带有自然运动、丰富细节和高美感的视频,并支持多个文本提示组合成长视频的应用。

AI生成摘要 ART・V是一个高效的自回归视频生成框架,使用扩散模型逐帧生成视频,并通过简化连续帧之间的运动来避免建模复杂的远程运动,同时保留预训练图像扩散模型的高保真生成能力。通过结合文本、图像等多种提示,ART・V可以生成任意长度的视频,具有高度的多功能性和灵活性。通过引入掩蔽扩散模型和使用初始帧作为条件,ART・V进一步提升了生成一致性和生成的视觉质量,能够在短时间内生成带有自然运动、丰富细节和高美感的视频,并支持多个文本提示组合成长视频的应用。

相关推荐 去reddit讨论

BriefGPT - AI 论文速递 -

CritiqueLLM: 扩展 LLM-as-Critic 以有效且可解释地评估大型语言模型生成

自然语言处理社区开始让大规模语言模型(如 GPT-4)扮演批评家以评估生成文本质量,大部分仅在特定数据集上训练特定规模的批判生成模型,我们认为缺乏对于基于语言模型评估模型的关键因素(如可扩展性特性)的全面调查,因此目前是否有潜力在实际场景中取代 GPT-4 的评估仍然没有结论;在本文中,我们提出了一种名为 CritiqueLLM 的新型批判生成模型,采用基于对话的提示方法用于高质量的参考 / 无参考评估数据,实验结果表明,我们的模型在评估性能上可以与 GPT-4 相媲美,尤其在系统级相关性上,甚至在具有挑战性的无参考环境中,在 8 个任务中有 3 个胜过 GPT-4;我们进行详细分析以展示我们模型在生成批评质量方面的可扩展性特性,同时证明我们生成的批评可以作为可扩展反馈,直接提高 LLM 的生成质量。

AI生成摘要 自然语言处理社区开始使用大规模语言模型评估生成文本质量。本文提出了一种名为CritiqueLLM的新型批判生成模型,可以与GPT-4相媲美。实验结果表明,在8个任务中有3个胜过GPT-4。该模型具有可扩展性特性,生成的批评可以作为反馈,提高语言模型的生成质量。

相关推荐 去reddit讨论

BriefGPT - AI 论文速递 -

DiffCAD: 基于弱监督的概率 CAD 模型检索和对齐

基于 CAD 模型基元从 RGB 图像中感知 3D 结构可以有效地实现基于三维物体的场景表示,本文提出了 DiffCAD,这是一种第一个弱监督的条件生成方法,可以从 RGB 图像中检索和对齐 CAD 模型,通过扩散学习隐式概率模型来捕捉 CAD 对象在图像中的形状、姿态和尺度,实现了多个假设生成和对深度 / 尺度和形状匹配的歧义进行建模。

AI生成摘要 本文提出了一种名为DiffCAD的方法,可以从RGB图像中检索和对齐CAD模型,实现基于三维物体的场景表示。DiffCAD利用扩散学习隐式概率模型来捕捉CAD对象在图像中的形状、姿态和尺度,并对深度/尺度和形状匹配的歧义进行建模。这是一种弱监督的条件生成方法。

相关推荐 去reddit讨论

BriefGPT - AI 论文速递 -

零样本引导图像合成的分层渲染扩散模型

本文介绍了增强依赖于文本查询的扩散模型的空间可控性的创新解决方案,提出了两个关键创新:视觉引导和分层渲染扩散(LRDiff)框架。该方法通过视觉引导和分层渲染策略实现更高效和准确的图像综合,用于满足特定的空间和上下文需求,并通过实验证明其在定量和定性上优于现有技术。

AI生成摘要 通过Steered Diffusion框架,利用扩散模型的生成控制能力,实现了逼真零样本条件图像生成。与其他模型相比,在修补、着色、语义编辑和图像超分辨率方面有明显改进,计算成本也较低。

相关推荐 去reddit讨论

BriefGPT - AI 论文速递 -

基于大型视觉 - 语言模型的语义感知框架 - 事件融合式模式识别

整合 RGB 帧、事件流和语义标签的模式识别框架,利用预训练的大规模视觉 - 语言模型(CLIP)提取特征,并通过多模态 Transformer 网络集成这三种形式的特征,通过实验证明了 SAFE 模型的有效性。

AI生成摘要 该研究提出了一个新的双流框架,利用Transformer和GNN架构学习空间和三维信息,并引入瓶颈Transformer以融合信息。实验证明该框架在事件分类上表现出最先进的性能。

相关推荐 去reddit讨论

BriefGPT - AI 论文速递 -

Compact3D: 压缩高斯散射辐射场模型与矢量量化

用基于 k-means 算法的简单向量量化方法和类似于游程编码的方法来减少 3D 高斯雨滴方法的存储成本,并在质量下降很小的情况下减少存储成本近 20 倍。

AI生成摘要 本文介绍了一种名为GS-SLAM的算法,使用3D高斯表示方法实现了同时定位与地图构建系统中的更好平衡。通过自适应扩张策略和有效的位姿跟踪技术,提高了地图优化和RGB-D重渲染的效率。在Replica和TUM-RGBD数据集上具有竞争力的性能。

相关推荐 去reddit讨论

BriefGPT - AI 论文速递 -

RaDialog:大规模的视觉语言模型用于放射学报告生成与对话辅助

RaDialog 是一个用于放射学报告生成和交互对话的大型视觉语言模型,通过有效集成视觉图像特征和结构化病理结果,并使用参数高效的微调方法,实现了最先进的临床正确性,以及在纠正报告和回答问题等互动任务方面展现出惊人的能力,为临床对话系统打下了基础。

AI生成摘要 该研究提出了一种放射学特定的多模态模型,用于从胸部X线片生成放射学报告。该模型结合了图像编码器和大型语言模型,通过文本数据增强方法生成高质量报告。模型在评估指标上有显著提高,并展示了流畅性和准确性。

相关推荐 去reddit讨论

BriefGPT - AI 论文速递 -

ArthModel: 提升大型语言模型的算术技能

通过训练语言模型生成与算数问题相关的后缀表达式,并将其与小型预训练模型结合,将令牌嵌入转化为真实稠密数字,通过深度学习平台的本地函数获得正确答案。最后,通过提示注入将小型模型的结果输出添加到语言模型中,从而增强了语言模型的算数能力。

AI生成摘要 该研究调查了语言模型在预测和问题解决能力方面的应用,以及在算术计算和内部信息处理方面的推广能力。研究结果支持了语言模型在数值空间中进行计算的假设。

相关推荐 去reddit讨论

...
LigaAI
...
天勤数据
...
eolink
...
ShowMeBug
...
观测云
...
白鲸技术栈
...
Dify.AI
推荐或自荐