小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
三年之后:回看 2023 年我对 ChatGPT 的判断

文章回顾了作者在2023年对ChatGPT的判断,分析了三年后的实际发展与预测的差异。大部分判断方向正确,但具体数字和速度常常高估或低估。特别是在AGI、模型参数和市场变化方面,展现了乐观与保守并存的态度。作者强调,准确把握方向比具体数字更重要,未来仍需关注分布与不确定性。

三年之后:回看 2023 年我对 ChatGPT 的判断

王建硕的博客
王建硕的博客 · 2026-05-29T01:00:00Z
KV缓存大小计算器

文章讨论了KV缓存大小计算器的模型参数,包括每个序列的模型令牌数量、序列数量、KV精度和索引器精度等内容。

KV缓存大小计算器

Home | KVCache.ai
Home | KVCache.ai · 2026-05-20T00:00:00Z
Veo Extend API 对接说明

本文介绍了Veo Extend API的对接说明,主要用于延展已生成的Veo视频。用户需申请API并提供视频ID和模型参数。支持的模型有veo31-fast和veo31,返回结果与视频相关。延展结果视频可再次延展,但不能使用特定接口处理。计费方面,veo31-fast每次1.20信用,veo31每次7.64信用。接口支持异步回调。

Veo Extend API 对接说明

静觅
静觅 · 2026-05-16T20:42:51Z
DeepHQ:学习型层次化量化器用于渐进式深度图像编码 | TOMM 2026

本文提出了一种名为DeepHQ的渐进式图像压缩方法,通过学习量化步长提升压缩效率,并引入选择性压缩,仅编码必要的特征,显著减少模型参数和解码时间。

DeepHQ:学习型层次化量化器用于渐进式深度图像编码 | TOMM 2026

实时互动网
实时互动网 · 2026-04-02T06:35:34Z
ICLR 2026 | 对抗扩散压缩算法在真实世界视频重建任务中的应用

本文提出了一种改进的对抗扩散压缩方法(AdcVSR),用于真实世界视频超分辨率。该方法通过剪枝和轻量级一维卷积,显著降低模型参数和推理时间,同时保持视频质量。实验结果表明,AdcVSR在减少95%参数的同时,实现约8倍的速度提升,优化了细节生成与时域一致性。

ICLR 2026 | 对抗扩散压缩算法在真实世界视频重建任务中的应用

实时互动网
实时互动网 · 2026-03-10T03:21:37Z

模型参数量反映规模和复杂性,通常以十亿为单位。参数是影响预测能力的学习变量。轻量级模型适合个人开发者,高性能模型满足大型企业需求。选择模型时需平衡任务、预算和技术能力。

大语言模型级别划分及使用场景

安志合的学习博客
安志合的学习博客 · 2025-11-12T03:45:42Z
指令跟随剪枝用于大型语言模型

随着大型语言模型的发展,本文提出了一种动态剪枝方法——指令跟随剪枝,能够根据用户指令动态选择模型参数。该方法通过优化稀疏掩码预测器和LLM,显著提升了推理效率和性能,实验结果在多个评估基准上表现优异。

指令跟随剪枝用于大型语言模型

Apple Machine Learning Research
Apple Machine Learning Research · 2025-06-30T00:00:00Z

Qwen2.5-Omni是一个多模态AI模型,支持文本、音频、图像和视频输入,能够生成自然语言的文本和语音响应。适用于实时语音和视频聊天、自然语音生成及复杂指令处理。文章介绍了如何在Python中设置和使用该模型,包括安装必要库和编写生成响应的函数。该模型具有7亿参数,首次运行可能较慢,但后续交互会更快。

Qwen2.5-Omni:强大的多模态AI模型使用指南与示例项目

KDnuggets
KDnuggets · 2025-05-16T12:43:24Z

本研究提出了一种新策略,将FLIM网络与多层细胞自动机结合,以应对深度学习显著目标检测中对丰富标注数据和复杂网络架构的挑战。该方法在医疗数据集的基准测试中表现优异,显著减少了模型参数并提高了结果质量。

Application of Multi-level Cellular Automata in FLIM Networks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-15T00:00:00Z
北大团队提出LIFT:将长上下文知识注入模型参数,提升大模型长文本能力

北京大学提出的LIFT框架通过将长文本知识存储在模型参数中,提升了大语言模型对长文本的理解能力。LIFT动态调整模型参数,降低了传统方法的复杂度和存储开销,显著提高了长文本任务的表现。实验结果表明,LIFT在多个基准测试中有效提升了模型准确率,展现出良好的应用前景。

北大团队提出LIFT:将长上下文知识注入模型参数,提升大模型长文本能力

机器之心
机器之心 · 2025-03-17T06:42:14Z
LLM推理GPU视频内存计算器

LLM内存计算器是一种工具,用于估算部署大型语言模型所需的GPU内存。用户输入模型参数数量和精度格式(FP32、FP16或INT8),即可计算所需内存。该工具还强调优化技术的重要性,以帮助资源有限的用户有效部署模型,避免内存不足的错误。

LLM推理GPU视频内存计算器

DEV Community
DEV Community · 2025-03-16T18:29:49Z

本研究探讨了计算最佳规模是否依赖于知识与推理技能,发现不同技能的规模规律显著不同,数据集选择和模型参数的影响可达50%。该研究为大规模语言模型的开发提供了新见解。

Optimal Scaling of Computational Skills: Knowledge vs Reasoning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-13T00:00:00Z

本研究提出了一种通用的超参数缩放法则,解决了大型语言模型的超参数优化问题。研究发现,最佳学习率与模型参数和数据规模呈幂律关系,而批次大小主要与数据规模相关。这为模型性能优化提供了有效工具。

Predictable Scaling: Part One - Optimal Hyperparameter Scaling Laws in Pretraining Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-06T00:00:00Z

满血版DeepSeek运行需要671G内存,单机无法支持。模型参数与内存需求成正比,量化版本可降低内存需求,但精度会下降。

为什么我的机器跑不了满血版 DeepSeek?

王福强
王福强 · 2025-02-26T16:00:00Z

本研究提出了一种新的部分通道机制(PCM)和部分注意力卷积(PATConv),旨在降低模型参数和FLOPs,同时保持准确性和吞吐量。实验结果表明,PATConv有效替代传统卷积,混合网络结构PartialNet在ImageNet-1K和COCO数据集上表现优异。

部分通道网络:计算更少,表现更好

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-03T00:00:00Z

本研究提出了一种改进的Chinchilla扩展法,通过优化模型参数、训练标记和结构,Morph-1B模型在保持准确性的同时,推理延迟效率提高了1.8倍。

Efficient Inference for Scalable Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-30T00:00:00Z

本研究探讨了大型语言模型在扩展行为中的相变现象,重新表述了Transformer架构,发现与文本生成温度和模型参数大小相关的两个显著相变。这些发现有助于估计模型内部维度,并揭示新能力的出现。

大型语言模型中的相变与 $O(N)$ 模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-27T00:00:00Z

本研究提出了一种基于解释引导修剪的通信高效联邦学习方法,旨在降低遥感图像分类中的通信开销。通过层次相关传播策略,识别并传递最相关的模型参数,从而减少模型更新数量,提高全局模型的泛化能力。实验结果表明,该方法显著提升了通信效率和模型有效性。

Communication-Efficient Federated Learning Based on Explanation-Guided Pruning for Remote Sensing Image Classification

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-20T00:00:00Z

本研究提出了Proceed框架,以解决时间序列预测中的概念漂移问题。通过估计训练样本与测试样本之间的漂移,及时调整模型参数,实验证明其性能优于现有的在线学习方法。

Active Model Adaptation for Concept Drift in Online Time Series Forecasting

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-11T00:00:00Z

本研究探讨了多任务微调中的权重确定问题,提出了一种通过贝叶斯模型合并技术重用模型参数的快速预览方法,显著提升了微调效果。

How to Weight Multitask Finetuning? Fast Previews via Bayesian Model Merging

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-11T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码