标签

 模型 

相关的文章:

phodal -

以 LLM 为核心 LLM@Core:程序员的大语言模型技术指南

AI生成摘要 本文介绍了以大语言模型(LLM)为核心的程序员技术指南,包括应用篇、高级篇和上下文工程。文章探讨了如何让LLM是大模型友好的,并建议采用语言建模、构建MVP产品并进行试验、设计增量的指标、围绕上下文的工程化思维和持续反馈的软件工程等方法来实现。同时,文章还提到了针对不同场景构建适合的策略的重要性,以及随着时间推移,针对LLM的外挂知识库和结合知识图谱等方面的方案会不断完善。总之,本文提供了一份全面的LLM技术指南,为程序员和开发人员提供了在这一领域提高效率的方法和策略。

阅读全文 去reddit讨论

Lenix -

大语言模型LLM技术原理

AI生成摘要 本文介绍了ChatGPT模型的训练范式RLHF,即基于人类反馈的强化学习来优化语言模型。RLHF训练包括预训练语言模型、训练奖励模型和用强化学习微调语言模型三个步骤。ChatGPT能够更好地理解指令的意图,并按指令完成符合训练者价值观的输出。

阅读全文 去reddit讨论

亚马逊AWS官方博客 -

《基于智能搜索和大模型打造企业下一代知识库》之《典型实用场景及核心组件介绍》

AI生成摘要 本文介绍了如何使用智能搜索和大语言模型构建企业下一代知识库,提出了六种场景的增强方案,包括智能搜索、智能引导、智能优化、智能问答和非结构化数据注入。同时,介绍了处理非结构化数据的 Embedding 模型和意图识别、可控文本生成的应用。

阅读全文 去reddit讨论

布丁布丁吃什麼? -

機器學習模型真的準嗎?從虛無假設檢定來檢驗模型成效 / Applying Null-Hypothesis Statistical Testing on Machine Learning Model Evaluation

AI生成摘要 本文介绍了使用虚无假设检验来评估机器学习模型的效果,并探讨了不平衡数据和平均分布数据对基准线评估的影响。同时,介绍了比较演算法的其他推论统计检定方法。最后,提出了如何评估机器学习模型的问题。

阅读全文 去reddit讨论

少数派 -

除了模型, GPT 们还在卷什么?

AI生成摘要 本文介绍了几款 ChatGPT 的套壳应用和国内大厂的 AI 对话机器人产品。其中,MacGPT 支持五种模式,ChatGPT-Next 是功能最丰富、自定义程度最高的套壳客户端,国内创业公司的 AI 对话机器人矩阵功能强大,微信机器人的功能受限,而 ChatGPT 在移动端上的应用场景目前较少。文章指出,AI 变革将深刻改变社会的发展方向,本土化是重要课题,国内大厂在进度上落后但应用层已经先行,这将是竞争最激烈同时机会最多的地方。

阅读全文 去reddit讨论

阿里云云栖号 -

PAI-Diffusion 中文模型全面升级,海量高清艺术大图一键生成

AI生成摘要 阿里云机器学习PAI团队升级了PAI-Diffusion中文模型,提高了图像生成质量、风格多样化、精细化模型微调功能和简单易用的场景化定制方案。该模型已开源并接入多个开源模型分享社区,支持多种轻量化微调算法和可控的图像编辑功能,可继续预训练产出针对不同业务场景的Diffusion模型。未来,该团队将继续优化模型,提高生成图像的质量和多样性。

阅读全文 去reddit讨论

亚马逊AWS官方博客 -

基于 AWS 无服务器架构的大语言模型应用构建 (工程篇)

基于 AWS 无服务器架构的大语言模型应用构建,分为上下篇两部分,此为下篇(工程篇),我们会从工程实现角度介绍如何借助 AWS 无服务器架构实现构建知识问答机器...

阅读全文 去reddit讨论

爱范儿 -

早报 |阿里云回应裁员/ iOS 17 新功能曝光,锁屏 iPhone 大变样/小米称不做通用大模型

AI生成摘要 科学家发现火星建造材料;Windows 支持 RAR 文件;Google 推出自定义 Chrome 侧边栏;微软 Win11 引入 RGB 外设控件新功能;亚马逊推出 Fire Max 11 平板电脑。

阅读全文 去reddit讨论

dotNET跨平台 -

LLM探索:GPT类模型的几个常用参数 Top-k, Top-p, Temperature

AI生成摘要 本文介绍了使用ChatGPT接口或本地部署LLM大模型时常用的三个参数:temperature、top_k和top_p,它们可以影响模型输出的随机性和候选词选择。同时提供了调参建议和注意事项。

阅读全文 去reddit讨论

华为云官方博客 -

实例解读华为云数字工厂平台的逻辑模型编排器

AI生成摘要 本文介绍了华为云数字工厂平台的逻辑模型编排器的使用方法,以及结合生产执行管理场景案例,详细介绍了如何使用逻辑编排器来实现4个业务逻辑流。通过验证,这些逻辑流都能够成功实现相应的业务需求。

阅读全文 去reddit讨论