小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Thinking Machines Lab发布了Tinker,简化了大模型微调过程,使研究人员能够更灵活地控制算法和数据。Tinker支持Qwen3和Llama3模型,降低成本并提高实验效率,受到业界关注,旨在吸引更多人参与前沿研究。

Murati翁荔陈丹琦公司发布首个产品,让大模型微调门槛暴降

量子位
量子位 · 2025-10-02T03:49:43Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

开源扩散大模型首次跑赢自回归!上交大联手UCSD推出D2F,吞吐量达LLaMA3的2.5倍

机器之心
机器之心 · 2025-08-18T04:09:49Z
AI 文档转换利器:PDF/图像一键生成网页表单 | 开源日报 No.661

home-assistant.io 提供 Home Assistant 用户文档,支持本地预览和更新。llama3.np 是基于 NumPy 的 Llama 3 模型,便于文本生成。kan-gpt 是基于 KANs 的 PyTorch 实现,支持多数据集。form-extractor-prototype 可从文档生成网页表单,支持多种格式。android-diia 是乌克兰数字化转型部的开源应用。

AI 文档转换利器:PDF/图像一键生成网页表单 | 开源日报 No.661

开源服务指南
开源服务指南 · 2025-07-10T07:35:28Z
Comma v0.1 -全开源数据训练的可复现大模型

Common Pile团队开源了基于合法数据训练的7B LLM模型Comma v0.1,分别使用1T和2T数据集,基于Llama3架构,目前仅支持英文。团队还提供了训练配置文件和测试方法,期望未来能有更多合法开放的AI模型。

Comma v0.1 -全开源数据训练的可复现大模型

Yunfeng's Simple Blog
Yunfeng's Simple Blog · 2025-06-08T10:47:57Z

字节跳动Seed团队发布了轻量级开源代码大语言模型Seed-Coder-8B-Instruct,基于Llama 3架构,参数量8.2B,支持32K tokens上下文处理。该模型通过高效管理代码训练数据,显著提升编码能力。

告别代码烦恼!Seed-Coder 解锁高效编程;Mixture-of-Thoughts 涵盖多领域数据,实现高质量推理

HyperAI超神经
HyperAI超神经 · 2025-06-06T05:49:12Z
LlamaCon 2025:Meta对AI发展的未来愿景

Meta于2025年4月29日举办的LlamaCon展示了其在开放AI工具和大型语言模型方面的最新进展,发布了Llama 3和Llama 4模型及新API。Llama 4采用专家混合架构,支持多模态输入,提升文档分析能力。新API便于开发者使用,Meta AI助手已嵌入多个平台,未来将推出Llama应用商店,推动AI系统的民主化。

LlamaCon 2025:Meta对AI发展的未来愿景

DEV Community
DEV Community · 2025-05-01T03:39:26Z

本研究评估了GPT-4o、Llama 3和Mistral在反制阴谋论中的有效性,发现这些模型生成的反驳内容往往普通且重复,并存在承认恐惧和幻觉事实的问题,揭示了AI生成内容的局限性。

Debunking Conspiracy Theories Through Dialogue? Exploring AI-Generated Counter-Speech to Challenge Conspiracy Theories

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-23T00:00:00Z

本研究探讨了如何从大型语言模型(LLM)中提取整本书籍,发现提取率与书籍受欢迎程度相关。使用Llama 3 70B模型和“前缀提示”技术,研究显示提取能力不均匀,当前记忆缓解策略存在局限。

Memorization: An In-Depth Examination of Books

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-17T00:00:00Z

本研究构建了一个综合数据集,通过生成和分类合成放射学报告来检测错误。使用GPT-4生成的合成错误报告,经过微调的Llama-3模型在错误检测中表现优异,显示出广泛的临床应用潜力。

Generative Large Language Models Trained for Detecting Errors in Radiology Reports

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-06T00:00:00Z
ollama 0.6.2 发布,支持 AMD Strix Halo

ollama 0.6.2版本于2025年3月18日发布,支持Llama 3、DeepSeek-R1和Gemma 3等大型语言模型,并兼容AMD Strix Halo GPU。该版本修复了Gemma 3的多个图像支持问题,更多信息可在GitHub上获取。

ollama 0.6.2 发布,支持 AMD Strix Halo

实时互动网
实时互动网 · 2025-03-19T01:58:10Z

本研究比较了大型语言模型在生物医学文本分类中的表现,结果显示DeepSeekR1在精确度上优于Llama3-70B,但F1分数因任务而异,强调选择模型时需考虑具体需求。

比较Llama3与DeepSeekR1在生物医学文本分类任务中的表现

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-19T00:00:00Z
网页开发者必备的顶级开源LLM 🚀💡

作为网页开发者,我关注开源LLM的崛起。这些模型如Mistral 7B、Llama 3、Gemma和Falcon,提供强大的AI能力,避免供应商锁定,适用于不同应用场景,增强开发者灵活性。

网页开发者必备的顶级开源LLM 🚀💡

DEV Community
DEV Community · 2025-03-14T15:34:58Z

本研究提出了一种专用的反馈和编辑模型,旨在优化开放性任务中的推理时间扩展。通过模仿人类反馈改进过程,利用70B规模的Llama 3模型,在Arena Hard基准测试中实现了92.7的性能,超越了多个现有模型。

Dedicated Feedback and Edit Models Enhance Inference-Time Scaling for Open-Domain Tasks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-06T00:00:00Z

本研究提出一种新方法,通过Llama-3生成的解释性内容,显著提升RoBERTa在多标签情感检测中的性能,尤其在恐惧、快乐和悲伤情感上提高了F1分数,标志着情感检测的进展。

SemEval-2025第11任务中的莲花:使用Llama-3生成解释的RoBERTa进行多标签情感分类

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-27T00:00:00Z
深入探讨Llama3:揭示详细见解与实现

该项目从零实现Meta的Llama3,揭示大型语言模型的内部工作原理。提供双语代码注释、维度跟踪和KV-Cache推导,适合初学者和开发者,帮助深入理解模型设计与推理过程。

深入探讨Llama3:揭示详细见解与实现

DEV Community
DEV Community · 2025-02-22T19:48:54Z
Huggingface上的Llama3集合

抱歉,您提供的文本没有包含可供总结的内容。请提供具体的文章内容,我将为您进行总结。

Huggingface上的Llama3集合

DEV Community
DEV Community · 2025-02-16T06:27:25Z

本研究提出了一种利用大型语言模型(LLMs)进行自动化事实核查的新方法,解决了传统方法效率低和资源消耗大的问题。研究表明,Llama-3模型在分类准确性和解释质量上表现优越,证据整合提升了所有模型的性能,展示了自动化事实核查的潜力。

面向现实世界声明的自动化事实核查:与大型语言模型的任务形成与评估探索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-13T00:00:00Z
Raspberry Pi 5在Ollama和Llama3.x模型下的性能

本文评测了Raspberry Pi 5在运行Ollama和Llama3.2模型时的性能,结果显示使用Argon Neo NVME外壳的Pi 5处理速度良好,适合预算有限的用户,但M系列MacBook/Mac Mini性能更强大。

Raspberry Pi 5在Ollama和Llama3.x模型下的性能

DEV Community
DEV Community · 2025-02-03T12:00:00Z
StyleSpark:使用GitHub Actions分析和匹配代码与知名编程风格

StyleSpark是一个GitHub Action工具,帮助开发者分析代码风格并与知名程序员的风格比较。它利用Llama 3分析代码,鼓励开发者反思编码习惯,促进持续改进,并通过生成徽章更新README,为开发者提供有趣的学习方式。

StyleSpark:使用GitHub Actions分析和匹配代码与知名编程风格

DEV Community
DEV Community · 2025-01-20T03:32:59Z
Meta开源了具有更好可扩展性的字节潜在变换器LLM

Meta开源了字节潜在变换器(BLT),这是一种使用动态字节处理的LLM架构。BLT模型在推理FLOPS上比Llama 3减少50%,并能更好地处理噪声输入。通过动态分组字节,BLT提升了模型的鲁棒性和多语言理解能力。实验显示,BLT在字符级任务上优于Llama 3,但将Llama 3转换为BLT时性能显著下降。BLT的训练和推理代码已在GitHub上发布。

Meta开源了具有更好可扩展性的字节潜在变换器LLM

InfoQ
InfoQ · 2025-01-07T14:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码