DEV Community ·

我如何遇见你的评估策略并差点自杀

💡 原文英文，约400词，阅读约需2分钟。

📝

内容提要

作者在运行Mistral模型时遇到数据格式问题，经过多次调试和参数调整，最终成功启动。尽管面临GPU内存不足和代码错误，经过量化和修正，模型正常运行，训练损失逐渐降低，作者感到满意。

🎯

❓

作者发现75%的数据是列表而非字符串。

作者简化了代码，只保留了必要的参数。

因为作者在安装accelerate后遇到了版本冲突，导致模型未能在GPU上运行。

Mistral在fp16模式下需要14 GiB的显存。

作者通过去掉.model.half()来解决grad_norm为NaN的问题。

模型成功启动，训练损失逐渐降低，作者感到满意。

🏷️

[MAF预定义ChatClient中间件-01]LoggingChatClient——在调用LLM前后输出日志 - Artech
LoggingChatClient是一个IChatClient中间件，用于记录调用日志，帮助调试和监控Agent行为。它记录输入、输出及时间戳信息，并支持...
读：为 Clojure 定制 AI Agent 的四个技能——从 println 调试到 REPL 交互
本文讨论了为 Clojure 定制 AI Agent 的四个技能，旨在优化其行为以符合 Clojure 编程习惯。这四个技能包括：clj-debug（使用...
AI 工程中最该投资的一件事：评估管道
AI 工程和传统软件工程最大的区别在于输出质量不是二元的。一个 CRUD 接口要么能用要么不能用，但 LLM 的输出处于一个质量梯度上，你没法用单元测试来...
[显示BUG没重置] Codex已重置本周使用限额原因似乎与部分模型出现的故障有关
本周，OpenAI的Codex、ChatGPT和API出现故障，导致用户使用受限。Codex团队已重置所有付费用户的使用限额，并延长7天。故障原因与部分模...
Radim Marek: pg_stat_statements：它无法记录的一切
pg_stat_statements是PostgreSQL的查询统计扩展，记录查询执行情况，但不包括执行计划、参数值和失败查询。最大条目数为5000，超出...
Node.js Moves to One Major Release Per Year, Starting with Node 27
Node.js will change its release schedule starting with version 27 in October ...