小红花·文摘

Github最近推出了Github Models，允许我们免费尝试和测试各种模型类型、大小和专业化。使用AutoGen.Net集成Github Models的方法如下：创建一个dotnet控制台应用程序，添加AutoGen 0.2.0包，使用Llama-3.1 405B模型进行简单的聊天示例。然而，由于是免费的，使用服务有一定限制，适合尝试和娱乐，但不适合严肃的重型工作。

在AutoGen.Net中免费使用Github Model上的gpt-4o、llama及更多LLMs

DEV Community ·

本文介绍了 HalluQA 基准，用于衡量中文大型语言模型中的幻觉现象。通过对 24 个大型语言模型的广泛实验，发现有 18 个实现了低于 50% 的非幻觉率，表明 HalluQA 具有很高的挑战性。同时，分析了不同类型模型中主要类型的幻觉及其原因，并讨论了不同类型模型应优先考虑哪些类型的幻觉。

GPT-4V (ision): 幻觉的整体分析：偏见和干扰挑战

BriefGPT - AI 论文速递 ·