小红花·文摘

本研究提出了Thinker框架，以解决客户服务中的推理能力不足问题。通过引入状态机增强生成方法，显著提升了GPT-4o和Llama-3.1的推理成功率，展示了工具接口设计的创新潜力。

The Art of Tool Interface Design

BriefGPT - AI 论文速递 ·

首个开放的哈萨克语大型语言模型实现了最先进的性能

DEV Community ·

英伟达开源最新大模型Nemotron 70B后，只有OpenAI o1一个对手了

机器之心 ·

Github最近推出了Github Models，允许我们免费尝试和测试各种模型类型、大小和专业化。使用AutoGen.Net集成Github Models的方法如下：创建一个dotnet控制台应用程序，添加AutoGen 0.2.0包，使用Llama-3.1 405B模型进行简单的聊天示例。然而，由于是免费的，使用服务有一定限制，适合尝试和娱乐，但不适合严肃的重型工作。

在AutoGen.Net中免费使用Github Model上的gpt-4o、llama及更多LLMs

DEV Community ·

Meta发布了备受期待的Llama-3.1系列模型，包括405B“超级杯”型号，成为首个能与最强大模型媲美的开源模型。Llama-3.1系列包括8B、70B和405B三个版本，具有128k的扩展上下文长度和支持八种语言。405B模型目前是最大的开源模型，在各种评估指标上超过了GPT-4。SiliconCloud在其平台上推出了Llama-3.1系列模型，使开发者更容易访问和使用这些先进模型。该平台还提供加速推理和实惠的价格。除了Llama-3.1，SiliconCloud还提供各种其他开源语言模型、图像生成模型和代码生成模型。开发者可以免费使用这些模型，消除了开发和大规模推广中的计算成本。SiliconCloud旨在为开发者提供更快、更便宜、更全面的模型API，以实现更流畅的用户体验。

比肩GPT4，没有显卡也能用Llama-3.1-405B

OneFlow深度学习框架 ·