BriefGPT - AI 论文速递 ·

社会偏见探测：语言模型的公平性基准测试

💡 原文中文，约300字，阅读约需1分钟。

📝

内容提要

本研究提出了一种四阶段的框架，用于评估大型语言模型生成的内容中的刻板印象和偏见。以教育领域为案例研究，构建了Edu-FairBench，并发现五个LLMs存在不同程度的刻板印象和偏见。自动评估方法与人工注释相关性高。

🎯

🏷️

调整Ollama本地语言模型设置
本文介绍了如何优化本地语言模型Ollama的配置，以提升AI应用的性能和准确性。通过调整模型参数、服务器环境变量和使用Go模板语法，用户可以实现更高效的文...
世界模型接棒语言模型，这家公司全球首创物理AGI“双金字塔”体系，通用机器人进入“家庭时代”
极佳视界推出了具身智能机器人拾光S1，计划在家庭场景中部署100台。该机器人采用轮臂设计，专注于家庭日常任务。公司展示了“双金字塔”技术体系，解决了数据和...
仍然是开发者，只是在户外。我们最新的GitHub商店系列现已上线。
The ESC collection lets you escape the confines of your desk and get out into...
Claude Opus 4.8发布：增强的努力控制、动态工作流、成本更低的快速模式、更高的诚实性、减少欺骗
Anthropic于周四发布了Opus 4.8版本，增强了用户控制能力，支持更大规模的编码任务，并在速度和成本上更具优势。新模型在诚实性和用户自主性方面有...
游戏与电影之间的界限愈发模糊
The most memorable part of 007 First Light is something that's typically ...
超越代码生成：在AI代理时代重新思考工程生产力
How Dropbox is moving from AI tools that assist engineers to agentic systems ...