卡帕西推出了“大模型议会”web app,多个大模型通过OpenRouter共同回答问题并互相评分,最终由主席模型给出统一答案。评估结果显示,GPT-5.1最强,Claude最弱,模型间愿意承认不足。这种多模型集成可能成为未来LLM产品的突破点。
完成下面两步后,将自动完成登录并继续当前操作。