小红花·文摘

微软或启动新一轮裁员；马斯克旗下Grok或遭多国封禁；京东成立“变色龙业务部”

全球TMT-美通国际 ·

本文提出了变色龙基准过拟合检测器（C-BOD），揭示大型语言模型（LLMs）在基准测试中对特定数据集表面线索的过度依赖。研究发现，模型在轻微扰动下表现平均下降2.15%，引发对模型鲁棒性和泛化能力的关注。

重新审视大型语言模型的评估 - 大型语言模型如变色龙

BriefGPT - AI 论文速递 ·

本研究针对大型语言模型（LLM）在非合作环境中信息控制与决策能力的不足进行了分析。通过将LLM代理引入一个语言基础的隐秘身份游戏——变色龙，研究发现非变色龙代理在识别变色龙的过程中未能有效隐瞒秘密，显示出信息揭示的过度，从而揭示了当前LLM在战略互动中的弱点及其潜在影响。

大型语言模型是否能够战略性地揭示、隐瞒和推断信息？变色龙游戏中的理论与实证分析

BriefGPT - AI 论文速递 ·

Chameleon是一个跨平台编译工具，能够生成多个平台的可执行文件。用户需设置Docker代理，克隆仓库并构建镜像。通过命令运行Chameleon可编译C文件，结果保存在指定工作目录。使用时需遵循网络安全法，作者不承担因使用信息导致的责任。

Chameleon(变色龙) 跨平台编译C文件，并一次性生成多个平台的可执行文件

FreeBuf网络安全行业门户 ·

Chameleon是一种先进的多模态模型，能够理解和生成图像与文本，展现出在图像描述和文本生成任务中的卓越性能。它通过生成式变压器提升数据效率和模型鲁棒性，并提出多种框架以应对缺失模态问题，在多个数据集上取得显著效果。

变色龙：鲁棒的多模态学习需要图片

BriefGPT - AI 论文速递 ·

展望 Leap 16 品牌设计的后续步骤

openSUSE 中文社区 ·

本研究探讨了大型语言模型（LLMs）生成的虚假信息对谣言检测技术的影响，并提出结合LLMs的新检测方法。研究发现现有检测器对LLMs生成内容存在偏见，提出“以毒攻毒”策略，通过生成真实和虚假内容提高检测准确性。同时推出了“GossipCop++”和“PolitiFact++”数据集，推动谣言检测技术的发展。

捕捉变色龙：检测使用大型语言模型生成的不断演变的虚假信息

BriefGPT - AI 论文速递 ·

大型语言模型（LLMs）是否具有其自己的世界观和个性倾向？对 LLM 模型回答主观问题的模拟进行了 100 多万次，将其回答与欧洲社会调查（ESS）的真实数据进行比较，结果表明问题引导对偏见和变异的影响是基本的，突出了主要的文化、年龄和性别偏见。文中还讨论了测量 LLMs 与调查数据差异的方法，如计算加权平均值和基于 Jaccard 相似性的一项新提出的测量。我们得出结论，在使用 LLMs...

大型语言模型是否具有变色龙特性？

BriefGPT - AI 论文速递 ·

本文介绍了Chameleon框架，通过合成程序提升大型语言模型（LLMs）在数学推理和信息检索任务中的能力。研究表明，Chameleon显著提高了模型的准确性，并通过数据修复降低了不公平性。此外，该框架结合多模态输入，提升了图像生成效率，展现了在多模态任务中的高效性和可控性。

变色龙：混合模式早期融合基础模型

BriefGPT - AI 论文速递 ·

本文提出了一种通用视觉模型，采用集成训练方式，具备多任务处理能力和较强的泛化性。研究了视觉语言模型的适应方法，强调自标记的重要性，并提出任务适应流水线以提升视觉语言任务性能。同时，介绍了一种高效的持续学习框架和元学习算法，能够在少样本情况下实现优异的泛化效果。

变色龙：一种在野外进行密集视觉预测的数据高效通用模型

BriefGPT - AI 论文速递 ·

我们提出了 Chameleon，这是一个系统，它有效地利用生成 AI 和基础模型，在最小程度上增加合成生成元组的数据集，以增强被少数群体所代表的覆盖范围，并通过数据修复显著降低了模型在下游任务中的不公平性。

变色龙：公平感知多模态数据增强的基础模型，提升少数族裔的覆盖率

BriefGPT - AI 论文速递 ·

网络安全公司发现名为Chameleon的新安卓恶意软件，冒充澳大利亚政府机构和银行进行分发，能够逃避安全软件检查，滥用无障碍服务授予自身额外权限，监控屏幕内容并进行干预。建议用户保持谨慎安装应用程序，只从官方商店下载软件，并启用Google Play Protect。

新安卓恶意软件“变色龙”正在冒充澳大利亚银行和加密货币交易所

FreeBuf网络安全行业门户 ·