本研究提出DFA-CON对比学习框架,旨在有效检测生成式AI工具对视觉艺术创作的版权侵犯与伪造问题。DFA-CON通过建立原创艺术作品与伪造作品之间的亲和力,展现出强大的检测性能,超越了现有预训练模型。
确定性有限自动机(DFA)用于检查语言和模式,以判断输入是否符合预定义规则。DFA由状态集、输入字母表、转移函数、初始状态和接受状态组成。一个示例DFA接受以'a'开头的字符串,其状态转移依据首字母决定接受或拒绝。
本研究提出了一种新颖的实时在线适应方法——直接反馈对齐(DFA)。在RRAM硬件限制下,DFA在节能、延迟和推理准确率方面优于传统反向传播方法。
本文提出了DeepDFA,一种通过跟踪识别确定性有限自动机(DFA)的新方法,采用可微但离散的模型。该方法结合了DFA的概率松弛和递归神经网络(RNN)的启发,提供了训练后的可解释性,并在复杂度和训练效率上优于传统RNN。实验验证表明,该方法在各种规模和复杂度的目标正规语言上表现准确、快速且对噪声具有强韧性,充分结合了逻辑语法诱导和深度学习的优势。
该研究提出了一种算法,通过专家演示和自然语言学习确定性有限自动机(DFA),结合大型语言模型和迁移学习,提升学习效率。同时介绍了 MathPrompter 技术,利用提示生成多种数学表达式,增强模型在算术问题上的表现。此外,研究探讨了有限状态自动机和线性时态逻辑在黑盒系统建模中的应用,提出了“LLMs 作为教师”的框架,显著提升了目标模型的训练效果。
通过引入 DFA-GNN 方法以及伪误差生成器,本文提出了一种用于图神经网络的前向学习框架,通过优化网络的反馈链接,克服了 BP 算法的限制,并在半监督学习任务中展现了非常优异的鲁棒性。
Needle是一个将正则表达式编译为JVM字节码的库,可以提高匹配效率。通过分析DFA,它能检测出前缀、后缀和前后缀,从而减少在DFA自动机中的时间消耗。与Java标准库和brics自动机库相比,Needle在性能上更快。但当没有子串时,brics更胜一筹。
研究表明,字节对编码(BPE)在孟加拉语自动语音识别中有效,最佳令牌数量为500-1000。对阿拉伯语言模型的分析显示,Farasa的BPE在多项任务中表现优于其他策略,但在情感分析中存在方言问题。建议改进分词策略以增强模型鲁棒性,并指出词汇量对模型性能的影响有限。
开源日报介绍了基于DFA算法的高性能敏感词过滤工具“sensitive-word”。该工具支持敏感词判断、返回和脱敏,具备格式转换、邮箱和网址检测等功能,允许自定义替换策略,性能高效且无明显延迟。
完成下面两步后,将自动完成登录并继续当前操作。