小红花·文摘

网络挖掘及其应用初学者指南

DEV Community ·

我厌倦了有毒的社交媒体——所以我正在建立一个专注于归属感的平台

DEV Community ·

评估阶段 (Evaluation)

DEV Community ·

云计算中安全数据挖掘的混合解决方案

DEV Community ·

本研究解决了复杂数据挖掘中无标签数据特征提取和分类的有效性问题，提出了一种基于自监督学习的算法，并通过实验验证其效果。研究表明，AdamW优化器结合学习率0.002可以显著提高模型性能，同时对比学习、变分模块和数据增强策略对模型的泛化能力和鲁棒性至关重要。

自监督学习在复杂数据挖掘中的对比和变分方法

BriefGPT - AI 论文速递 ·

定制化客户关系管理系统听起来不错，但阿什坎·拉贾伊（Ashkan Rajaee）表示，真正的优势在于你的数据。数据挖掘仍然是胜者。#阿什坎·拉贾伊 #数据战略 #客户关系管理 #初创企业增长

DEV Community ·

利用数据挖掘技术分析SMS垃圾信息数据集中的模式

DEV Community ·

本文介绍了泰坦尼克号生存预测的数据预处理过程，强调数据处理的重要性。通过分析特征与生存率的关系，提取新特征并进行数据清洗，最终构建预测模型。

数据挖掘-利用多个机器学习模型实现泰坦尼克号生存预测

FreeBuf网络安全行业门户 ·

在泰坦尼克号生存预测中，数据预处理至关重要。通过分析乘客特征（如舱位、性别和家庭大小），提取新特征并处理缺失值，最终构建预测模型。多种模型中，随机森林的表现最佳。

数据挖掘-利用多个机器学习模型实现泰坦尼克号生存预测

FreeBuf网络安全行业门户 ·

本研究针对传统频繁模式挖掘算法在高维和稀疏数据环境下的性能瓶颈，提出了一种基于支持向量机（SVM）的频繁模式数据挖掘算法。通过将频繁模式挖掘转换为分类问题，该算法在模式提取的准确性和鲁棒性上有显著提升，并且在实际应用中提供了对复杂模式挖掘任务的有效解决方案。

高维数据挖掘中的模式识别机器学习技术

BriefGPT - AI 论文速递 ·

大规模数据集挖掘：数据科学爱好者的终极指南

DEV Community ·

本研究提出了一种新颖的自然语言处理方法，成功提取了1008条与伦理关注相关的应用评论，显著提升了数据挖掘效率。

Beyond Keywords: A Context-Based Hybrid Approach for Mining Application Reviews Related to Ethical Concerns

BriefGPT - AI 论文速递 ·

本研究解决了肽自组装行为研究中缺乏系统性分析的问题。通过手动处理和大语言模型的文献挖掘，我们建立了一个包含超过1000条实验数据的肽组装数据库，并训练出高效的机器学习模型，实现了对肽自组装相的高准确率分类。这一工作有助于提高肽候选体的探索效率，为新结构的开发提供了支持，使其在传感、催化及生物材料等应用中具有潜在影响。

通过大语言模型的数据挖掘学习肽自组装的规则

BriefGPT - AI 论文速递 ·

本研究针对多尺度生物系统动态建模中的数据挖掘和特征选择问题，提出了一种基于组学的数据建模管道，有效捕捉酵母菌株的动态行为，并为生物过程工程提供不确定性估计框架。

基于组学的混合动态建模与不确定性估计

BriefGPT - AI 论文速递 ·

在Lux学院的最后一课中，我学习了如何撰写技术文章，并完成了一个项目：从weatherapi或openweathermap获取肯尼亚的天气数据，存储在MongoDB中，用Python分析，并在Tableau中可视化。尽管可视化耗时，但我在三周的数据分析课程中收获颇丰，感谢导师的指导。

数据挖掘与可视化

DEV Community ·

本研究结合元启发式算法、传统分类器和神经网络，解决机器学习中的数据不足问题。实验表明，仅依赖标记数据集的验证准确率无法纠正未见数据的标签，这对未来数据挖掘技术有重要影响。

Automated Data Mining Approaching the Combination of Metaheuristic and Deep Learning

BriefGPT - AI 论文速递 ·

本文研究了自监督对比学习在高光谱图像分类中的应用，特别是在标注数据有限时的优势。提出了一种两阶段分类方法，即使减少50%训练数据，仍能保持优异表现。该方法通过挖掘数据的隐含空间信息，提高了单标签和多标签分类的性能，展示了其在高光谱数据处理中的潜力。

通过对比学习提高低标注领域的高光谱图像预测

BriefGPT - AI 论文速递 ·

本研究解决了大型语言模型在特定或低资源行业领域表现不足的问题。我们提出了一种自动化且可扩展的框架DoPAMine，通过挖掘特定领域的训练数据，增强了模型的适应能力。实验结果表明，该方法在医疗和金融领域的零-shot和5-shot场景中显著提高了预训练模型的性能，展现了其潜在的行业应用价值。

DoPAMine：从种子引导数据挖掘的领域特定预训练适应

BriefGPT - AI 论文速递 ·

AI在软件测试中的应用正在改变我们确保质量的方式，加快了流程，提高了准确性。它自动化了繁琐的任务，减少了上市时间，同时确保可靠性。AI深入挖掘数据，发现错误并预测风险区域，实现更智能的测试和更快的修复。AI优势包括精确性、可扩展性、更快的发布和持续集成。但需要注意的挑战包括适应老系统、高成本、技能差距和数据质量。AI驱动的软件测试已经来临，准备好发挥其全部潜力了吗？

在软件测试中整合AI：未来已来

DEV Community ·

孟瑜获杰出博士论文奖，中科大获最佳学生论文，KDD 2024全部奖项放出

机器之心 ·