Welcome

通过增量集成和自主研发,构建大数据质量控制、自动建模与分析、数据挖掘及交互式可视化的方法库,形成高可靠性、高可扩展性、高效性和高容错性的工具库,实现三极环境多源异构、多粒度、多时相、长时间序列大数据的协同分析方法的集成和共享,以及高效和在线的大数据分析处理。

  • 最邻近算法

    最邻近算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。

    2825 2019-10-15 查看详情

  • Apriori

    Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。

    3132 2019-10-15 查看详情

  • 卷积神经网络

    与其他深度学习结构相比,卷积神经网络在图像和语音识别方面能够给出更优的结果。相比较其他深度、前馈神经网络,卷积神经网络需要估计的参数更少,使之成为一种颇具吸引力的深度学习结构。

    1888 2022-06-15 查看详情

  • 随机森林

    随机森林是指利用多棵决策树对样本进行训练并预测的一种算法,可以应用在分类和回归问题上。实现这一点,取决于随机森林的每颗树是分类树还是回归树。

    6043 2019-10-20 查看详情

  • 受限波尔兹曼机

    受限玻尔兹曼机是一种可通过输入数据集学习概率分布的随机生成神经网络。

    3445 2019-10-16 查看详情

  • 主成分分析

    主成分分析技术又称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标

    3588 2019-10-17 查看详情

  • 非局部均值滤波

    非局部均值滤波是对传统邻域滤波方法的一种改进滤波,考虑到了图像的自相似性质,它充分利用了图像中的冗余信息,在去噪的同时能够最大程度的保持图像的细节特征。

    1575 2022-06-15 查看详情

  • 梯度推进机

    梯度推进机主要思想是基于之前建立的基学习器的损失函数的梯度下降方向来建立下一个新的基学习器,目的就是希望通过集成这些基学习器使得模型总体的损失函数不断下降,模型不断改进。

    4085 2019-10-23 查看详情

  • k均值聚类算法

    k均值聚类算法是一种迭代求解的聚类分析算法,其步骤是随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。

    2976 2019-10-18 查看详情

  • 逻辑回归

    是一种广义线性回归,与多重线性回归分析有很多相同之处,区别在于逻辑回归的因变量可以是二分类的也可以多分类的。

    6254 2019-10-17 查看详情