Welcome

通过增量集成和自主研发,构建大数据质量控制、自动建模与分析、数据挖掘及交互式可视化的方法库,形成高可靠性、高可扩展性、高效性和高容错性的工具库,实现三极环境多源异构、多粒度、多时相、长时间序列大数据的协同分析方法的集成和共享,以及高效和在线的大数据分析处理。

  • 最邻近算法

    最邻近算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。

    1597 2019-10-15 查看详情

  • 支持向量机

    支持向量机可以通过核方法进行非线性分类,是常见的核学习方法之一。

    2369 2019-10-15 查看详情

  • 朴素贝叶斯

    朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的联合概率分布;然后基于此模型,对给定的输入 ,利用贝叶斯定理求出后验概率最大的输出 。

    2308 2019-10-16 查看详情

  • 岭回归

    是一种专用于共线性数据分析的有偏估计回归方法,实质上是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,以损失部分信息、降低精度为代价获得回归系数更为符合实际、更可靠的回归方法

    2070 2019-10-14 查看详情

  • 卷积神经网络

    与其他深度学习结构相比,卷积神经网络在图像和语音识别方面能够给出更优的结果。相比较其他深度、前馈神经网络,卷积神经网络需要估计的参数更少,使之成为一种颇具吸引力的深度学习结构。

    584 2022-06-15 查看详情

  • Apriori

    Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。

    1613 2019-10-15 查看详情

  • 随机森林

    随机森林是指利用多棵决策树对样本进行训练并预测的一种算法,可以应用在分类和回归问题上。实现这一点,取决于随机森林的每颗树是分类树还是回归树。

    4220 2019-10-20 查看详情

  • k均值聚类算法

    k均值聚类算法是一种迭代求解的聚类分析算法,其步骤是随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。

    2094 2019-10-18 查看详情

  • 逻辑回归

    是一种广义线性回归,与多重线性回归分析有很多相同之处,区别在于逻辑回归的因变量可以是二分类的也可以多分类的。

    5056 2019-10-17 查看详情

  • 主成分分析

    主成分分析技术又称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标

    2408 2019-10-17 查看详情