数据分析

此模块提供数据的统计分析、可视化和建模等服务。

Lasso回归

该方法通过两个正则化参数 (Lambda 值) 从众多变量筛选出关键变量。

主成分分析 (PCA)

该方法用于数据降维和特征提取,寻找变量之间的关系。

冗余分析 (RDA)

该方法结合回归分析和主成分分析,用于揭示响应变量与解释变量之间的关系。

主坐标分析(PCoA)

该方法基于距离矩阵将数据降维,用于可视化样本组间的相似性和差异性。

层次聚类

该方法基于数据点之间的相似性,逐步构建层级结构而实现聚类。

Mantel test

该方法用于评估因变量矩阵整体与各个自变量之间的相关性。

逐步回归

该方通过逐步移除解释变量以最小化AIC等指标,从而筛选最优回归模型。

K均值聚类

该方法是一种将数据划分为预设簇数,并将样本归入最近簇中心的无监督学习算法。

t-SNE

该方法是一种非线性降维方法,将高维数据局部结构保留并映射到低维空间。

岭回归

该方法是线性回归的改进方法,在拟合模型时惩罚过大的系数,提升模型的泛化能力。

方差分析

该方法用于检验多组均值差异,并使用HSD事后检验进一步识别具体差异组。

相关性热图

该方法利用颜色和数值直观展示变量之间的相关程度。

离散贝叶斯网络

该方法用于推理分类变量之间的因果关系,并构建网络图和条件概率表。

一元线性回归

该方法用于分析变量之间线性关系,通过拟合一条直线来预测因变量随自变量的变化。