数据分析
此模块提供数据的统计分析、可视化和建模等服务。
Lasso回归
该方法通过两个正则化参数 (Lambda 值) 从众多变量筛选出关键变量。
主成分分析 (PCA)
该方法用于数据降维和特征提取,寻找变量之间的关系。
冗余分析 (RDA)
该方法结合回归分析和主成分分析,用于揭示响应变量与解释变量之间的关系。
主坐标分析(PCoA)
该方法基于距离矩阵将数据降维,用于可视化样本组间的相似性和差异性。
层次聚类
该方法基于数据点之间的相似性,逐步构建层级结构而实现聚类。
Mantel test
该方法用于评估因变量矩阵整体与各个自变量之间的相关性。
逐步回归
该方通过逐步移除解释变量以最小化AIC等指标,从而筛选最优回归模型。
K均值聚类
该方法是一种将数据划分为预设簇数,并将样本归入最近簇中心的无监督学习算法。
t-SNE
该方法是一种非线性降维方法,将高维数据局部结构保留并映射到低维空间。
岭回归
该方法是线性回归的改进方法,在拟合模型时惩罚过大的系数,提升模型的泛化能力。
方差分析
该方法用于检验多组均值差异,并使用HSD事后检验进一步识别具体差异组。
相关性热图
该方法利用颜色和数值直观展示变量之间的相关程度。
离散贝叶斯网络
该方法用于推理分类变量之间的因果关系,并构建网络图和条件概率表。
一元线性回归
该方法用于分析变量之间线性关系,通过拟合一条直线来预测因变量随自变量的变化。