当前位置:   article > 正文

R语言PLS-DA模型分析不同中医组别患者间差异指标数据可视化

R语言PLS-DA模型分析不同中医组别患者间差异指标数据可视化

全文链接 :https://tecdat.cn/?p=34809

PLS-DA (Partial Least Squares Discriminant Analysis) 是一种多变量统计分析方法,常用于处理具有多个预测变量和多个响应变量的数据点击文末“阅读原文”获取完整代码数据)。

相关视频

在本文中,我们帮助客户使用了PLS-DA方法来挖掘两个疾病的不同中医分组方式下存在差异的指标。

首先,我们有两个Excel文件,分别是患者的证素数据。每一列代表一位患者的多个数据,不同颜色代表了不同的分组。我们想要通过PLS-DA挖掘不同组别患者间存在差异的指标。

两个EXCEL分别是患者的证素的数据,由于是评分性质的,所以都是不连续的数字。每一列代表一位患者的多个数据,不同颜色代表了不同的分组,想通过PLS-DA挖掘下不同组别患者间存在差异的指标有哪些。2个EXCEL是分开的2个疾病,每个疾病下包含不同中医的分组方式,主要想挖掘下不同中医分组方式下存在差异的指标。一方面需要找到这些存在差异的指标,每一列代表一位患者的多个数据,不同颜色代表了不同的分组。

数据1

在R语言中,我们首先将数据导入并进行预处理。我们使用read.csv函数将数据1导入,并将不需要的列删除。然后,我们使用na.omit函数删除含有缺失值的行。最后,我们为每个患者指定一个组别,分别为A、B、C、D、E和F。

28ab65de727268dd1891a96fa8cf668b.png

  1. data=read.csv("数据1.csv")
  2. X=data
  3. X=X[,-53]
  4. #分别设置组别和指标
  5. X=na.omit(X)
  6. Y=c(rep("A",29),rep("B",19),rep("C",27),rep("D", 8),rep("E",9),rep("F",4) )

进行PLS-DA模型的建立

接下来,我们使用PLS-DA建立模型。建立PLS-DA模型,并将数据集和组别变量作为输入。建立模型后,我们可以查看不同组别分别有哪些指标,以及哪些指标之间存在显著的差异。

tIndiv(plsda.breast,

f519a6e9d9662ca3d1a43af8af574e1f.png

从结果中可以看到不同组别分别有哪些指标,以及哪些指标之间存在显著的差异?

从图中可以看到,分组a和分组b之间存在显著的差异,分组cdef之间的差异较小,分组a分组b和分组cdef间均存在显著差异。


点击标题查阅往期内容

905f27ce61e49b45e59d08d9e5f1b2d1.jpeg

Matlab中的偏最小二乘法(PLS)回归模型,离群点检测和变量选择

outside_default.png

左右滑动查看更多

outside_default.png

01

4eb3fe01944d7cb25a3009bde953664c.png

02

8bba5bbdadf97b7ea48db1ea5f7da997.png

03

cb65abf07cc66a291410d708470ea5b4.png

04

6f81761b78207351540401b67b65ae01.png

指示变量矩阵

st(t(plsda.breast$ind.mat))

caacc13e72e1f15dbf95404aa4e69baa.png

从指示变量矩阵的结果来看,a的特征向量和b的特征向量之间存在显著差异,而cdef之间的差异较小。

数据2

接下来,我们导入数据2,并进行相似的分析步骤。首先,我们使用read.csv函数将数据2导入。然后,我们建立PLS-DA模型,并使用div函数查看不同组别分别有哪些指标,以及哪些指标之间存在显著的差异。

be81df7b4523507beb218d0d7b918897.png

进行PLS-DA模型的建立

  1. div(plsda.breast,
  2.           ellipse = TRUE

f986bd19eda2316fa71dbc39635bd3ab.png

指示变量矩阵

ist(t(plsda.breast$i

18c05a3c6fb5b79e467943e5084b6fb0.png

从结果中可以看到不同组别分别有哪些指标,以及哪些指标之间存在显著的差异?

从图中可以看到,分组GHEC之间的差异较小,分组ABDFIJK之间差异较小,这两类间均存在显著差异。

从指示变量矩阵的结果来看,GHEC特征向量之间的差异较小距离也较小,分组ABDFIJK之间差异较小距离也较小,这两类间均存在显著差异。


d860aa5ddc6551d48ffff162b85d2624.jpeg

点击文末“阅读原文”

获取全文完整代码数据资料。

本文选自《R语言PLS-DA模型分析不同中医组别患者间差异指标数据可视化》。

db78c3cf83ef2794ab144c9638e256f6.jpeg

c767c297cc2ddb4ad425390bfdf607b7.png

点击标题查阅往期内容

R语言实现偏最小二乘回归法 partial least squares (PLS)回归

 R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归

R语言Lasso回归模型变量选择和糖尿病发展预测模型

R语言实现贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析

Python贝叶斯回归分析住房负担能力数据集

Python用PyMC3实现贝叶斯线性回归模型

R语言区间数据回归分析

R语言用LOESS(局部加权回归)季节趋势分解(STL)进行时间序列异常检测

PYTHON用时变马尔可夫区制转换(MRS)自回归模型分析经济时间序列

R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析

基于R语言实现LASSO回归分析

Python用PyMC3实现贝叶斯线性回归模型

使用R语言进行多项式回归、非线性回归模型曲线拟合

R语言中的偏最小二乘回归PLS-DA

R语言生态学建模:增强回归树(BRT)预测短鳍鳗生存分布和影响因素

R语言实现偏最小二乘回归法 partial least squares (PLS)回归

Matlab中的偏最小二乘法(PLS)回归模型,离群点检测和变量选择

偏最小二乘回归(PLSR)和主成分回归(PCR)

d69bd89d3d394a7ec6e06252311d72dc.png

f74c71a09edb83091a6ace33404a8f01.jpeg

efb73ee8d6228fb098f7f920c6d6acd2.png

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/article/detail/44597
推荐阅读
相关标签
  

闽ICP备14008679号