当前位置:   article > 正文

2024钉钉杯B题详解

2024钉钉杯b题

公众号:川川菜鸟

  题目背景明确,智慧医疗建设是新质生产力在卫生健康领域的着力点,新质生产力是助力智慧医疗建设的重要手段。直接来看题目。
数据集说明:
在这里插入图片描述

问题一

1.1 问题

针对康复医学科一病房,以日期、患者人数、药品总收入、当日病房收入为基础输入数据,构建2个不同类型的时间序列预测模型,分别预测对应的门诊收入数据,目标为表中这个科室空白的数据。

1.2 模型

由于题目是多变量数据,因此可以使用LSTM、VAR、Prohet等进行预测。

1.3 目标

以日期、患者人数、药品总收入、当日病房收入变量,预测门诊收入。
在这里插入图片描述

1.4 思路

①对样本进行缺失值、异常值探究
②进行特征工程:从原有特征生成新交互特征【可选】
③构建模型:LSTM、VAR、Prohet等模型
④调参:贝叶斯搜索、随机搜索、网格搜索等
⑤训练集划分:留出法、K折交叉验证、K折随机交叉验证等。

问题二

2.1 问题

针对康复医学科二病房,以日期、患者人数、药品总收入、当日病房收入为基础输入数据,构建2个不同类型的时间序列预测模型,分别预测对应的门诊收入数据,目标为表中这个科室空白的数据。

2.2 模型

由于题目是多变量数据,因此可以使用LSTM、VAR、Prohet等进行预测。

2.3 目标

以日期、患者人数、药品总收入、当日病房收入变量,预测门诊收入
在这里插入图片描述

2.4 思路

①对样本进行缺失值、异常值探究
②进行特征工程:从原有特征生成新交互特征【可选】
③构建模型:LSTM、VAR、Prohet等模型
④调参:贝叶斯搜索、随机搜索、网格搜索等
⑤训练集划分:留出法、K折交叉验证、K折随机交叉验证等。

问题三

3.1 问题

结合上述两个模型,构建集成学习模型,针对康复医学科三病房,预测对应的门诊收入数。
据。已提供的三病房数据可作为集成学习模型微调训练的基础数据。

3.2 模型

使用前述预测模型的结果作为输入,比如LSTM和VAR,构建集成学习模型,采用多种集成方法(如Bagging、Boosting、Stacking)提升预测性能。

3.3 目标

以日期、患者人数、药品总收入、当日病房收入变量,预测门诊收入。
在这里插入图片描述

3.4 思路

①对样本进行缺失值、异常值探究
②进行特征工程:从原有特征生成新交互特征【可选】
③构建模型:前述预测模型的结果作为输入,采用多种集成方法(如Bagging、Boosting、Stacking)提升预测性能。
④调参:贝叶斯搜索、随机搜索、网格搜索等
⑤训练集划分:留出法、K折交叉验证、K折随机交叉验证等。

四、一点想说的

4.1 数据集的划分

一般采用留出法。如想出彩,可采用k折交叉验证、随机k折交叉验证等方法。

4.2 准确性的衡量

因为是定量的预测,因此可采用MSE,RMSE等进行评价。

4.3 特征选择

除了题目给出的数据,可以考虑生成新特征进行预测。这样最大程度的融合信息,预测准确。具体效果需要尝试对比。

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号