赞
踩
公众号:川川菜鸟
题目背景明确,智慧医疗建设是新质生产力在卫生健康领域的着力点,新质生产力是助力智慧医疗建设的重要手段。直接来看题目。
数据集说明:
针对康复医学科一病房,以日期、患者人数、药品总收入、当日病房收入为基础输入数据,构建2个不同类型的时间序列预测模型,分别预测对应的门诊收入数据,目标为表中这个科室空白的数据。
由于题目是多变量数据,因此可以使用LSTM、VAR、Prohet等进行预测。
以日期、患者人数、药品总收入、当日病房收入变量,预测门诊收入。
①对样本进行缺失值、异常值探究
②进行特征工程:从原有特征生成新交互特征【可选】
③构建模型:LSTM、VAR、Prohet等模型
④调参:贝叶斯搜索、随机搜索、网格搜索等
⑤训练集划分:留出法、K折交叉验证、K折随机交叉验证等。
针对康复医学科二病房,以日期、患者人数、药品总收入、当日病房收入为基础输入数据,构建2个不同类型的时间序列预测模型,分别预测对应的门诊收入数据,目标为表中这个科室空白的数据。
由于题目是多变量数据,因此可以使用LSTM、VAR、Prohet等进行预测。
以日期、患者人数、药品总收入、当日病房收入变量,预测门诊收入
①对样本进行缺失值、异常值探究
②进行特征工程:从原有特征生成新交互特征【可选】
③构建模型:LSTM、VAR、Prohet等模型
④调参:贝叶斯搜索、随机搜索、网格搜索等
⑤训练集划分:留出法、K折交叉验证、K折随机交叉验证等。
结合上述两个模型,构建集成学习模型,针对康复医学科三病房,预测对应的门诊收入数。
据。已提供的三病房数据可作为集成学习模型微调训练的基础数据。
使用前述预测模型的结果作为输入,比如LSTM和VAR,构建集成学习模型,采用多种集成方法(如Bagging、Boosting、Stacking)提升预测性能。
以日期、患者人数、药品总收入、当日病房收入变量,预测门诊收入。
①对样本进行缺失值、异常值探究
②进行特征工程:从原有特征生成新交互特征【可选】
③构建模型:前述预测模型的结果作为输入,采用多种集成方法(如Bagging、Boosting、Stacking)提升预测性能。
④调参:贝叶斯搜索、随机搜索、网格搜索等
⑤训练集划分:留出法、K折交叉验证、K折随机交叉验证等。
一般采用留出法。如想出彩,可采用k折交叉验证、随机k折交叉验证等方法。
因为是定量的预测,因此可采用MSE,RMSE等进行评价。
除了题目给出的数据,可以考虑生成新特征进行预测。这样最大程度的融合信息,预测准确。具体效果需要尝试对比。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。