07-12中师姐给我的参与者里面和后续有交集的有2714个,在07-18这12年都坚持体检的,有825个人; 2714个人中,患病的:96,正常的:2618; 825个人中,患病的:38,正常的:787.
1 得到07-12 和13-18 都有的数据
G:\fw2\new_data\07-12-overlap\
2 先拿到每一年必要特征的数据
G:\fw2\new_data\中山大学\07-12_for_train:.txt 是提取了指定特征的, csv 数据是汉字转为数字的,1.csv 是填充了空缺值的
vae 中的重建分数: https://www.kaggle.com/hone5com/fraud-detection-with-variational-autoencoder