基于卷积自编码器高斯混合模型的健康数据检测方法
成果类型:: 实用新型专利
发布时间: 2022-07-01 10:57:22
本发明公开了一种基于卷积自编码器高斯混合模型的健康数据检测方法,属于医疗保健技术领域。所述方法采用了自适应、非线性、多层编码的方式将多维数据转为低维特征表示,有效避免了由于“维度灾难”导致的计算开销大而降低检测准确性的问题;该方法性针对人体活动数据的多阶段的特性,加入了卷积与反卷积神经网络层,有效识别并提取数据特征,进一步地提高了检测的精度;本发明将降维过程和密度估计过程有机地结合在一起,避免了两模型独立导致陷入局部最优的窘境;同时考虑到矩阵的奇点问题,协方差矩阵的逆可能会无法求解的问题,利用混合概率、均值和协方差来构造协方差矩阵的cholesky分解,以计算样本密度避免了无法求解的问题⊙
可选的,所述原始高维健康数据包括但不限于消耗的卡路里、步数、距离、高度、静息 心率、睡眠心率、运动心率、轻运动心率、运动心率、久坐时间、有氧运动时间、有氧运动消耗卡路里、燃烧脂肪、睡眠效率、睡眠时间、入睡时间、睡眠开始时间、睡眠结束时间、 深睡时间、轻度睡眠时间、REM睡眠时间和醒来次数。
可选的,所述方法在将采集到的原始高维健康数据在卷积自编码器上进行训练之前还包 括:
对原始高维健康数据进行预处理:利用多重插补的方式处理健康数据缺失值问题并采用 min-max归一化处理原始高维健康数据;
根据下式对原始高维健康数据进行归一化处理:
1≤e≤N,其中N表示样本个数 (1)
其中xe表示每条原始高维健康数据中任一维度数据,xmin与xmax分别表示该任一维度数 据中的最小值与最大值,xe′表示归一化处理后的数据。
随着现代经济的不断发展,人们对自身的健康状况也越发重视,因此日常生活中对自身 的一些健康数据越来越留意,越来越多的人开始使用一些可监测睡眠数据、运动步数以及静 息心率的可穿戴设备,比如手环。同时若是在就医时,病患能够提供其个人日常健康信息, 将大大地加快诊断速度、提高诊断质量。尤其对于睡眠障碍,阻塞性睡眠呼吸暂停综合症等 慢性病,若是能够根据日常健康数据提前对此类慢性病进行筛查和监测将是整个医疗领域的 一大进步。
可穿戴设备由于其功能性、便携性、价格亲民性的特点,自从2010年以来,在我们的 生活中已经随处可见。但是目前的可穿戴设备仅仅是能够记录睡眠数据、运动步数以及静息 心率等数据,对数据的分析仅仅停留在表面,无法对其进行更深一步的分析处理;比如根据 监测到的用户睡眠时长简单粗暴的判断出佩戴者的睡眠质量。
如果可穿戴设备能够将所监测到日常健康数据进行深度有效分析,以判断用户是否存在 患有某种疾病的风险,尤其是前述提到的一些慢性病,那么将会对监控人们身体健康状况起 着关键性的作用。
但现有的能够对健康数据进行深度分析检测的方法中,如果要达到较高的检测精度通常 都需要很大的计算开销,比如基于高斯混合模型(Gaussian Mixture Model,GMM)的异常 数据监测方法,虽然其性能明显由于K-means和LOF等异常检测算法,但其检测效果在很 大程度上取决于聚类精度,而对大数据进行聚类操作不可避免的要遇到计算开销大的问题。 如果为了适应可穿戴设备,那么需要一种计算开销小,检测精度高的算法,需要在保证检测 精度的前提下降低时间复杂度。
江南大学是教育部直属、国家“211工程”重点建设高校和“双一流”建设高校。学校具有悠久的办学历史、厚重的文化积淀,源起1902年创建的三江师范学堂,历经国立中央大学、南京大学等发展时期;1958年南京工学院食品工业系整建制东迁无锡独立建校,成立无锡轻工业学院;1962年无锡纺织工学院并入无锡轻工业学院;1995年更名为无锡轻工大学;2001年无锡轻工大学、江南学院、无锡教育学院合并组建江南大学;2003年东华大学无锡校区并入江南大学。
(1)本发明采用了自适应、非线性、多层编码的方式将多维数据转为低维特征表示, 有效的避免了由于“维度灾难”导致的计算开销大而降低检测准确性的问题。
(2)本发明针对人体活动数据的多阶段的特性,加入了卷积与反卷积神经网络层,可 以有效的识别并提取数据特征,进一步地提高了检测的精度。
(3)本发明将降维过程和密度估计过程有机地结合在一起,避免了两模型独立导致陷 入局部最优的窘境;同时考虑到矩阵的奇点问题,协方差矩阵的逆可能会无法求解。因此, 利用混合概率、均值和协方差来构造协方差矩阵的cholesky分解,以计算样本密度。
科技成果只有通过实施开发应用,使其转化为生产力,才能取得经济效益和社会效益。成果方目标是将科技成果转化为现实生产力,期待有意愿的企业或合作单位进行合作推广或者进行产品生产。考虑合作转化、许可+合作等转化方式与企业、科学技术研究开发机构和其他组织建立合作关系。