您的当前位置:首页正文

一种基于数据集距离评价样本集划分质量的方法[发明专利]

2023-12-03 来源:品趣旅游知识分享网
专利内容由知识产权出版社提供

专利名称:一种基于数据集距离评价样本集划分质量的方法专利类型:发明专利

发明人:林兆洲,王大仟,张金霞,关竹君,姜迪申请号:CN201911300236.6申请日:20191216公开号:CN111191884A公开日:20200522

摘要:本发明公开了一种基于数据集距离评价样本集划分质量的方法,该方法可克服常规基于误差分析有量化、难评价的缺陷,紧紧抓住训练集和测试集需相互独立且来自同一分布这一基本假设,通过对样本间距离矩阵的分解,估计样本集的均值和方差,计算训练集和测试集两个分布之间的距离。用随机抽样得到的距离分布进行概率分布估计,计算不同划分的概率,以确切的量化指标评价数据划分的质量或划分方法对特定数据的适应性。本发明在简单实用的基础上,给出样本集划分方法有效性的评价,为帮助生物医学领域的研究者选择合适的数据划分方法,明确建模方法的真实泛化性能提供适宜的方法。

申请人:首都医科大学附属北京中医医院

地址:100010 北京市东城区美术馆后街23号

国籍:CN

代理机构:北京慕达星云知识产权代理事务所(特殊普通合伙)

代理人:曹鹏飞

更多信息请下载全文后查看

因篇幅问题不能全部显示,请点此查看更多更全内容