简介:Tri—Training是半监督协同训练的代表性算法之一,它运用统计技术标记置信度,并结合噪音学习理论进行无标记样本分类。当扩充样本训练集不满足噪音学习理论时,会进行随机采样,针对传统Tri-Training算法随机选取基础分类器的扩充训练样本集会引入噪声这一缺陷,通过更改扩充样本训练集选取方式,剔除可能提高分类误差的样本。在健康大数据集上进行一系列验证试验,实验结果表明,改进的算法优于原始算法,降低分类错误率。
简介:于复杂的数据库进行快速调度,不仅需要多服务器合作,同时也可能涉及多个数据库之间的数据筛选与查找,而问题的难点在于,不同的数据库在计算机语句设置方面也是不同的,这就意味着查询和筛选的规则以及具体的语言逻辑存在着差异性,这种差异也会影响数据有效调度的效率。基于以上问题,笔者提出一种新的数据库调度方法,其主要基于数据相互混沌的特征,实现复杂数据库的调度。通过并行数据调度技术与混沌优先级因子两种方式的有机结合投入到具体的寻优调度计算中,不仅能够快速将混沌特征进行获取,同时能够结合时间序列计算出具体的数据节点的任务量,最终建立优化模型。结果表明,这一改进模型对于复杂数据库的数据调度有一定的积极作用。