简介:相似文档搜索指检索与给定查询文档相似的文档,在大数据处理中具有广泛的应用,如近似网页检测、新闻报道聚合以及抄袭检测等。为实现海量相似文档的快速搜索,可采用Simhash指纹方法将文档映射成二进制指纹,以海明距离表达文档相似度,并通过指纹分段建立索引提高计算效率。针对传统方法在指纹分段过程中大量冗余计算影响到计算效率的问题,提出了基于顺序匹配的候选集筛选方法,以减少指纹相似性计算量和网络带宽消耗,实现快速搜索。试验表明,该方法具有较好的性能和可扩展性。
简介:杀伤链方法可以用来分析武器和系统的作战有效性。随着科技的进步,时敏目标在战争中越来越多。无人机在打击时敏目标方面具有固有的优势。作者分析了无人机如何优化时敏目标的打击链,如缩短发现耗时,决策耗时,平台交互耗时和交战耗时。另外,在打击时敏目标的过程中,无人机还能够提高抗反击能力和成功概率。
基于Simhash的海量相似文档快速搜索优化方法
无人机在优化时敏目标杀伤链中的作用研究