一、一种基于直接选择排序算法的改进(论文文献综述)
王丹阳[1](2020)在《基于空气质量数据的多模式可视化系统的设计与实现》文中认为随着大数据时代的到来,各行各业都十分关注对繁杂无序数据的分析处理及友好展示。数据可视化是一种按照一定规则,针对不同类型数据的特点,通过图表、图谱或交互式展示等方式对数据进行清晰直观展示的技术。可视化技术还有通过动画动态效果突出再现数据变化的连贯性和其内在联系的展示方式。如何对不同类型的、时变性的空气质量数据进行可视化展示,以辅助后续数据变化规律分析及趋势展示是本论文工作的主要内容。对于图像类型的空气质量数据,利用计算机视觉相关技术对其进行处理,进而实现可视化展示是一个非常值得探索的工作,深度学习在近年机器学习领域中的图像识别方面卓有成效,本论文着重讨论了将计算机视觉、深度学习模型等技术与采集的数据相结合,并进行数据可视化。论文将计算机视觉中的图像配准算法、图像模糊处理算法以及多阶段动态生成式对抗网络模型,运用到图像类型数据的动态可视化当中,通过对图像配准算法、图像模糊处理算法的分析,设计实现了一种基于静态离散图像生成动态延时影片的方案,并对多阶段动态生成式对抗网络模型的效果进行了验证。此外,论文还结合Web前端技术,对文本类数据进行动画效果可视化的设计实现,将一定时间区间内多区域的大量空气质量数据进行量级排名,并将结果及其变化进行动态展现,也设计实现了一种静态统计图表来展现文本类数据的对比情况及各自变化趋势。论文所描述的多模式可视化系统,实现了静态离散图像类数据的动态可视化展示,再现了一段时间内固定站点处的空气质量变化情况,弥补了单张离散图像展示内容非连续且片面的不足;系统还实现了空气质量文本类数据的动态和静态模式的可视化展示,完成了对不同类型数据的直观清晰呈现。
王龙[2](2020)在《多特征与注意力机制相结合的答案选择排序研究》文中认为答案选择排序作为问答系统中重要的组成部分,其策略的好坏是保证问答系统质量的关键。答案选择排序任务是对与问题相关的多个答案按照相似度从高到低排序,目的是选出最佳答案。本文针对答案选择排序这一问题,提出了一种将多种神经网络与多种特征信息及注意力机制相融合的模型。通过Word2vec工具分别对问题和候选答案进行词向量表示,将问题和候选答案的词向量结合并送入卷积神经网络进行学习,同时对卷积神经网络做出改进,引入Leaky-Re LU激活函数及2-Max Pooling池化操作,采用拼接的方式将学习结果与词汇特征、主题特征相结合,其中词汇特征由Stanford Core NLP工具训练语料生成、主题特征从数据集中提取,得到的拼接向量作为双向门控循环单元的输入部分,将正向和反向的输出结果组合后送入多层感知器进行处理,处理结果通过Softmax分类器得出最终选择排序结果。在某些情况下,存在候选答案中的某个或某几个单词对答案选择排序起到关键作用的可能性,因此为了捕获候选答案中相对有用的信息,在模型中又引入注意力机制。通过在特征拼接部分加入Attention项的方法使模型聚焦在重要信息区域,该Attention项是在问题和候选答案之间的对齐关系的基础上引入加性、点积、缩放点积、双线性四种常用的注意力模型而生成的。实验结果表明本文所提的新模型能够显着提高答案选择排序方面的准确率,该模型在微软公司2015年公开的Wiki QACorpus数据集上运行的准确率达到80.86%,较基线模型和自对比模型相比均有所提高。
崔润东[3](2020)在《基于多索引的实时实体解析与关键词查询处理》文中进行了进一步梳理传统的关键词Top-N查询技术大多基于干净数据集,难以直接用于脏数据集。脏数据集中可能存在大量包含拼写错误、空值或重复的记录,直接查询难以得到可靠的结果,从而影响后续决策分析的准确性甚至得到错误的结论。传统实体解析技术识别与合并脏数据集中的重复记录,从而得到一个干净数据集,但是其耗时大且难以直接与查询算法相结合,所以有必要研究实时实体解析技术并且设计有效的分块索引和算法,使其可以在亚秒级时间内完成一条记录的解析。针对包含重复、拼写错误或空值等类型的脏数据,本文研究实时实体解析和关键词Top-N查询技术。本文的主要工作包括:(1)针对数据集中的多个属性建立多个索引,每个索引根据相应属性值的特征使用不同的索引结构,包括哈希索引、跳跃表索引以及B+树索引等,用来对数据集进行划分。基于多个索引构成全局索引来协同检索候选元组。(2)设计基于多索引的实时实体解析相应的排序函数与算法。排序函数以编辑距离为基础,利用元组间相同属性值的数目以及属性值长度等因素来判断两元组是否指向同一实体。所设计的算法通过对数据集进行分块,减少候选元组的数目,从而提高实体解析效率。同时避免不必要的计算,以减少实体解析的时间,使其可以在亚秒级时间内解析一条记录。(3)基于多索引,设计两种关键词Top-N查询算法来对脏数据集进行查询处理。一种是基于实体解析结果的关键词查询,另一种是融合实时实体解析的关键词查询。同时利用元组属性的数目、属性的重要程度、查询词的匹配数目等因素设计排序函数,对关键词查询结果进行排序。本文基于真实数据合成了多个有着不同规模、重复次数、拼写错误或空值的脏数据集。通过在这些脏数据集上进行大量实验,验证了本文所提出的实体解析算法与关键词查询算法的有效性与高效性。
崔家源[4](2020)在《基于注意力机制的答案选择排序研究》文中研究表明搜索引擎的使用方便了人们的生活,但其查询结果仍需要人工筛选。给定一个问题,如何精准地获取正确答案显得至关重要。答案选择排序是解决该问题的一个切入点,其关键就是问题答案句子之间的语义相似度计算。在语义相似度计算方法一定的条件下,问题答案句子之间的语义相似度主要取决于问题答案句子内部的语法语义信息以及问题答案句子之间的语义信息。本课题基于语义相关度距离概念假设,构建新的答案选择排序模型,并且从以上两个方面提升模型性能。本课题研究的主要贡献如下:1.提出了问题答案句子语义相关度距离的概念假设,详细诠释了如何将候选答案集合中的正确答案和错误答案区分开,从而把正确答案选择出来。然后,依据该理论构建了新的答案选择排序模型。2.针对答案选择排序任务,使用统计和深度学习相结合的方法提取句子词性特征。先使用深度学习模型进行句子上下文语义捕获,再使用统计模型进行标注并解决未登录词的标注问题。然后通过集成两种模型的优势进行高效地词性特征提取,并进行实验性能验证。最后将问题答案句子词性特征与排序模型融合,增强问题答案句子内部语法语义信息。3.通过词性与原始语料融合后的语义引入注意力机制。区别于针对原始语料或者问题答案句子某一特征进行的注意力矩阵构造等已有的注意力使用方法,本文先将词性与原始语料进行融合,再运用融合后的向量构造注意力矩阵,进而融合到排序模型之中,增强问题答案句子之间的语义信息。基于以上研究,本文排序模型在NLPCC 2017 DBQA问答数据集进行实验。结果表明,本文基线排序模型融合词性和注意力之后,其MAP、MRR和ACC@1三个性能指标分别达到79.34%、79.42%和70.13%,明显高于其他排序模型的性能,从而验证了本课题排序模型理论假设的正确性及模型的合理性、有效性和先进性。
罗康洋[5](2020)在《基于支持向量机的高维不平衡数据集分类算法及其应用研究》文中研究表明随着计算机存储与数据采集技术的高速发展,基因组学、财务预警、文本分类、客户流失预测和垃圾邮件识别等应用领域产生的海量数据呈现出高维和类不平衡的双重特性。在将这些高复杂度的数据集转化为具有应用价值的信息时,传统机器学习和数据挖掘技术面临着严峻的挑战。基于此,本文针对高维不平衡数据分类面临的困难,研究了如下内容:第一,针对数据集的类不平衡问题,本文提出了循环采样算法FTL-SMOTE。现有的传统过采样技术仅从数据的统计特征出发对数据进行平衡化处理,与后续的分类算法无关,这导致平衡化后的数据集可能不适用于分类器。因此,该算法将SVM分类器的分类结果考虑进了采样过程,即在SVM分类器监督的情况下,基于SMOTE采取不同策略对分类正确和错误的少数类样本进行精确化的循环采样。此外,为了避免噪声样本对采样过程的干扰,本文提出了噪声样本识别三原则对噪声样本进行精确识别并在采样过程中予以剔除。大量数值结果显示,与经典的SMOTE等重要采样算法以及标准SVM相比,FTL-SMOTE过采样算法具有更好的分类效果。第二,针对数据集的高维不平衡问题,本文提出了FTL-SMOTE+ISVM-RFE(FPD)组合模型。首先,为克服数据集的类不平衡问题,采用FTL-SMOTE算法对数据集进行平衡化处理;然后,在平衡化后的数据集上,本文提出了新的嵌入过滤型准则的封装型特征选择算法ISVM-RFE(FPD)。该算法是从特征选择排序准则和特征选择过程两方面对经典的封装型特征选择算法SVM-RFE的改进。在四个公开的癌症微阵列数据集上的大量实验表明,ISVM-RFE(FPD)算法在rrp和G值方面优于SVM-RFE算法以及现有的嵌入过滤型准则的封装型特征选择算法。第三,本文研究了FTL-SMOTE+ISVM-RFE(FPD)组合模型在上市公司财务预警问题中的应用。伴随全球经济一体化和市场经济的快速发展,我国上市公司财务预警数据呈现出高维和类不平衡的双重特性。为了验证提出算法在该类数据集中的有效性,本文构建了两个新的财务预警组合模型ISVM-RFE(FPD)+MKSVM和ISVM-RFE(FPD)+CSMKSVM,并在第一个和第二个模型中的特征选择过程中以及在第一个模型的分类过程中引入过采样算法FTL-SMOTE。大量实证研究表明,本文提出的组合模型在降维和分类方面优于其他组合模型,其中ISVM-RFE(FPD)+CSMKSVM模型的表现最佳。
王晓琳[6](2020)在《面向需求的回归测试下测试用例优先排序技术研究》文中指出回归测试是软件测试的一个重要环节。随着测试版本不断增加,如何提高回归测试效率成为软件测试的重点和难点。本文以需求为出发点,重点研究回归测试优化的一个主要内容:测试用例优先排序。传统测试用例优先排序技术大多是无反馈或无记忆技术,即每次排序为独立排序。随着软件复杂度不断增高,传统测试技术基本达到瓶颈,如何在多元化的软件工程中继续提高回归测试效率降低开销已成为软件测试研究领域亟待解决的问题。针对回归测试下测试用例优先排序效率问题,本文提出一种面向需求的基于测试历史信息的测试用例优先排序技术。该技术将需求信息、错误反馈信息及历史信息三者结合,考虑整个回归过程对测试的不断影响,为每一个测试用例赋予执行概率。执行概率大的测试用例优先执行。通过实验表明,在多轮回归测试场景下,面向需求的基于历史信息的测试排序技术相比其他传统无记忆的排序技术,在纠错速率上更有优势。针对具体的敏捷开发环境场景,本文扩展面向需求的基于历史信息的测试排序技术,提出一种基于敏捷开发环境的面向需求的回归测试优化技术。首先,分别针对当前版本和已发布版本的回归测试设计敏捷优先排序和敏捷测试选择。敏捷优先排序扩展先前基于历史信息的测试排序技术,以新增功能为测试重点,分阶段进行优先排序,以提高纠错速率;敏捷测试选择从以往测试纠错和需求关联出发,筛选失效测试用例和交互测试用例作为子集,以减少测试序列长度。其次,将二者结合设计回归测试优化模型及优化算法。实验证明,在敏捷开发这种特定场景中,与现有的传统优先排序技术、测试选择技术及二者的混合技术相比,本文所提的回归测试优化技术既可达到高错误检测率,又可减少待执行测试用例数量,同时保证较高的安全性。在测试用例优先排序问题的研究上,传统排序方法存在“先排序后执行”的特点。一旦排序确定,在测试执行过程中不会再改变测试序列的顺序。这样,执行阶段产生的反馈信息不能在本轮测试排序中使用,只能被用于下次测试当中。针对执行阶段错误反馈信息滞后使用问题,本文提出一种面向需求的基于聚类的自适应测试用例排序调整技术。该技术基于聚类分析理论设计测试用例的聚类准则,在测试执行之前对测试用例进行聚类,并利用传统优先排序技术对测试用例进行预排序得到有序序列。随后按序执行测试用例。当执行中遇到有测试用例揭露错误时,自适应对剩余未执行的测试用例进行排序调整。通过实验表明,与传统优先排序技术及基于聚类的排序技术相比,本文方法在错误揭露速率上表现更优;与其他自适应排序技术相比,本文方法虽在平均错误揭露百分比上与对比方法相差无几,但在执行时间上花费更少;通过对不同的差异性度量进行比较,在相关性度量下,本文方法具有更好的表现,且如果在本文方法中选择total策略进行优先级处理,将会更好地发挥相关性度量的作用。目前,大多数测试用例优先排序技术都是基于一个目标准则对测试用例计算优先级。然而,随着软件日益复杂多样,多种影响测试排序效率的目标因素逐渐被广泛关注,传统的单目标优先排序技术已不能满足多目标影响下的综合测试效率。针对单目标排序的局限性,本文借助多目标问题优化处理方法,提出一种基于多目标测试用例优先排序技术。该技术选取五种目标准则作为目标函数,在每一个目标维度里,计算测试用例优先级,并将优先级进行归一化处理。加权求和单目标优先级,得到测试用例基于多目标的优先级。最终根据多目标优先级排列测试用例。实验表明,在统一的度量标准下,基于多目标的排序技术相比其他单目标技术表现较优。因此,在实际应用中,可考虑将其作为一种新型排序技术。
梁旭[7](2019)在《基于增强现实的中学信息技术教学资源的开发 ——以查找排序算法为例》文中进行了进一步梳理增强现实技术在教育领域的应用是近些年教育技术研究的热点。增强现实技术是将虚拟物体叠加在现实环境中,创设虚实融合的学习情境,将一些很难直接观察到的现象显示出来,通过对虚拟对象的一些操作和测量能够得到自然规律的认识,能很好的促进学习效果。浙江、上海地区明确将《信息技术》加入高考选考科目,由于中学生初次接触编程,用传统教学方法进行编程、算法的教学,在接受理解上存在一定难度。本研究试图应用虚拟现实的增强现实技术,对高中信息技术课程中的一些重点算法—如排序算法等,进行3D显示的设计和实现,探讨了算法的内在机理,从理论和实践上阐述了其应用于教育的优点。本文首先介绍了沉浸理论、认知负荷理论和建构主义学习理论,根据以上三种理论提出了开发增强现实教学资源——“比特工厂”的依据。其次,从主题思想、功能、设备要求和内容方面进行了前端分析。然后,从情境创设、三维动画和识别图三方面进行设计。最后,利用Cinema 4D、Unity 3D和Vuforia开发了“比特工厂”。“比特工厂”针对高中课标要求的冒泡排序、选择排序、顺序查找和对分查找算法,通过三维立体图像将编程中数据的变化过程直观显示出来。借助学生未曾接触过的增强现实技术,调动学生学习积极性,同时降低认知负荷。本研究希望通过探索利用增强现实技术解决信息技术教学问题,为广大教育工作者提供参考。
徐山珊[8](2019)在《基于Spark的无线城市社团发现算法研究》文中认为针对传统的社团发现算法存在生成结果冗余、复杂度高、大量迭代计算、没有考虑地理位置信息等问题,提出一种改进的社团发现算法SIACD(on Spark use Improved Apriori to achieve Community Detection algorithm),通过改进关联规则算法在Spark集群上挖掘无线城市中的社团数据。首先,为解决传统的社团发现算法未考虑地理位置信息的问题,SIACD算法选用无线城市中MAC地址数据,并将该数据映射到布尔矩阵中进行数据预处理。其次,为解决传统的社团发现算法复杂度高及大量迭代计算的问题,SIACD算法利用基于项数的布尔向量交运算改进Apriori算法,减少非关键计算。最后,SIACD算法利用Spark基于内存计算的特性,在Spark集群平台上实现该算法的并行化计算。实验结果表明,传统的社团发现算法及Apriori算法均不满足大数据时代对计算速度的要求,SIACD算法能有效挖掘社团成员的频繁项集,具备可扩展性及并行化性能,解决了生成结果冗余、复杂度高、迭代计算等问题,对大数据的处理能力和计算效率更好。SIACD算法性能优势明显,降低了计算时间,提升了社团发现的挖掘速度,提高了对社团数据的处理能力。该论文有图22幅,表9个,参考文献56篇。
宗炜雯[9](2019)在《抽象测试用例集优化排序的改进算法研究》文中研究指明随着软件系统功能的多样化与复杂化,影响系统的因素也越来越多,这些因素统称为参数,如系统的配置参数、用户触发的事件等。同时这些参数都有一些相同或者不同数量的可选值或可选项。根据用户的不同输入,会形成一个指数级增长的测试用例集。由于测试用例数量巨大,测试人员需要从中有选择性的挑选出一部分来进行测试,同时保证被测试程序中的错误能被有效的发现。其中随机测试是最简单的一种方法,相应的其错误检测率能力也很一般。因此,找到一个能够对测试用例集进行优化排序以此筛减测试用例同时还能提高错误检测率的方法显得十分迫切。抽象测试用例集的优化排序算法就是一种能更早的找到能对软件系统的错误进行定位和修复的测试用例的方法。研究发现,这样的测试用例有一个特点,总是覆盖最多未被覆盖的n维参数组合。基于这一理论,R.C.Bryce等人提出了基于交互组合覆盖的抽象测试用例集优化排序算法(Interaction Test Suite Prioritization,ITSP),果然错误检测效果显着提高。基于ITSP,陆续又有人提出了基于固定组合覆盖力度的抽象测试用例集优先化排序算法(Fixed-strength Interaction Coverage Based Prioritization,FICBP),这是目前基于交互组合覆盖的测试算法中效果最好的算法之一。该算法的主要思想是固定一个合适的组合覆盖力度t,每次总是优先选择覆盖最多未被覆盖的t维组合的测试用例赋予它当前最高的优先级。本文分析了该算法后,并针对该算法的缺点和不足提出了两点改进并且对改进后的两个算法进行了实验分析。最后在这两个算法和FICBP算法的基础上实现了一个原型系统,用来进行实验对比和验证。本文主要完成的工作阐述如下:1、针对FICBP算法在选择高维度进行组合覆盖时,其错误检测率高但是时间开销过大的问题,提出了基于重复一维组合覆盖的抽象测试用例集优化排序算法(Prioritizing Interaction Test Suites using Repeated Base Choice Coverage,FICBPR)。FICBPR算法的核心思想是重复使用一维覆盖直至待测集合为空。具体的,FICBPR总是优先选择覆盖最多未被覆盖的一维组合的测试用例,当一维组合全部被覆盖后,重置所有一维组合的覆盖情况,继续先前的步骤。实验结果表明,本文提出的FICBPR算法在保持错误检测的同时,大大降低了优先级排序所需的时间开销。在许多情况下,该方法可以获得与基于组合覆盖力度t为2的FICBP算法相似的结果,在高维组合覆盖力度下获得相较于FICBP算法更稳定的结果。2、基于工作内容1中的FICBPR算法的不足之处,提出基于一维权重的抽象测试用例集优化排序方法(FICBPW)。研究发现目前提出的算法普遍存在一个缺陷,一旦已被选中的测试用例覆盖了全部t维组合后,一般选择重置组合空间的覆盖或者保留组合空间的覆盖,这一过程要么丢掉了之前组合空间的覆盖,要么后期所有测试用例的组合覆盖都一样,因而当前的算法每次得到的结果仅仅是一个局部最优解而不是全局最优解。针对这个问题,本文提出了权重的概念,通过对组合空间的覆盖情况进行累加,每次选取总权重最大的测试用例,直至结束。实验结果表明,本文提出的FICBPW算法,在时间开销相近的情况下其错误检测率都高于FICBPR算法,且获得与基于组合覆盖力度t为3、4时候的FICBP算法相似的错误检测率。3、设计并实现了一个抽象测试集优化排序原型系统ATCSY。该原型系统包含了算法设置模块、被测程序设置模块、结果分析模块。最后,通过不同的程序验证算法的有效性。
王锦坤[10](2019)在《浅析基于C语言的常用排序算法比较》文中指出作为计算机程序设计的重要操作,排序算法的优劣直接影响程序运行效率,因此文章开展了基于C语言的常用排序算法比较,明确了排序算法的基本选择思路,并结合实例深入探讨了基于C语言的排序算法应用,希望能够为相关业内人士带来一定启发。
二、一种基于直接选择排序算法的改进(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、一种基于直接选择排序算法的改进(论文提纲范文)
(1)基于空气质量数据的多模式可视化系统的设计与实现(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 论文主要内容 |
1.2.1 研究目标 |
1.2.2 研究内容 |
1.3 完成工作内容 |
1.4 论文组织结构 |
第二章 相关技术分析 |
2.1 数据可视化技术 |
2.1.1 数据可视化技术的三个特点 |
2.1.2 数据可视化技术的三种方向 |
2.1.3 Web端数据可视化技术的三类表示 |
2.2 图像处理技术 |
2.2.1 图像配准技术 |
2.2.2 图像模糊处理技术 |
2.3 生成式对抗网络模型GAN |
2.4 网络爬虫技术 |
2.4.1 网络爬虫的种类及策略 |
2.4.2 WebMagic爬虫框架 |
2.5 排序算法相关技术 |
2.6 本章小结 |
第三章 多模式可视化系统的算法设计与评估 |
3.1 图像配准算法的分析及对比 |
3.1.1 图像配准算法原理简析 |
3.1.2 基于特征点提取的图像配准算法分析与对比 |
3.1.3 实验结果展示 |
3.2 基于静态图像生成延时影片的算法分析 |
3.2.1 模型选择分析 |
3.2.2 模型评判指标及效果对比 |
3.2.3 论文场景应用分析 |
3.2.4 实验结果展示 |
3.3 图像模糊处理算法的对比及应用 |
3.3.1 三种图像模糊处理算法的对比及分析 |
3.3.2 实验结果展示 |
3.4 本章小结 |
第四章 多模式可视化系统的需求分析与概要设计 |
4.1 多模式可视化系统的总体需求分析 |
4.1.1 系统业务需求分析 |
4.1.2 系统数据需求分析 |
4.1.3 系统角色分析 |
4.2 多模式可视化系统的功能性需求分析 |
4.2.1 延时影片功能的需求分析 |
4.2.2 数据爬取功能的需求分析 |
4.2.3 动态排名功能的需求分析 |
4.2.4 统计图表功能的需求分析 |
4.3 多模式可视化系统非功能性需求分析 |
4.3.1 性能和稳定性需求 |
4.3.2 易用性需求 |
4.3.3 可靠性需求 |
4.4 多模式可视化系统的总体架构设计 |
4.4.1 系统结构及层次架构设计 |
4.4.2 系统总体流程活动图 |
4.5 多模式可视化系统功能的模块概要设计 |
4.5.1 延时影片模块的概要设计 |
4.5.2 数据爬取模块的概要设计 |
4.5.3 动态排名模块的概要设计 |
4.5.4 统计图表模块的概要设计 |
4.6 本章小结 |
第五章 多模式可视化系统的详细设计与实现 |
5.1 延时影片模块的详细设计与实现 |
5.1.1 延时影片数据准备及生成 |
5.1.2 延时影片展示 |
5.2 数据爬取模块的详细设计与实现 |
5.2.1 数据定时爬取 |
5.2.2 数据触发爬取 |
5.3 动态排名模块的详细设计与实现 |
5.3.1 数据提取 |
5.3.2 数据处理 |
5.3.3 数据动态展示 |
5.4 统计图表模块的详细设计与实现 |
5.4.1 数据读取及匹配 |
5.4.2 数据静态展示 |
5.5 本章小结 |
第六章 多模式可视化系统的测试 |
6.1 系统测试环境 |
6.2 系统总体功能的黑盒测试 |
6.3 系统功能展示 |
6.4 本章小结 |
第七章 总结与展望 |
7.1 工作总结 |
7.2 未来工作展望 |
参考文献 |
致谢 |
硕士攻读学位期间发表的学术论文目录 |
(2)多特征与注意力机制相结合的答案选择排序研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 研究现状 |
1.2.1 基于特征信息的机器学习方法 |
1.2.2 基于神经网络的深度学习方法 |
1.3 研究内容 |
1.4 论文结构 |
第二章 深度学习模型与特征选择 |
2.1 文本特征 |
2.1.1 词汇特征 |
2.1.2 对齐特征 |
2.2 卷积神经网络 |
2.3 长短时记忆网络及门控循环单元 |
2.4 感知器 |
2.5 激活函数 |
2.6 本章小结 |
第三章 融合多种神经网络与多特征的答案选择排序方法 |
3.1 融合多种神经网络的答案选择排序模型 |
3.1.1 词嵌入层 |
3.1.2 CNN Model层 |
3.1.3 融合层 |
3.1.4 Bi-GRUs Model层 |
3.1.5 MLP Model层 |
3.1.6 输出层 |
3.2 多特征融合 |
3.3 实验对比分析 |
3.3.1 实验数据集 |
3.3.2 数据预处理 |
3.3.3 超参数设置 |
3.3.4 防止过拟合策略 |
3.3.5 评价指标 |
3.3.6 实验对比 |
3.3.7 结果分析 |
3.4 本章小结 |
第四章 运用注意力机制改进答案选择排序模型 |
4.1 问题引出 |
4.2 融合多种神经网络与注意力机制的答案选择排序模型 |
4.3 ATTENTION项 |
4.4 实验对比分析 |
4.4.1 实验数据集 |
4.4.2 数据预处理 |
4.4.3 超参数设置 |
4.4.4 评价指标 |
4.4.5 实验对比 |
4.4.6 结果分析 |
4.5 本章小结 |
第五章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
攻读学位期间取得的科研成果 |
致谢 |
(3)基于多索引的实时实体解析与关键词查询处理(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.3 主要研究内容与创新点 |
1.4 论文的组织结构 |
第二章 问题定义与相关知识 |
2.1 问题定义 |
2.1.1 实体解析 |
2.1.2 关键词Top-N查询 |
2.2 文本相似度计算方法 |
2.2.1 TF-IDF |
2.2.2 海明距离 |
2.2.3 编辑距离 |
2.3 提升实体解析效率的方法 |
2.3.1 传统分块 |
2.3.2 有序邻居法 |
2.3.3 基于q-gram的索引方法 |
2.3.4 Canopy聚类 |
2.4 本章小结 |
第三章 多索引 |
3.1 多索引 |
3.1.1 全局索引 |
3.1.2 索引数量对效率的影响 |
3.2 索引结构 |
3.3 不同索引结构对效率的影响 |
3.4 S类候选元组 |
3.5 算法 |
3.6 本章小结 |
第四章 实体解析 |
4.1 实体解析流程 |
4.2 排序函数 |
4.2.1 编辑距离 |
4.2.2 基于编辑距离的排序函数 |
4.2.3 实体解析规则 |
4.3 提升实体解析效率 |
4.3.1 减少候选数目 |
4.3.2 避免冗余计算 |
4.4 算法 |
4.5 本章小结 |
第五章 关键词查询 |
5.1 排序函数 |
5.2 基于实体解析结果的关键词查询 |
5.3 融合实体解析的关键词查询 |
5.4 本章小结 |
第六章 实验分析 |
6.1 数据集与准备 |
6.1.1 原始数据集 |
6.1.2 干净数据集 |
6.1.3 脏数据集 |
6.1.4 生成查询集合 |
6.2实体解析实验 |
6.2.1 多索引的插入与查询时间 |
6.2.2 召回率与查准率 |
6.2.3 总比较次数 |
6.2.4 时间消耗 |
6.2.5 与朴素算法的比较 |
6.3关键词查询实验 |
6.3.1 索引构建时间 |
6.3.2 关键词查询时间 |
6.3.3 候选元组数目 |
6.3.4 影响基于ER结果的关键词查询算法的主要因素 |
6.3.5 影响融合ER的关键词查询算法的主要因素 |
6.3.6 与其他方法的比较 |
6.4 本章小结 |
第七章 总结与展望 |
7.1 本文总结 |
7.2 工作展望 |
参考文献 |
致谢 |
攻读学位期间取得的科研成果 |
(4)基于注意力机制的答案选择排序研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究的背景和意义 |
1.2 研究现状 |
1.2.1 词性特征提取 |
1.2.2 注意力机制 |
1.2.3 答案选择排序 |
1.3 研究内容 |
1.4 研究方案 |
1.5 文章组织结构 |
第二章 相关技术概述 |
2.1 词性标注 |
2.1.1 基于词典查找的词性标注 |
2.1.2 基于规则和统计的词性标注 |
2.1.3 基于深度学习的词性标注 |
2.2 注意力机制 |
2.2.1 硬注意力机制和软注意力机制 |
2.2.2 全局注意力机制和局部注意力机制 |
2.2.3 自注意力机制 |
2.3 答案选择排序 |
2.3.1 Pointwise |
2.3.2 Pairwise |
2.3.3 Listwise |
2.4 本章总结 |
第三章 基于统计和深度学习的词性标注模型 |
3.1 引言 |
3.2 模型 |
3.2.1 标注模型架构 |
3.2.2 条件随机场处理层 |
3.2.3 维特比算法解码标注序列 |
3.3 实验 |
3.3.1 实验数据 |
3.3.2 实验设置 |
3.3.3 评估指标 |
3.4 结果与分析 |
3.4.1 模型实验结果 |
3.4.2 不同模型对比 |
3.5 本章总结 |
第四章 融合词性与注意力的答案选择排序模型 |
4.1 引言 |
4.2 模型 |
4.2.1 排序模型架构 |
4.2.2 词性特征融合 |
4.2.3 注意力矩阵构造 |
4.3 实验 |
4.3.1 实验数据 |
4.3.2 实验设置 |
4.3.3 评估指标 |
4.4 结果与分析 |
4.4.1 词性和注意力对模型的改进 |
4.4.2 相似任务模型对比 |
4.5 本章总结 |
第五章 结论与展望 |
5.1 主要结论 |
5.2 研究展望 |
参考文献 |
在学期间的研究成果 |
致谢 |
(5)基于支持向量机的高维不平衡数据集分类算法及其应用研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 选题的来源、研究背景与意义 |
1.1.1 选题的来源 |
1.1.2 研究背景与意义 |
1.2 研究现状 |
1.2.1 类不平衡数据集分类问题 |
1.2.2 高维数据集分类问题 |
1.2.3 高维不平衡数据集分类问题 |
1.3 研究内容与结构安排 |
第二章 预备知识 |
2.1 支持向量机(SVM) |
2.1.1 线性可分的情况 |
2.1.2 线性不可分情况 |
2.2 支持向量机的递归特征消除算法(SVM-RFE) |
2.3 人工合成少数类样本过采样方法(SMOTE) |
2.4 分类评价指标 |
2.5 本章小结 |
第三章 基于SMOTE和 SVM的不平衡数据集分类的改进算法 |
3.1 算法描述 |
3.1.1 混合核函数支持向量机(MKSVM) |
3.1.2 L-SMOTE方法 |
3.2 改进的FTL-SMOTE算法 |
3.2.1 采样数量设置 |
3.2.2 F-SMOTE算法对集合FP_sam的采样 |
3.2.3 T-SMOTE算法对集合TN_sam的采样 |
3.2.4 FTL-SMOTE算法 |
3.2.5 FTL-SMOTE算法的复杂度分析 |
3.3 数据与实验设计 |
3.3.1 UCI数据集 |
3.3.2 实验设计 |
3.4 数值结果与分析 |
3.4.1 基于人工数据的数值结果与分析 |
3.4.2 基于UCI数据集的数值结果与分析 |
3.5 本章小结 |
第四章 基于ISVM-RFE的 F统计量和m PDC嵌入式特征选择算法 |
4.1 算法描述 |
4.1.1 SVM-T-RFE算法 |
4.1.2 RFE-FSVs算法 |
4.1.3 SVM-RFE(MRMR)算法 |
4.1.4 SVM-RFE(AC)算法 |
4.2 改进的特征选择算法ISVM-RFE(FPD) |
4.2.1 两个新的特征选择标准 |
4.2.2 改进的SVM-RFE算法(ISVM-RFE) |
4.3 数据与实验设计 |
4.3.1 癌症基因数据集 |
4.3.2 实验设计 |
4.4 数值结果与分析 |
4.4.1 无特征选择的数值结果与分析 |
4.4.2 有特征选择的数值结果与分析 |
4.5 本章小结 |
第五章 基于ISVM-RFE(FPD)算法和代价敏感分类的财务预警研究 |
5.1 算法描述 |
5.1.1 MRMR算法 |
5.1.2 代价敏感的混合核SVM分类器 |
5.2 数据与实验设计 |
5.2.1 实证数据来源与预处理 |
5.2.2 实验设计 |
5.3 数值结果与分析 |
5.3.1 不同组合模型的数值结果与分析 |
5.3.2 特征选择算法与重要财务指标分析 |
5.4 本章小结 |
第六章 总结与展望 |
参考文献 |
攻读硕士学位期间发表的学术论文及取得的相关科研成果 |
致谢 |
(6)面向需求的回归测试下测试用例优先排序技术研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 研究背景 |
1.2 国内外研究现状 |
1.2.1 白盒测试下的TCP技术 |
1.2.2 黑盒测试下的TCP技术 |
1.2.3 其他TCP技术 |
1.3 现存问题 |
1.4 研究内容 |
1.5 论文主要成果 |
1.6 论文结构 |
第2章 回归测试相关研究 |
2.1 回归测试 |
2.2 测试用例优先排序 |
2.2.1 排序技术分类 |
2.2.2 贪心法策略 |
2.2.3 评价优先级指标 |
2.3 回归测试选择 |
2.4 聚类分析 |
2.4.1 相似度 |
2.4.2 抽样策略 |
2.5 本章小结 |
第3章 面向需求的基于历史信息的测试排序技术 |
3.1 引言 |
3.2 基于历史信息的回归测试优先排序 |
3.2.1 测试用例初始化排序 |
3.2.2 基于需求优先级调整的测试排序 |
3.2.3 基于历史信息的测试排序 |
3.3 实验研究 |
3.3.1 实验对象 |
3.3.2 实验变量和实验设计 |
3.3.3 实验结果及分析 |
3.4 本章小结 |
第4章 敏捷开发环境中面向需求的回归测试优化技术 |
4.1 引言 |
4.2 敏捷开发下测试环境 |
4.3 敏捷开发环境中的回归测试优化 |
4.3.1 敏捷测试用例优先排序 |
4.3.2 敏捷回归测试选择 |
4.3.3 回归测试优化 |
4.4 实验验证 |
4.4.1 实验对象 |
4.4.2 实验变量 |
4.4.3 实验设计 |
4.4.4 实验结果及分析 |
4.4.5 实验结果总结与有效性影响因素分析 |
4.5 本章小结 |
第5章 基于聚类的自适应回归测试用例排序调整技术 |
5.1 引言 |
5.2 自适应测试用例优先排序 |
5.3 基于聚类的自适应排序调整 |
5.3.1 预备条件 |
5.3.2 聚类算法 |
5.3.3 排序调整算法 |
5.4 实验研究 |
5.4.1 实验对象 |
5.4.2 实验变量和实验设计 |
5.4.3 实验结果及分析 |
5.4.4 实验结果讨论 |
5.4.5 自适应排序调整技术的有限性讨论 |
5.4.6 有效性影响因素分析 |
5.5 本章小结 |
第6章 基于多目标的测试用例优先排序技术 |
6.1 引言 |
6.2 多目标优化 |
6.3 基于多目标排序算法 |
6.3.1 基本思想 |
6.3.2 形式化描述 |
6.3.3 基于多目标排序算法 |
6.4 实验个例研究 |
6.4.1 实验设计 |
6.4.2 实验结果及分析 |
6.5 本章小结 |
第7章 总结与展望 |
7.1 论文总结 |
7.2 未来工作展望 |
参考文献 |
作者在攻读博士学位期间发表的论文及科研成果 |
作者在攻读博士学位期间参与的科研项目 |
致谢 |
(7)基于增强现实的中学信息技术教学资源的开发 ——以查找排序算法为例(论文提纲范文)
abstract of thesis |
论文摘要 |
1 绪论 |
1.1 研究背景 |
1.2 研究意义 |
1.3 研究内容 |
2 相关研究综述与理论基础 |
2.1 相关研究综述 |
2.1.1 增强现实技术 |
2.1.2 增强现实教学资源 |
2.1.3 增强现实教学资源现状分析 |
2.2 理论基础 |
2.2.1 沉浸理论 |
2.2.2 认知负荷理论 |
2.2.3 建构主义学习理论 |
2.3 资源设计原则 |
3 前端分析与资源设计 |
3.1 前端分析 |
3.2 情境创设 |
3.3 三维动画设计 |
3.3.1 总体设计 |
3.3.2 具体设计 |
3.4 识别图设计 |
3.4.1 总体设计 |
3.4.2 具体设计 |
4 教学资源开发 |
4.1 开发工具简介 |
4.1.1 Cinema4D |
4.1.2 Unity3D |
4.1.3 Vuforia |
4.2 静态模型的开发 |
4.2.1 冒泡排序 |
4.2.2 选择排序 |
4.2.3 顺序查找 |
4.2.4 对分查找-成功 |
4.2.5 对分查找-失败 |
4.3 三维动画的构建 |
4.4 材质的确立 |
4.5 识别图片的构建 |
4.6 合成及导出 |
5 结语 |
参考文献 |
致谢 |
(8)基于Spark的无线城市社团发现算法研究(论文提纲范文)
致谢 |
摘要 |
abstract |
变量注释表 |
1 绪论 |
1.1 研究背景 |
1.2 国内外研究现状 |
1.3 本文组织结构 |
2 相关理论基础 |
2.1 社团发现 |
2.2 关联规则 |
2.3 Spark集群 |
2.4 本章小结 |
3 SIACD算法 |
3.1 核心理论与思想 |
3.2 数据预处理 |
3.3 基于改进Apriori算法的社团发现 |
3.4 基于Spark的并行化处理 |
3.5 本章小结 |
4 实验测试与分析 |
4.1 实验环境 |
4.2 实验结果与分析 |
4.3 本章小结 |
5 结论与展望 |
5.1 结论 |
5.2 展望 |
参考文献 |
作者简历 |
学位论文数据集 |
(9)抽象测试用例集优化排序的改进算法研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 基于随机测试的抽象测试用例集优化排序方法(NIGP) |
1.2.2 基于组合覆盖的抽象测试用例集优化排序方法(ICBP) |
1.2.3 基于输入模型变体的抽象测试用例集优化排序方法(IMBP) |
1.2.4 基于相似性的抽象测试用例集优化排序方法(SBP) |
1.3 论文的主要工作 |
1.4 论文的组织结构 |
1.5 本章小结 |
第二章 背景知识 |
2.1 软件缺陷 |
2.2 软件测试 |
2.2.1 软件测试 |
2.2.2 黑盒测试和白盒测试 |
2.2.3 回归测试 |
2.3 组合测试 |
2.4 测试用例集的生成 |
2.4.1 一维扩方法(One-test-at-a-time) |
2.4.2 二维扩展方法(In Parameter Order) |
2.5 测试用例集的优先级 |
2.6 本章小结 |
第三章 基于重复一维组合覆盖的抽象测试用例集优化排序算法 |
3.1 FICBP算法研究 |
3.1.1 FICBP算法执行过程 |
3.1.2 FICBP算法流程图 |
3.1.3 FICBP算法不足及改进 |
3.2 FICBPR算法研究 |
3.2.1 FICBPR算法 |
3.2.2 FICBPR算法流程图 |
3.2.3 FICBPR算法示例 |
3.3 算法的时间复杂度分析 |
3.4 算法的实证研究 |
3.4.1 实验设置 |
3.4.2 算法的测试流程 |
3.4.3 算法的有效性度量 |
3.5 实验结果和分析 |
3.5.1 错误检测率NAPFD结果分析 |
3.5.2 时间开销结果分析 |
3.6 本章小结 |
第四章 基于一维权重的抽象测试用例集优化排序算法 |
4.1 FICBPR算法研究 |
4.1.1 FICBPR算法的不足及改进 |
4.2 FICBPW算法研究 |
4.2.1 权重 |
4.2.2 FICBPW算法 |
4.2.3 FICBPW算法流程图 |
4.2.4 FICBPW算法关键步骤说明 |
4.2.5 FICBPW算法示例 |
4.3 算法的时间复杂度分析 |
4.4 算法的实证研究 |
4.4.1 实验设置 |
4.4.2 算法的测试流程 |
4.4.3 算法的有效性度量 |
4.5 实验结果和分析 |
4.5.1 错误检测率NAPFD结果分析 |
4.5.2 时间开销结果分析 |
4.6 本章小节 |
第五章 测试原型系统的设计与实现 |
5.1 ATC_SY系统架构及流程 |
5.1.1 ATC_SY系统架构 |
5.1.2 ATC_SY系统流程 |
5.2 界面设计 |
5.3 系统模块分析 |
5.3.1 算法设置模块 |
5.3.2 被测程序设置模块 |
5.3.3 结果分析设置模块 |
5.4 系统总结 |
第六章 总结与展望 |
6.1 工作总结 |
6.2 研究展望 |
参考文献 |
致谢 |
攻读硕士期间发表的学术论文及科研成果 |
(10)浅析基于C语言的常用排序算法比较(论文提纲范文)
1 基于C语言的常用排序算法比较 |
1.1 选择排序算法 |
1.2 插入排序算法 |
1.3 起泡排序算法 |
2 实例应用分析 |
2.1 树形选择排序算法 |
2.2 折半排序算法 |
2.3 列队起泡排序算法 |
3 结语 |
四、一种基于直接选择排序算法的改进(论文参考文献)
- [1]基于空气质量数据的多模式可视化系统的设计与实现[D]. 王丹阳. 北京邮电大学, 2020(04)
- [2]多特征与注意力机制相结合的答案选择排序研究[D]. 王龙. 太原理工大学, 2020(07)
- [3]基于多索引的实时实体解析与关键词查询处理[D]. 崔润东. 河北大学, 2020(08)
- [4]基于注意力机制的答案选择排序研究[D]. 崔家源. 北方工业大学, 2020(02)
- [5]基于支持向量机的高维不平衡数据集分类算法及其应用研究[D]. 罗康洋. 上海工程技术大学, 2020(05)
- [6]面向需求的回归测试下测试用例优先排序技术研究[D]. 王晓琳. 上海大学, 2020(02)
- [7]基于增强现实的中学信息技术教学资源的开发 ——以查找排序算法为例[D]. 梁旭. 宁波大学, 2019(06)
- [8]基于Spark的无线城市社团发现算法研究[D]. 徐山珊. 辽宁工程技术大学, 2019(07)
- [9]抽象测试用例集优化排序的改进算法研究[D]. 宗炜雯. 江苏大学, 2019(02)
- [10]浅析基于C语言的常用排序算法比较[J]. 王锦坤. 信息通信, 2019(03)