一、印刷体数字快速识别算法在身份证编号数字识别中的应用(论文文献综述)
黄为新,陶杨,张继超,苏笛,牛砚[1](2021)在《基于迁移学习的发票号码识别研究》文中研究说明财务系统中的发票管理长期以来严重依靠人力,并存在一定的失误率,且目前一些发票识别方法存在准确率不高、数字识别实时性不足等问题。鉴于此,基于已有较成熟的手写体数字识别工作,从迁移学习思想和方法入手,设计一种能准确快速识别发票号码的新方法。选取迁移学习的3种具体方法,即Tradaboost、微调和卷积神经网络提取特征并运用于SVM,分别应用于数字识别模块。通过大量测试和比对,结果表明,第3种方法即采用CNN结合SVM的算法在实验中能达到99.75%的准确率,且识别速度快,具有较好的稳定性、鲁棒性。
王家亮[2](2021)在《自然场景采集的卡证票据精准识别方法》文中进行了进一步梳理许多企业平台采用“移动终端+互联网”模式收集用户上传的卡证票据并进行自动识别。一些证件识别平台由于应对光照、透视、复杂背景、水印覆盖、特殊印刷体等因素的抗干扰能力不足,严格限制证件图像的采集质量,给用户带来了不便。本文针对从自然场景中采集的卡证票据识别问题,针对精确识别需求,分别提出了基于SIFT特征点匹配的证件定位、基于条件生成对抗网络的可见水印去除、文本识别增强三个精准优化方法。通过实验设计,验证了所提出的方法对非均匀光照和复杂背景干扰的证件图像,在内容识别的效率和准确度方面的有效提升。本文主要工作如下:1.提出了一种基于SIFT特征点匹配的卡证定位方法。针对卡证定位问题,根据自定义模板图特征点的定位性能不变性,给出了基于SIFT特征点检测、FLANN特征点匹配和PROSAC错误匹配消隐的速度优先和精度优先两种定位点选择算法。通过证件定位实时观测程序,验证了方法在复杂环境变化中的鲁棒性。2.采用基于条件生成对抗网络的pix2pix模型,通过提出成对训练集的扩充方法,有效提升了去水印模型训练的拟合优度。使水印覆盖内容得到充分恢复,也增强了卡证文本识别的抗干扰能力。3.提出了一种卡证文本的识别增强方法。一方面,通过基于“投影法”的字段定位及字符分割、印刷体清晰化和字段合并加速识别方法,在字段细粒度提纯和流程化识别层面做了细致优化。另一方面,在Tesseract-OCR自定义语言包生成中基于“投影法”提出了一种样本生成方法和自动化字符校正算法,提升了Tesseract样本字符检测成功率和校正效率。论文针对从自然场景中采集的卡证票据识别问题,从上述三个方面提出了性能提升方案,可以为系统开发和实现提供应用参考。
仁青东主[3](2021)在《基于深度学习的藏文古籍木刻本文字识别研究》文中研究说明文字识别(Character Recognition,CR)是利用计算机将人们可理解的文字或者图像信息自动转化为计算机可以阅读、查询与编辑的以计算机内码表示的方法。藏文是藏族文化的重要载体,在我国历史上藏文撰写的各类典籍数量仅次于汉文,是中华文化宝库中的瑰宝,具有重要的人文科学研究及应用价值。藏文文字识别是藏语计算语言学科的一项重要研究内容,涉及信息科学、数学、语言科学、认知科学以及其它方面的领域。因此,使用藏文文字识别来保护和使用藏文古籍文献已成为文献资源数字化的一个重要研究热点。然而,受制于藏文古籍文献数字化无损采集、版面分析、文字识别等技术的不成熟,很多珍贵文献、易破损的纸质文献无法采集和数字化。已数字化的藏文古籍文献资源数据也以图像信息为主,文献内容挖掘和知识库构建、检索技术研发都缺乏数据支撑。在藏文古籍文献中以木刻本形式文献占据数量最多,从而藏文古籍木刻本文字识别的研究尤为重要,国内外一些高校和企业开发了光学字符识别系统(Optical Character Recognition,OCR),以识别印刷体藏文,据可查文献,针对藏文古籍木刻本文字识别的研究甚少。从目前已有的文献看,国内外藏文文字识别技术还停留在传统的方法上,没有融入藏文语言结构及文字构成规律,识别精度低,泛化能力弱,无法达到藏文文献数字保护和使用需求,亟待研发高识别率、高精度、高性能的数字化技术。深度学习技术近几年发展很快,在文字识别领域,该技术比传统的识别方法要优越很多,识别效果也明显。随着深度学习研究的深入,如何利用深度学习来进行端到端的学习,并摒弃基于人工规则的中间步骤,以提升序列学习的效果已经成为当前研究的热点。本文的研究基于深度学习的藏文古籍木刻本文字识别,提出基于深度神经网络的藏文古籍木刻本图像文字识别新方法,其主要贡献概括如下:(1)针对藏文古籍木刻本复杂版面特征,研究一种基于CTPN的文本检测算法,实现藏文古籍木刻本复杂版式文字的纵横向检测。(2)针对藏文古籍木刻本超长行特征,研究一种基于滑动窗的超长文本行动态拆分与识别技术,进行基于字符识别位置信息的相邻子块重叠字符处理,解决超长文本行古籍文字识别难题。(3)构建基于残差网络和双向长短时记忆循环神经网络、结合样本增强技术的具有高泛化性和鲁棒性的藏文古籍串识别模型,解决图像质量差、相邻文字粘连严重、上下行重叠度大的古籍文字识别难题。(4)采用拼写检查的方法进行错误音节的检测,并且用隐马尔科夫模型与语言模型相结合的方法,解决形态相似字符的识别校正难题。
宋家毓[4](2021)在《基于FPGA脱机光学字符识别系统的研究与设计》文中认为光学字符识别(Optical Character Recognition,OCR)系统被广泛应用于各个领域,已成为提高工作效率、促进智能化社会建设的重要助力。在研究者的努力下,字符识别算法得到快速发展,其识别的准确率越来越高,实用性也越来越强,但却需要更大的计算量和更长的计算时间。近年来,现场可编程门阵列(Field Programmable Gate Array,FPGA)技术迅速发展,集成的资源不断增加,使设计人员在使用FPGA进行图像处理时可充分发挥其并行计算的优势,进一步提高图像处理系统的实时性,且相比于专业集成电路(Application Specific Integrated Circuit,ASIC),FPGA开发周期更短、成本更低,是设计字符识别系统的上佳选择。本文基于FPGA,使用Verilog-2001设计了两个字符识别系统并对其功耗和识别时间等性能进行分析:第一个是基于区域像素统计特征的车牌中数字和字母的识别系统,该系统针对印刷体字符,识别算法简单;第二个是基于神经网络的手写字符识别系统,该系统针对手写数字、字母和部分汉字字符,使用神经网络算法对字符进行识别。论文对图像处理算法在FPGA上的实现进行了积极探索,主要研究内容包括:1.通过Matlab分析车牌数字和大写字母图像行列像素值的分布,提出了基于区域像素点统计特征的识别算法,并将该算法在FPGA实现,结合图像采集和图像预处理,实现了简单背景下车牌数字和字母的识别,准确率超过95%。2.通过Matlab搭建卷积神经网络(Convolutional Neural Networks,CNN)模型,考虑到FPGA难以进行浮点数运算和复杂函数求解的特点,利用修正后的Relu函数替代CNN中的Sigmoid函数,将CNN中的权重和计算结果优化为整数的同时去掉偏差。最后基于该算法在FPGA设计了手写英文字符和部分汉字的识别模块。手写英文字符模块功耗261.31 m W,识别一次耗时48?s;手写汉字识别模块功耗273.40 m W,识别一次耗时1.2 ms。3.使用Sign函数替换CNN中的Relu函数,并将CNN中的权重参数和池化层计算结果利用Sign函数进行二值化,得到一个二值化神经网络(Binary Neural Network,BNN),使用Mixed National Institute of Standards and Technology(MNIST)数据集在Matlab中对该网络进行训练获取参数后,在FPGA上对该网络进行实现并用于手写数字识别系统。该模块功耗136.18 m W,识别一次耗时38?s。4.在两个手写字符识别系统中,创新性地使用了区域中值替换将采集到的未知尺寸的目标图像重置为28×28或60×60像素作为神经网络识别模块的输入。
李莉莉[5](2021)在《基于深度学习的集装箱编号识别技术研究与实现》文中指出随着我国经济的发展,越来越多的国际贸易、货物运输依赖于集装箱。集装箱减少了货物运输的成本,从而推动世界经济的发展,但其广泛应用导致港口的吞吐量增速加快,容易造成各大港口拥堵,杂乱不堪,给港口的管理造成巨大的压力。为了对集装箱实行更好的管控,集装箱编号识别系统应运而生。传统集装箱编号识别技术容易受到复杂环境包括光照、字符倾斜、扭曲、破损等影响。近年来,由于深度学习具有快速准确的优点而成为模式识别重要的研究领域,因此,本文提出了一种基于深度学习的集装箱编号识别算法。该算法主要分为三部分,分别为:集装箱编号区域定位、集装箱编号字符分割、集装箱编号字符识别。本文的主要工作如下:(1)集装箱编号区域定位传统集装箱编号定位方法一般采取数学形态学、字符边缘、字符结构定位法,容易受复杂环境的影响,如污渍、锈迹,门锁杆,瓦楞等。针对以上问题,本文提出基于YOLOv4的集装箱编号检测算法。本文利用拍摄的图像进行数据增强,生成集装箱图像数据集,且结合集装箱编号的特点对图像进行标注,利用CSPDarknet53网络训练提取编号特征,生成适合检测集装箱编号的模型对集装箱编号区域进行定位。实验证明本文提出的定位方法速度快且准确率高。(2)集装箱编号字符分割针对集装箱编号倾斜、有干扰物、破损等问题,本文采用基于连通域的集装箱编号分割法。此方法通过深度遍历种子点的8邻域,从而确定分割的位置,对其进行筛选并分割。但因字符周围有其他的干扰,对于分割后的单个图像根据编号字符的先验知识进行筛选,从而保证编号字符的正确分割,为字符的识别奠定了基础。(3)集装箱编号字符识别针对集装箱编号相似字符干扰、字符破损等问题,本文采用识别效率和准确率都比较高的模板匹配算法。为了提高模板匹配识别的精度,本文根据集装箱编号的特点,将字母和数字分开识别,避免了由于有些字母和数字相似而导致识别错误,且缩短了单个字符的匹配时间,从而提高整个识别的速度。实验结果证明本文识别方法提高了识别的正确率。
包迪[6](2021)在《基于Yolo V4+Word2Vec的试卷问答题评分算法研究》文中研究说明在教育领域,问答题题型广泛用于各种考试中。以往针对问答题的自动评分研究吸引了大量学者研究,且大都面向电子版文档。而目前的作业、试题大都以纸质文档为主,故距实际应用较远。如何将问答题自动评分的方式方法应用到纸质对象的评阅中,还尚未有完整的解决方案,成为了自然语言处理在教育行业应用的重点和难点问题。在上述背景下,本文从教师的试卷批改工作入手,观察和调查教师的批改动作,根据改卷过程中的需求和计算机工作特点,确定了一个先检测、再识别、最后评分的三段式纸质试卷自动评分的算法框架。再以《系统建模与仿真》学科考试为研究对象,设计、制作和收集纸质试卷,组合运用目标检测算法、OCR文字识别API、问答题自动评分方法实现了一套针对纸质试卷的题目自动评分算法。针对本文应用场景,首先利用现有Yolo v4目标检测算法,自建试卷数据集,改进了目标检测的预处理和视频帧检测方式,实现了对试卷姓名栏、题目内容的目标检测;随后根据目标检测结果,搭建腾讯云OCR API实现了对检测结果的手写体识别;然后将含有维基百科、国内新闻、学科专业文本混合语料库,使用Word2Vec训练词向量模型,将词向量、句向量作为文本的特征进行相似度计算,并制定了问答题评分规则;最后,使用正则表达式、多线程等方法将Yolo v4、OCR、语义相似度评分算法三者连接。评测实验表明:改进图片数据增强方法的Yolo v4网络得到了68.77%的mAP50成绩和49.48%的mAP75成绩,使用“竖直平移”视频检测方案将试卷内容检测精度提高了21.25%,搭建的Word2Vec问答题相似度评分算法与专家评分均方误差在0.81以下,误差在10%以内。在测试中满足日常使用要求。本文成功实现了纸质试卷的问答题自动批改算法,研究成果对纸质对象的智能阅卷提供了理论依据和方法参考。提出的原型算法的实现证明了利用上述三种算法实现针对纸质试卷的问答题自动评分解决方案在理论和技术上是可行的,对减少教师工作量、提高教学质量有重要应用价值,对未来相关研究具有一定参考价值。
丁浩伦[7](2021)在《机打票据图像结构化技术研究及应用》文中提出随着计算机技术的发展,自动化、智能化业务系统的需求日益增长。机打票据在企事业中被普遍应用,业务流程中信息的自动识别对成本节约具有重要意义。然而,现有的方法大多要求专业的图像采集设备,识别效率也有很大的提升空间。因此,研究简单且成本低廉的机打票据识别系统具有重要的现实意义。传统的光学字符识别(Optical Character Recognition,OCR)开源软件仅仅可以对文章等简单文本内容进行逐行文字识别。随着深度学习的发展,神经网络在文字检测和文字识别方面都有了长足进步,但在票据结构化识别上,网络并不能解决票据的关键字和内容(Key and Value Structures,KV)提取问题。同时,由于票据公开数据集稀缺,对中小企业来说票据数据的获取和标注费时费力,票据识别系统的训练和部署成本高昂。对此,本文提出了一种新的机打票据识别框架,能够成功识别如手机等移动设备拍摄的票据,并且此框架可以很容易的扩展票据识别的种类。本文的主要贡献如下所述:(1)本文提出了一种新的机打票据识别框架。具体来说,我们提出了一种基于透视投影和连接主义者文本建议网络(CTPN)的图像预处理算法来纠正扭曲的发票图像。然后,通过模板匹配结合坐标微调方法提取准确的KV结构,大幅度降低了票据KV结构的漏检率。此外,本文采用卷积递归神经网络(CRNN)和类Le Net神经网络联合进行字符识别,提高了票据文本的识别正确率。(2)本文提出了一种主动学习网络和一种生成对抗网络训练策略。通过主动学习方法改进CRNN网络,提出了一种添加主动学习模块的CRNN网络和训练方式。对从实际场景收集的机打发票和开源ICDAR数据集进行了相关的实验,在充足数据场景和小数据场景下的比较结果表明了我们的方法可以以更低廉的成本训练模型,并有效提升模型的准确率。此外,为了在小数据场景下进一步改进所提出的模型,我们采用生成对抗网络(GAN)扩展训练样本,实验证明了我们的数据生成方式在票据识别中能明显提高准确率。(3)本文结合实际的票据识别项目实现了一个完整的机打票据识别系统。将本文提出的票据矫正、KV结构提取、文本识别算法应用到销售发票识别、身份证识别等具体识别场景中,该系统部署简单,运行效果良好。
李红[8](2020)在《图像文字提取及基于Android的文字识别实现》文中指出在我们的实际生活场景中充满了各种带有高层语义信息的文字图像,如何从这些图像中提取人们感兴趣的文字信息成为了研究者们的关注的重点。图像文字识别技术包括文字定位、文字提取、文字识别等步骤,但在具体使用Android OCR软件进行文字识别时,可以设定手动截取文本区域的方式来实现文本区域定位,而且现在有很多成熟的文字识别引擎可以应用在Android平台文字识别软件的开发上,所以文字识别率主要是与文字提取有关,因此如何对文本图像进行高效的文字提取是非常重要的。文字提取主要包括文本图像的预处理以及文字切分这两部分。本文主要面向已经定位后的文本图像(文本图像来源于书籍、室内/外提示语、餐厅菜单以及商品外包装等),针对文本与复杂背景的分割、文字切分及基于Android的文字识别应用进行了深入研究,具体工作内容如下:(1)图像预处理:对定位之后的文本图像进行图像的预处理是文字提取必不可少的一步,其主要目的是实现文本与图像背景的分割。本文对文本图像采用了灰度化、降噪处理、消除不均光照、边缘检测等处理过程,针对目标文本与图像背景分割采用了改进的基于大津法(Otsu)的双阈值二值化图像分割算法。本文设计的算法在一定程度上对有着复杂背景、不均光照等特征的文本图像消除复杂背景以及噪声的干扰,很好的完成了目标文本与复杂背景的分割;(2)文字切分:为了提高文字识别率,针对获得的文本二值化图像,本文对文字切分算法进行了深入研究。在具体的文字切分过程中,首先使用水平投影法进行行切分,然后垂直投影法计算文本图像中单个字符近似宽度值(以汉字为主),最后根据字符近似宽度值,设计可变化模板并构造模板响应函数来切分字符。相比较单独使用投影法或模板法切分文字,在一定程度上克服了左右结构汉字和粘连字符容易被误分割的问题。(3)基于Android的文字识别实现:本文以图像文字提取算法作为技术手段,设计并实现了基于Android系统的汉字识别软件;除了文字识别功能外,在该软件的设计中还增加了实时显示汉字可视化图像以及语音播放功能。
侯科睿[9](2020)在《基于遗传算法的字符识别特征提取技术研究》文中进行了进一步梳理人类利用字符来进行信息交流,随着信息化社会的不断发展。社会对于手写体字符的识别、运用的需求十分宽广。将纸质资料转化为电子信息对于高效、便捷的信息社会起着至关重要的作用。而对于脱机手写体字符来说,汉字手写体字符风格随意,不受拘束且笔画结构复杂。因此,汉字手写字符对于识别模式来说是一项具有挑战性的课题。字符识别的难点在于如何提取到最具区分度的特征,传统的统计特征提取基于统计学能够取得较好效果,但其前提是必须训练集足够大,训练次数足够多才会得到想要的效果。而手写字符,不变的还是笔画结构,虽然风格迥异,但笔画结构是唯一的。因此笔画结构特征对于字符识别是更有效、精度更高的。本文要解决的是特征提取结果不稳定的问题,因此在笔画结构特征的基础上进行改进。将初始字符图像化后的曲线结果进行曲直化转变,利用DDA算法进行转变来解决曲线图像多拐点对于特征提取的影响。然后利用最小偏差法,计算输入字符和样本集合在空间坐标系中的误差值,利用角度和直线的偏差值进行字符匹配,偏差值最小匹配度最高。最后引入遗传算法,将角度、线段的特征集合进行迭代,在代代交叉进化的过程中最终得出最优特征,提高识别精度。为保证实验效果,本文选取的是HCL2000中文手写体字符库,并将字符库作为输入项进行平均分组进行实验,将得到的特征集合放入位置矩阵,并与数据库中的3755个样本逐一进行比较。最终发现基于遗传算法改进的笔画结构特征提取算法能够提升识别精度,更好的完成识别任务,效果相比较为优秀。
曹钊铭[10](2020)在《基于深度学习的字符识别系统的研究与实现》文中研究指明随着计算机技术的飞速发展,图像作为信息技术中的重要传播载体,在信息的传播中占据着非常重要的地位,在大数据时代,如何高效地处理海量图像信息成为研究的热点问题[1]。随着人工智能的热潮的涌起,利用高度智能化的机器来替代各行各业的人工工作已经成为一种趋势。光学字符识别(OCR,optical character recognition)技术是计算机视觉中重要的组成部分,它模拟人类的视觉智能地对图像中的信息进行识别和判断。OCR技术旨在从图片中检测和识别文字信息,即对文本资料进行扫描,再对图像文件进行分析处理,获取文字及版面信息的过程。它主要应用于文档识别及证件识别,通过自动化处理,减少人工成本,提高工作效率,降低错误率。本文借助深度卷积神经网络实现一个适用于票据证件的字符识别系统。票据证件包括身份证,营业执照,零售许可证,增值税发票,交易确认单等。输入图像由手机或者相机等摄像设备拍摄而得。本文所设计的系统结合了数字图像处理,深度学习以及自然语言处理三大方面的技术,针对具体的应用场景,完成了中文OCR识别过程。本文的主要工作如下,1.针对手机拍摄的证件票据的图像质量参差不齐,图像中容易包含冗余的背景信息的问题,本文提出了一种基于目标底色的图像感兴趣区域(ROI)提取的算法对图像进行预处理,定位图像中证件票据所在的具体位置,去除图像中背景信息的干扰,提升整个字符识别系统的识别效果。该算法依据图像中所包含的证件票据的底色的不同,分为绿色,蓝色,红色三种底色,利用图像的边缘检测和形态学处理,获取目标(证件票据)在整幅图像中的位置坐标。实验证明,基于目标底色的图像感兴趣区域(ROI)提取算法的预处理过程能够很好地去除干扰信息,提升OCR识别效果。2.对现阶段的字符识别算法进行调研分析,现阶段的主流字符识别算法框架是“特征提取网络(CNN)+循环卷积网络(RNN)+CTC(Connectionist temporal classification)算法”。本文对以Google Net,Res Net以及Dense Net为特征提取网络的主流字符识别算法进行了实验,并对算法效果进行了对比分析。针对主流字符识别算法对硬件条件要求过高,占用内存过大,计算速度无法满足实时性要求的问题,提出了两种轻量级字符识别模型。一种是改进的Dense Net轻量级字符识别模型,一种是基于深度可分离卷积的轻量级字符识别模型,并将这两种轻量级网络与现有的主流框架下的字符识别网络进行了对比分析。实验可得,本文所提出的这两种轻量级字符识别算法与传统的字符识别算法相比,模型更小,运算速度更快。特别地,基于深度可分离卷积的字符识别网络得益于它卷积方式的不同,算法性能更为优异。3.由于字符识别过程利用卷积网络进行识别,无法达到百分之百的准确率,针对字符识别模型的识别结果存在的错误识别问题,本文提出了基于自然语言处理的中文形近字纠错算法用于字符识别网络后端,进一步提升字符识别系统的检测精度。字符识别网络是依据文字的形态特征进行判断输出,识别错误的字符与正确的字符大多是形态特征相似,因此本文所提出的纠错算法主要是针对中文形近字之间的错误。本文提出了两种对中文形近字的纠错算法,一种是基于隐马尔科夫模型(HMM)的纠错算法,它是检测到语句错误之后,使用字库对所检测到的错误进行替换,完成纠错,纠错字库由前端的字符识别模型经过一系列处理获得,使得算法更具针对性。另一种是基于encoder-decoder机制的纠错模型,依据前后文所提供的语义信息进行纠错,同时还考虑到了实际应用场景中专有名词在纠错时的不良影响。通过实验比较,基于HMM的纠错算法纠错速度更快,基于encoder-decoder机制的纠错算法在长语句纠错场景下表现优异,二者都可以很好地服务于证件票据的识别纠错。4.将上述本文所提出的算法融合,设计出一套针对证件票据的字符识别系统,并利用pyqt5工具完成系统与用户交互化界面的设计工作。本系统实现了对手机、相机等摄像设备所拍照得到的证件票据图像进行字符识别,转化为文字信息的过程,主要分为三个部分,包括图像目标区域的提取,字符识别,识别结果纠错。用户可以在交互界面中根据自己的需求建立自定义词典,选择所要识别证件票据的底色。识别完成后,用户可以得到字符识别网络的识别结果以及纠错之后的最终输出结果。经测试,在本文所设定的应用场景下,识别的准确率可达到98.37%。本文所设计的字符识别系统能够很好地达到对证件票据进行字符识别的准确度要求,同时,由于轻量级网络的引入,该系统在保证识别准确率的情况下还能够满足识别实时性的要求。
二、印刷体数字快速识别算法在身份证编号数字识别中的应用(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、印刷体数字快速识别算法在身份证编号数字识别中的应用(论文提纲范文)
(1)基于迁移学习的发票号码识别研究(论文提纲范文)
0 引言 |
1 发票数字数据集获取与预处理 |
2 数字识别模块实现 |
2.1 Tradaboost算法实现 |
2.2 Lenet-5微调方法 |
2.3 卷积神经网络提取特征并用于SVM |
3 结语 |
(2)自然场景采集的卡证票据精准识别方法(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 背景及意义 |
1.2 国内外相关研究与发展现状 |
1.2.1 卡证检测 |
1.2.2 可见水印去除 |
1.2.3 光学字符识别 |
1.3 本文的主要研究内容 |
1.4 论文组织结构 |
第二章 相关技术分析 |
2.1 图像特征点匹配 |
2.1.1 图像特征点匹配概述 |
2.1.2 图像特征点匹配算法 |
2.2 生成式对抗网络 |
2.2.1 生成对抗网络 |
2.2.2 条件生成对抗网络 |
2.3 OCR识别引擎 |
2.3.1 Tesseract-OCR |
2.3.2 Paddle OCR |
2.4 本章小结 |
第三章 基于SIFT特征点匹配的卡证定位方法 |
3.1 证件定位方法概述 |
3.2 特征点检测算法对比实验 |
3.3 定位点选择算法 |
3.3.1 自定义模板图及特征点描述文档 |
3.3.2 速度优先定位点选择算法 |
3.3.3 精度优先定位点选择算法 |
3.4 证件定位实验设计 |
3.4.1 证件定位实时观测程序 |
3.4.2 实验结果分析 |
3.5 本章小结 |
第四章 基于条件生成对抗网络的卡证去水印方法 |
4.1 去水印总体方案 |
4.2 基于特征点匹配的可见水印检测 |
4.3 基于条件生成对抗网络的可见水印去除 |
4.3.1 去水印CGAN网络原理 |
4.3.2 CGAN成对训练集扩充方法 |
4.4 水印去除实验 |
4.5 本章小结 |
第五章 卡证文本的识别增强方法 |
5.1 字段细粒度提纯 |
5.1.1 异常字段的提取 |
5.1.2 印刷体清晰化处理 |
5.2 文字识别优化方法 |
5.2.1 字段存储结构设计 |
5.2.2 字段合并方法 |
5.2.3 Tesseract-OCR自定义手写数字语言包快速生成方法 |
5.2.4 黑白名单配置 |
5.3 本章小结 |
第六章 总结与展望 |
6.1 工作总结 |
6.2 展望 |
参考文献 |
攻读学位期间的研究成果目录 |
致谢 |
(3)基于深度学习的藏文古籍木刻本文字识别研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 传统藏文OCR技术 |
1.3.1 藏文字符字符归一化 |
1.3.2 藏文字符预分类 |
1.3.3 藏文文本切分 |
1.4 基于深度学习OCR技术 |
1.4.1 文字检测 |
1.4.2 文字识别 |
1.5 主要研究内容 |
1.6 创新点 |
1.7 本文组织结构 |
第2章 藏文古籍木刻本数据集构建与生成 |
2.1 藏文文字与版式特点 |
2.1.1 藏文古籍文字特点 |
2.1.2 梵音藏文转写体特点 |
2.1.3 藏文古籍文献版式特点 |
2.2 字符集创建 |
2.3 藏文古籍木刻本图像标注方法 |
2.3.1 标注规范 |
2.3.2 文本位置编号 |
2.3.3 文本内容标注 |
2.4 稀缺训练集扩充方法 |
2.5 小结 |
第3章 藏文古籍木刻本图像预处理 |
3.1 低质量古籍图像二值化方法 |
3.2 藏文古籍木刻本复杂背景去噪方法 |
3.2.1 空间滤波去噪 |
3.2.2 非局部去噪 |
3.3 藏文古籍木刻本倾斜校正方法 |
3.3.1 倾斜角检测 |
3.3.2 Radon变换 |
3.4 小结 |
第4章 藏文古籍木刻本复杂版式文本检测 |
4.1 文本检测方法 |
4.2 基于CTPN的藏文古籍文本检测 |
4.2.1 文本区域构建 |
4.2.2 竖向文本行检测 |
4.3 实验 |
4.3.1 实验数据 |
4.3.2 实验系统配置 |
4.3.3 实验结果 |
4.4 小结 |
第5章 基于深度学习的藏文古籍木刻本文字识别 |
5.1 藏文古籍木刻本超长行识别 |
5.1.1 水平投影 |
5.1.2 垂直投影 |
5.1.3 超长行切分 |
5.2 藏文古籍木刻本串识别模型 |
5.2.1 古籍图像特征提取方法 |
5.2.2 古籍序列图像前后关系学习方法 |
5.2.3 序列合并 |
5.2.4 模型训练 |
5.3 实验 |
5.3.1 实验数据 |
5.3.2 评测指标 |
5.3.3 实验结果与分析 |
第6章 藏文古籍木刻本文字识别后处理 |
6.1 藏文相似字符分类 |
6.2 字符相似度计算方法 |
6.3 识别错误检测方法 |
6.4 错误纠正方法 |
6.4.1 基于隐马尔科夫模型的识别错误纠正 |
6.4.2 语言模型的藏文识别错误纠正 |
6.5 原型系统架构 |
6.6 小结 |
第7章 总结与展望 |
7.1 总结 |
7.2 展望 |
参考文献 |
攻读博士学位期间发表的论文及科研成果 |
1、发表/投稿论文 |
2、发明专利 |
3、软件着作权 |
4、主持和参与科研项目 |
5、获奖 |
致谢 |
(4)基于FPGA脱机光学字符识别系统的研究与设计(论文提纲范文)
中文摘要 |
Abstract |
第一章 绪论 |
1.1 选题背景及意义 |
1.2 字符识别算法及其在 FPGA 部署的研究现状 |
1.3 本论文的主要工作及创新点 |
第二章 字符识别算法理论 |
2.1 数字图像基础 |
2.2 卷积神经网络计算原理 |
2.2.1 卷积层 |
2.2.2 激活层 |
2.2.3 池化层 |
2.2.4 全连接层 |
2.2.5 分类器与交叉熵损失函数 |
2.3 BNN实现原理 |
2.4 本章小结 |
第三章 基于像素统计特征的车牌字符识别系统 |
3.1 识别算法介绍 |
3.2 算法在Matlab的验证 |
3.3 基于FPGA的字符识别系统实现 |
3.3.1 整体结构 |
3.3.2 预处理模块 |
3.3.3 字符识别模块 |
3.3.4 板级调试 |
3.4 本章小结 |
第四章 基于神经网络手写字符识别系统研究 |
4.1 神经网络在Matlab的训练 |
4.1.1 卷积神经网络的训练 |
4.1.2 二值化卷积神经网络的训练 |
4.2 基于FPGA手写字符识别系统研究与设计 |
4.2.1 预处理模块设计 |
4.2.2 卷积神经网络识别模块设计 |
4.2.3 卷积神经网络识别模块仿真验证和板级调试 |
4.2.4 卷积神经网络设计优化 |
4.2.5 二值化卷积神经网络识别模块设计 |
4.2.6 二值化卷积神经网络性能测试 |
4.3 本章小结 |
第五章 总结与展望 |
5.1 工作总结 |
5.2 工作展望 |
参考文献 |
在学期间的研究成果 |
致谢 |
(5)基于深度学习的集装箱编号识别技术研究与实现(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 字符定位研究现状 |
1.2.2 字符分割研究现状 |
1.2.3 字符识别研究现状 |
1.3 本文研究内容 |
1.4 本文结构安排 |
2 深度学习的相关理论 |
2.1 深度学习简介 |
2.2 卷积神经网络 |
2.2.1 卷积层 |
2.2.2 池化层 |
2.2.3 激活函数 |
2.2.4 全连接层 |
2.3 本章小结 |
3 集装箱编号识别的总体设计 |
3.1 集装箱基础知识 |
3.1.1 集装箱特点及编号编写规则 |
3.1.2 集装箱编号字符特点 |
3.2 难点分析 |
3.3 本文采用的技术路线 |
3.3.1 编号区域检测 |
3.3.2 编号字符分割与识别 |
3.4 本章小结 |
4 基于YOLOv4 的集装箱编号定位 |
4.1 本文设计思想 |
4.2 基于YOLOv4 的集装箱编号检测算法 |
4.2.1 本文的集装箱编号区域定位流程设计 |
4.2.2 主干特征提取网络 |
4.2.3 多尺度预测设计 |
4.3 基于YOLOv4 集装箱编号检测的实验结果与分析 |
4.3.1 集装箱编号数据集制作 |
4.3.2 环境配置 |
4.3.3 模型训练 |
4.3.4 实验结果及分析 |
4.4 本章小结 |
5 集装箱编号字符分割与识别 |
5.1 技术路线 |
5.2 字符预处理 |
5.2.1 灰度化 |
5.2.2 滤波去噪 |
5.2.3 二值化 |
5.2.4 形态学图像处理 |
5.3 集装箱编号字符分割 |
5.4 集装箱编号字符识别 |
5.4.1 归一化处理 |
5.4.2 轮廓检测去除字符留白 |
5.4.3 模板匹配识别编号字符 |
5.5 实验结果及分析 |
5.5.1 分割结果及分析 |
5.5.2 识别结果及分析 |
5.6 本章小结 |
6 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
攻读学位期间的研究成果目录 |
致谢 |
(6)基于Yolo V4+Word2Vec的试卷问答题评分算法研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 研究意义 |
1.3 国内外研究现状 |
1.3.1 国外研究现状 |
1.3.2 国内研究现状 |
1.3.3 评述及问题的提出 |
1.4 研究内容、方法和技术路线 |
1.4.1 研究内容 |
1.4.2 研究方法 |
1.4.3 技术路线 |
1.4.4 本文的创新点 |
1.5 论文的组织结构 |
1.6 开发和实验环境 |
1.7 本章小结 |
第二章 数据集设计与制作 |
2.1 试卷数据集的设计与制作 |
2.1.1 试卷设计 |
2.1.2 试卷数据收集 |
2.1.3 图像信息标记 |
2.2 文本数据集的收集与制作 |
2.2.1 文本数据集收集 |
2.2.2 中文停止词收集 |
2.2.3 文本数据集制作 |
2.3 本章小结 |
第三章 基于Yolo v4的试卷多目标检测算法 |
3.1 卷积神经网络概述 |
3.1.1 BP神经网络 |
3.1.2 卷积神经网络 |
3.2 目标检测概述 |
3.2.1 目标检测 |
3.2.2 相关评价指标 |
3.3 基于Yolo v4的多目标检测算法 |
3.3.1 Yolo v4网络结构 |
3.3.2 多尺度预测 |
3.3.3 Loss计算 |
3.4 基于Yolo v4的试卷多目标检测算法 |
3.4.1 Mosaic数据增强 |
3.4.2 多数据增强方法融合的预处理方式 |
3.4.3 视频流检测方式改进 |
3.5 网络训练和结果分析 |
3.5.1 对比实验 |
3.5.2 性能分析 |
3.6 视频检测过程对比和分析 |
3.7 基于腾讯云的文字识别 |
3.8 本章小结 |
第四章 基于Word2Vec的问答题自动评分算法 |
4.1 自然语言处理概述 |
4.1.1 Jieba中文分词工具 |
4.1.2 Word2Vec与CBOW模型 |
4.2 问答题自动评分概述 |
4.3 语料库预处理 |
4.3.1 Jieba分词 |
4.3.2 关键词提取 |
4.4 基于词向量的相似度评分算法搭建 |
4.4.1 基于Word2Vec的词向量模型训练 |
4.4.2 基于词向量相似度的评分方法 |
4.5 评分方法对比 |
4.6 本章小结 |
第五章 纸质试卷问答题自动评分算法实现 |
5.1 算法衔接 |
5.2 主线程内容 |
5.2.1 视频流采集与清晰度检测 |
5.2.2 截图与临时文件保存 |
5.3 分线程内容 |
5.3.1 正则表达式过滤 |
5.3.2 文本相似度预处理 |
5.3.3 图片绘制和存档 |
5.4 实验测试 |
5.5 本章小结 |
第六章 结论和展望 |
6.1 结论 |
6.2 展望 |
致谢 |
参考文献 |
附录A 攻读硕士研究生期间的科研成果 |
附录B 部分代码展示 |
(7)机打票据图像结构化技术研究及应用(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 国内外发展现状 |
1.3 论文主要工作 |
1.4 论文组织及结构 |
1.5 本章小结 |
第二章 相关技术及理论基础 |
2.1 图像处理 |
2.1.1 灰度化 |
2.1.2 二值化 |
2.1.3 去噪算法 |
2.1.4 霍夫变换 |
2.2 文本检测算法 |
2.2.1 连通域文本检测算法 |
2.2.2 最大极值稳定区域分析算法 |
2.2.3 深度文本检测网络 |
2.3 文本识别算法 |
2.3.1 字符识别 |
2.3.2 连续字符序列识别 |
2.4 生成对抗网络及主动学习方法 |
2.4.1 生成对抗网络 |
2.4.2 主动学习算法 |
2.5 本章小结 |
第三章 机打票据结构化识别方法研究 |
3.1 票据识别难点分析 |
3.1.1 票据倾斜扭曲 |
3.1.2 KV结构复杂 |
3.1.3 识别准确率要求高 |
3.1.4 训练样本不足 |
3.2 票据矫正及KV结构提取方法 |
3.2.1 边界线检测算法 |
3.2.2 关键点定位算法 |
3.2.3 投影矫正算法 |
3.2.4 模板匹配算法 |
3.2.5 边框微调算法 |
3.3 结合单字符和字符序列的多通道文本识别策略 |
3.3.1 单字符切割算法 |
3.3.2 字符识别 |
3.4 一种改进字符识别的主动学习算法 |
3.5 一种基于生成对抗模型的数据增强策略 |
3.5.1 普通数据扩充算法 |
3.5.2 生成对抗网络数据生成算法 |
3.6 本章小结 |
第四章 算法测试及性能分析 |
4.1 基于票据矫正的KV结构提取实验分析 |
4.1.1 数据集及对比实验方案 |
4.1.2 实验指标 |
4.1.3 对比实验分析 |
4.2 结合主动学习的文本识别实验分析 |
4.2.1 数据集 |
4.2.2 实验指标 |
4.2.3 主动及非主动学习对比 |
4.2.4 不同样本量下主动学习的影响 |
4.2.5 主动及非主动收敛性对比分析 |
4.3 基于生成对抗模型的数据增强实验分析 |
4.3.1 数据集及实验指标 |
4.3.2 实验指标 |
4.3.3 对比实验分析 |
4.4 本章小结 |
第五章 票据识别系统实现 |
5.1 系统设计及开发 |
5.1.1 功能模块 |
5.1.2 系统开发 |
5.2 机动车销售统一发票识别流程 |
5.3 身份证识别流程 |
5.4 系统演示 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 工作总结 |
6.2 未来研究方向 |
致谢 |
参考文献 |
攻读硕士学位期间取得的成果 |
(8)图像文字提取及基于Android的文字识别实现(论文提纲范文)
摘要 |
Abstract |
变量注释表 |
1 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.3 汉字可视化图像概述 |
1.4 本文的研究内容和结构安排 |
2 相关基础理论 |
2.1 数字图像处理基础知识 |
2.2 图像文字识别流程 |
2.3 Android系统构架及开发特色 |
2.4 本章小结 |
3 图像预处理算法研究 |
3.1 灰度化 |
3.2 降噪处理 |
3.3 削弱不均匀光照 |
3.4 边缘检测 |
3.5 二值化 |
3.6 本章小结 |
4 文字切分算法研究 |
4.1 水平投影法确定文本行 |
4.2 垂直投影切分法 |
4.3 确定单字符近似宽度值 |
4.4 模板切分法切分字符 |
4.5 实验与分析 |
4.6 本章小结 |
5 基于Android的文字识别实现 |
5.1 系统识别汉字流程 |
5.2 系统功能模块 |
5.3 系统性能测试 |
5.4 本章小结 |
6 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
作者简历 |
致谢 |
学位论文数据集 |
(9)基于遗传算法的字符识别特征提取技术研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景以及意义 |
1.2 国内外研究状况 |
1.2.1 国内研究状况 |
1.2.2 国外研究现状 |
1.3 本文所做的工作 |
1.4 论文的组织 |
2 字符识别的关键技术 |
2.1 印刷体与手写字体的区别与手写体的缺点 |
2.1.1 印刷体与手写体的区别 |
2.1.2 手写体的缺点 |
2.2 联机字符识别和脱机字符识别的区别 |
2.3 字符输入 |
2.4 字符预处理 |
2.4.1 图像的二值化 |
2.4.2 图像去噪 |
2.4.3 字符分割 |
2.4.4 字符细化 |
2.4.5 字符的归一化 |
2.5 特征提取 |
2.5.1 结构特征 |
2.5.2 统计特征 |
2.5.3 结构特征和统计特征融合 |
2.6 分类器设计 |
2.7 本章小结 |
3 字符特征提取算法的改进 |
3.1 导言 |
3.2 笔画结构特征提取算法 |
3.2.1 笔画结构特征介绍 |
3.2.2 笔画结构特征提取过程 |
3.2.3 笔画结构特征匹配 |
3.3 基于笔画结构特征改进算法 |
3.3.1 曲线的曲直转化 |
3.3.2 直线笔画的角度获取 |
3.4 基于改进特征提取的字符识别 |
3.5 改进算法与其他方法的比较 |
3.6 本章小结 |
4 基于遗传算法的字符识别特征提取 |
4.1 引言 |
4.2 遗传算法 |
4.2.1 遗传算法定义 |
4.2.2 遗传算法的基本流程 |
4.2.3 初始种群的建立 |
4.2.4 自适应函数的确定 |
4.2.5 染色体的优化过程 |
4.3 改进特征提取结合遗传算法的实验结果 |
4.4 本章小结 |
5 总结与展望 |
5.1 论文研究总结 |
5.2 今后的研究展望 |
结论 |
参考文献 |
致谢 |
(10)基于深度学习的字符识别系统的研究与实现(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 本文的主要研究内容及论文主要结构 |
第二章 图像ROI提取算法 |
2.1 引言 |
2.2 现阶段图像ROI提取技术 |
2.3 边缘检测 |
2.3.1 Sobel算子 |
2.3.2 Laplacian算子 |
2.3.3 Canny边缘检测算子 |
2.3.4 Scharr滤波器 |
2.3.5 边缘检测算子对比分析 |
2.4 图像的形态学处理 |
2.4.1 图像的腐蚀 |
2.4.2 图像的膨胀 |
2.5 图像ROI提取算法的实现 |
2.6 本章小结 |
第三章 基于轻量级卷积神经网络的字符识别算法 |
3.1 引言 |
3.2 特征提取网络 |
3.2.1 LeNet及 AlexNet |
3.2.2 VGGNet |
3.2.3 GoogleNet |
3.2.4 ResNet |
3.2.5 DenseNet |
3.2.6 特征提取网络小结 |
3.3 基于主流框架的字符识别算法的实现 |
3.3.1 数据集的准备 |
3.3.2 网络模型 |
3.3.3 算法性能对比分析 |
3.4 深度卷积网络的轻量化处理算法 |
3.4.1 网络的计算复杂度 |
3.4.2 深度可分离卷积思想 |
3.5 基于轻量级网络的字符识别算法的实现 |
3.5.1 数据集的准备 |
3.5.2 基于DenseNet的轻量级字符识别模型 |
3.5.3 基于深度可分离卷积的轻量级字符识别模型 |
3.5.4 算法性能分析 |
3.6 本章小结 |
第四章 基于NLP的中文形近字纠错算法 |
4.1 引言 |
4.2 HMM基本算法模型 |
4.2.1 隐马尔科夫模型 |
4.2.2 N-gram语言模型 |
4.2.3 中文分词算法 |
4.3 基于HMM的形近字纠错算法的实现 |
4.3.1 词典的构成 |
4.3.2 基于HMM的形近字纠错算法模型 |
4.4 序列处理算法模型 |
4.4.1 词嵌入 |
4.4.2 循环卷积网络(RNN) |
4.4.3 基于RNN的序列处理模型 |
4.4.4 基于CNN的序列处理模型 |
4.4.5 基于Attention的序列处理模型 |
4.4.6 三种序列处理模型小结 |
4.5 基于encoder-decoder机制的形近字纠错算法的实现 |
4.5.1 数据集的准备 |
4.5.2 基于encoder-decoder机制的形近字纠错算法模型 |
4.6 两种形近字纠错算法的对比分析 |
4.7 本章小结 |
第五章 基于深度学习的字符识别系统的实现 |
5.1 引言 |
5.2 字符识别系统实现方案 |
5.3 字符识别系统识别效果 |
5.4 本章小结 |
第六章 全文总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
作者简介 |
致谢 |
四、印刷体数字快速识别算法在身份证编号数字识别中的应用(论文参考文献)
- [1]基于迁移学习的发票号码识别研究[J]. 黄为新,陶杨,张继超,苏笛,牛砚. 软件导刊, 2021(06)
- [2]自然场景采集的卡证票据精准识别方法[D]. 王家亮. 东华大学, 2021(09)
- [3]基于深度学习的藏文古籍木刻本文字识别研究[D]. 仁青东主. 西藏大学, 2021(11)
- [4]基于FPGA脱机光学字符识别系统的研究与设计[D]. 宋家毓. 兰州大学, 2021(09)
- [5]基于深度学习的集装箱编号识别技术研究与实现[D]. 李莉莉. 东华大学, 2021(09)
- [6]基于Yolo V4+Word2Vec的试卷问答题评分算法研究[D]. 包迪. 昆明理工大学, 2021(01)
- [7]机打票据图像结构化技术研究及应用[D]. 丁浩伦. 电子科技大学, 2021(01)
- [8]图像文字提取及基于Android的文字识别实现[D]. 李红. 山东科技大学, 2020(06)
- [9]基于遗传算法的字符识别特征提取技术研究[D]. 侯科睿. 大连海事大学, 2020(01)
- [10]基于深度学习的字符识别系统的研究与实现[D]. 曹钊铭. 东南大学, 2020(01)