图像中文字区域检测算法研究(2)

2.5 算法框图    13
3设计    15
3.1 读取原图像    15
3.2 图像灰度化处理    16
3.3边缘检测    17
3.3.1 SOBEL边缘检测    17
3.3.2 图像二值化    18
3.4 形态学处理    19
3.5 文字检测    21
3.6 图像清除    23
3.7 GUI界面设计    24
4结论    26
4.1 灰度图像文字检测提取    26
4.2 边缘检测和图像二值化    26
4.3 形态学处理    27
4.4 文字区域检测    27
致谢    28
参考文献29
附录    31
1    绪论
生活在21世纪，随着计算机技、多媒体技术的飞速发展，以图像、音频和视频为主的多媒体信息被广泛应用在各个领域。在网络上，越来越多的网站页面内容以图片形式表现并嵌入丰富的文字信息，相当大数量的文字信息正在越来越多地以图像形式出现并且吸引更多的上网浏览者，如何从网上准确迅速地查找到用户所需的多媒体内容成为日益突出和紧迫的需求。与此同时，数字图像与视频图书馆等正在兴起，传统的图书馆为了满足用户对多媒体内容的查询需求，也渐渐开始收藏图像和音视频等内容，因而也需要有效的方法来组织和检索这些多媒体内容。
对于现代的人们来说，图像已经成为了重要的一个参考指标。就如网上流行的一句话叫做“有图有真相”。繁琐而冗长的文字让现代快节奏的人们浏览起来会非常不便，并且只是文字的话有些信息会让人难以信服。图像的存在就是替代这些繁琐且冗长的文字信息，我们大可以利用图像来读懂所需要的东西。此时嵌入在图像中的文字就变得尤为重要，如何快速辨别和检测图像中垃圾信息或者不需要的信息？这就是本次课题设计的意义和存在价值。
嵌入在图像中的文字信息在一定程度上是反映了该图像的部分内容或者进行一个大概的描述，形成对图像内容的简练描述或说明。提取和检测这些图像文字对于图像的理解、检索和浏览等都至关重要。大量的网络图片例如新闻图片、广告画等都通常在其内部嵌以简短的文字来概括所描述的事件和对象，用来帮助用户快速理解。如果这种图像格式的文字能被自动提取和检测，就可以让机器来自动理解图片的内容并对图片分类，并用这些文字来标注和检索图片。
随着互联网的普及，电子邮件E-mail作为一种被人们广泛使用的工具，已被越来越多的不法分子用作传销、反动等信息传播的工具，产生了大量的垃圾邮件。目前主流的垃圾过滤器是基于文本的，垃圾邮件制造者为了逃避被过滤，常常将文字转化为图像或者将文字嵌入到图像中，产生了大量的垃圾图像。如果能够提取和检测这些图像中的文字，就可以过滤掉一些不良的垃圾图像。图像中的文字信息与普通文本信息不同，不仅表现在格式上，而且图像通常背景复杂，文字分布零散，文字大小不一，颜色各异。
20世纪70年代兴起了光学字符识别（Optical Character Recognition，OCR）技术，OCR技术是自动识别二文点阵字符并将其转换为纯文本，目前商业的OCR技术对于二值图像中文字的提取识别已经趋于成熟，但在没有去除背景和二值化之前，现有的OCR系统还是难以识别出字符。因此在提交给OCR系统之前都必不可少地需要一个文字提取（text extraction）的过程，如何从复杂的彩色背景图像中检测提取出文字是一个必要研究的问题，其中检测准确提取图像中的文字区域是正确理解图像中文字信息的关键步骤。文字区域提取就是找出图像中文字所在的位置，用包围文字的外接矩形区域将其定位，是准确进行文字识别的前提。所以研究图像中文字区域检测算法研究是很有必要的！图像中文字区域检测算法研究(2):http://www.youerw.com/jisuanji/lunwen_16880.html