我们在办公室的情况下,常常会碰到把视频內容转换为文本的要求吗?

你用哪种专用工具处理的?手机上是不是配置了图片转换文字作用?或是用QQ里的专用工具?

今日咱们就来介绍一下GitHub客户ianzhao05刚公布的实用工具——TextShot,只必须截屏就可以即时转化成文本。阅读者还可以根据这一新项目掌握怎样识别图像中的文本。

图片中文字提取出来-图片提取文字操作方法-第1张图片新项目连接:https://github.com/ianzhao05/textshot.

使用方法

运作textshot.py,在显示屏上开启一个遮盖图,并在要获取的文字地区中制作一个矩形框。

应用可选命令行参数特定语言表达。比如,python textshot.py eng fra将使用英文做为关键语言表达,法文做为主次语言表达。初始值为英文(英文)。保证为其它语言表达安裝了宇宙魔方的数据库文件。

提议将快捷键额外到此专用工具。针对Windows,您还可以应用全自动快捷键脚本制作来进行此实际操作。短消息拍攝。AHK还包括一个能够采用的ahk脚本制作实例。

如果是Ubuntu系统软件,能够打开键盘设定,表明全部Gnome键盘快捷键。底端有一个“ ”按键,能够用于加上自身的快捷方式图标。点击并将其指令设定为/usr/bin/python3。假如应用venv,上边的python3途径应当偏向venv的python3,而不是全局性python3。

图片中文字提取出来-图片提取文字操作方法-第2张图片一部分编码演试。

如何安装

安裝python3

拷贝TextShot库,应用自动跳转指令cd进到库;

(可选)建立一个虚拟器,比如,应用python-m venv . venv;

应用pip install -r requirements.txt安裝需要的程序包;

安裝了Google的Tesseract OCR模块,根据在系统软件途径中加上文件目录,能够从cmd浏览tesserract。

这一好用实用工具的开发设计也离不了Google經典的OCR开源软件Tesseract。

Tessract的应用。

Tesseract是近年用以设备打印出图像识别的最好开源系统OCR专用工具。20个世纪80年由hp惠普开发设计,2005年开源系统,2006年逐渐由Google冠名赞助。该产品在可控情况下也可以非常好地运作,但倘若在键入到Tesseract以前有大批量的噪音或图象沒有获得适度的解决,其特性便会很差。

图片中文字提取出来-图片提取文字操作方法-第3张图片宇宙魔方电子光学图像识别模块发生于20个世纪80时代,迄今一直在升级和迭代更新。它包含一个自带的深度神经网络实体模型,并已变成一个十分庞大的电子光学图像识别专用工具。宇宙魔方和OpenCV的EAST探测仪是一个非常好的组成。有兴趣的阅读者能够参照设备心血管汇报。

宇宙魔方适用Unicode(UTF-8)字段名,能够鉴别100多语种,还包含多种多样輸出适用,如纯文字,PDF,TSV等。可是,为了更好地得到更快的OCR結果,必须提升给予给Tesseract的图象品质。

特别注意的是,在实行具体的OCR以前,Tesseract将在內部实行各种各样图象处理实际操作(应用Leptonica库)。一般主要表现非常好,但在某种特殊状况下,实际效果不足好,造成准确度显著降低。在将图象传送到宇宙魔方以前,您能够试着下列图象处理技术性,可是用哪一种技术性在于客户要想载入的图象:

翻转图象

再次放缩。

二值化

去除噪音。

转动/调节弯曲视角。

清除边沿

全部这种实际操作都能够应用OpenCV或是根据Python应用numpy来完成。

最新版的tesserract(v4)适用根据深度神经网络的OCR,准确度明显提高。最底层的电子光学图像识别模块应用循环系统神经元网络(RNN-LSTM互联网)。

汉语OCR新项目。

身份证验证,火车车票鉴别等汉语OCR是基本实际操作,还能够完成更酷炫的作用,例如翻译笔在书本上滚动一行,全自动获得详细图象,鉴别翻译成中文。

现阶段较常用的汉语ocr开源软件是汉语OCR,它根据YOLO V3和CRNN完成了汉语当然情景文字的检验和鉴别。现阶段新项目有2.5K星。

以前,设备心引进了另一个开发的汉语ocr新项目,它是在汉语OCR的根基上改善而成的。是一个粘士汉字识别新项目。敬请参照:评测粘士汉语OCR开源软件,总型号规格仅有17M。

依据项目简介,与汉语ocr对比,汉语ocr_lite选用轻量主干网PSENet,轻量CRNN实体模型和行文字方位分类信息网AngleNet。尽管还是有许多工作能力必须完成,可是chineseocr_lite的总体实体模型仅有17M。现阶段,chineseocr_lite适用随意方位的文字检验,鉴别的时候会全自动分辨文字方位。设备核心的精确测量实际效果实例如下图所显示:

图片中文字提取出来-图片提取文字操作方法-第4张图片

评论(0条)

刀客源码 游客评论