当前位置: 首页 > news >正文

商丘网络有限公司/厦门seo搜索排名

商丘网络有限公司,厦门seo搜索排名,蒙城做网站的公司,学校网站 cmsTesseract的OCR引擎目前已作为开源项目发布在Google Project,其项目主页在这里查看 https://github.com/tesseract-ocr, 它支持中文OCR,并提供了一个命令行工具。python中对应的包是pytesseract. 通过这个工具我们可以识别图片上的文字。 1…

Tesseract的OCR引擎目前已作为开源项目发布在Google Project,其项目主页在这里查看 https://github.com/tesseract-ocr, 
它支持中文OCR,并提供了一个命令行工具。python中对应的包是pytesseract. 通过这个工具我们可以识别图片上的文字。

1、安装tesseract

yum install tesseract

2、安装pytesseract

pip install pytesseract

3、下载对应的中文训练集:https://github.com/tesseract-ocr/tessdata,下载”chi_sim.traineddata”,然后copy到训练数据集的存放路径。我安装后拷贝的路径是:

/usr/share/tesseract/tessdata

4、使用python调用识别中文

import pytesseract
from PIL import Imageimage = Image.open('data/ocr.png')
print pytesseract.image_to_string(image, lang = 'chi_sim')

5、图片识别准确率不高问题

from PIL import Image, ImageEnhanceimage = Image.open('data/tesseract.png')
enhancer = ImageEnhance.Contrast(image)
image = enhancer.enhance(4)

windows安装tesseract并配置环境参考这篇文章:https://segmentfault.com/a/1190000014086067

windows测试遇到的问题:pytesseract.pytesseract.TesseractError: (1, u'Error opening data file C:\\Progra......

import platform
import pytesseract
from PIL import Image, ImageEnhanceimage = Image.open('data/tesseract.png')
enhancer = ImageEnhance.Contrast(image)
image = enhancer.enhance(4)if platform.system() == 'Windows':tessdata_dir_config = '--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'print pytesseract.image_to_string(image, lang = 'chi_sim', config = tessdata_dir_config)
else:print pytesseract.image_to_string(image, lang = 'chi_sim')

如果需要使用更高精度的可以尝试百度的API:https://cloud.baidu.com/doc/OCR/OCR-Python-SDK.html#.E9.85.8D.E7.BD.AEAipOcr

参考:https://blog.csdn.net/hk_jh/article/details/8961449

http://www.lbrq.cn/news/771445.html

相关文章:

  • 企业网站怎么做优化/快速网站推广公司
  • 北京网站建设首选小峰/网站友情链接连接
  • 网站建设设计流程步骤/seo综合查询怎么进入网站
  • 建造网站的软件/青青河边草直播免费观看
  • 如何在行业门户网站上做推广/百度搜索工具
  • 公司网站的服务费做哪个科目/邯郸百度推广公司
  • 公司网站经典案例/google权重查询
  • 网站的备案要求/利尔化学股票股吧
  • 现在还有人用asp做网站/色盲测试
  • 局域网内网站建设的步骤过程/友情链接收录
  • 怎样制作做实景的网站/百度竞价规则
  • wordpress 官方网站/软件测试培训费用大概多少
  • 网站列表页模板/今日热点新闻事件摘抄
  • 网站设计工程师是it行业吗/交换链接的例子
  • 网站建设团队架构/如何开一个自己的网站
  • 谷歌有趣的网站/竞价推广哪里开户
  • 做返利网站/chatgpt网页
  • 注册代理公司/长沙网站seo优化
  • 免费网站建站手机/免费的推文制作网站
  • 近期热点舆情事件/seo广州工作好吗
  • 池州网站建设费用/天津优化代理
  • 开发公司支付前期物业开办费包括哪些内容/菏泽地网站seo
  • 九江企业网站制作/seo教程搜索引擎优化入门与进阶
  • 有什么国外的黄网站/百度指数查询工具
  • 做网站先做前端好还是先做逻辑/淘客推广怎么做
  • asp.net 如何设置网站首页/网站流量排行
  • 郑州做网站公司电话/查关键词热度的网站
  • 河北网站建设价格大全/利尔化学股票
  • 小米果怎么做视频网站/低价刷粉网站推广
  • 公司网站集群系统架构及建设思路/苏州seo网站公司
  • 2025 开源语音合成模型全景解析:从工业级性能到创新架构的技术图谱
  • 机器翻译:学习率调度详解
  • 电子电路原理学习笔记---第5章特殊用途二极管---第2天
  • Linux环境gitlab多种部署方式及具体使用
  • SSE流式输出分层与解耦、用户自动结束语错误处理
  • 网络性能优化:Go编程视角 - 从理论到实践的性能提升之路