当前位置: 首页 > news >正文

企业网站 建设 外包/电子商务是干什么的

企业网站 建设 外包,电子商务是干什么的,wordpress主页显示浏览数,做羞羞的事的网站晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI有时你遇到一篇古老的文献,PDF文档还是扫描版。又或者是遇到一幅网页版海报,上面的文字你完全看不懂。但你无法把图片中的文字复制下来做进一步处理,是不是让人头大?虽然市场上有很多…

晓查 发自 凹非寺

量子位 报道 | 公众号 QbitAI

有时你遇到一篇古老的文献,PDF文档还是扫描版。又或者是遇到一幅网页版海报,上面的文字你完全看不懂。

但你无法把图片中的文字复制下来做进一步处理,是不是让人头大?

虽然市场上有很多OCR软件可以识别图片中的文字,但还是有种种局限性,比如无法识别文字排版,需要转成其他文件后才能处理,无法直接操作。

最近,一位来自MIT的学生Kevin Kwok解决了以上这些问题。他用计算机视觉算法写了个Chrome插件Naptha,可以直接识别网页图片中的文字,并直接对它们进行高亮、复制粘贴、翻译、修改等操作。

25913849-d618-eb11-8da9-e4434bdf6706.png

拾取图片中的文字

Naptha无需在电脑上安装App,直接在Chrome应用商店中搜索Project Naptha,就可以看到这款插件,一键安装后即可在Chrome浏览器中使用。

Naptha可以用于在线漫画、扫描文档,甚至连拍摄照片中的文字也能识别出来。

普通的网页文字自然不在话下:

26913849-d618-eb11-8da9-e4434bdf6706.png

如果是别人给你发过来的扫描文件也没关系,直接把文件拖到Chrome浏览器中(Chrome支持打开多种本地文件),Naptha就能识别。

28913849-d618-eb11-8da9-e4434bdf6706.png

对于照片中的图片,Naptha也能够读出。作者Kevin拍摄了一本书的封面,除了文字不清晰、竖向排列的情况,封面的书名和简介都能正常识别出来。

29913849-d618-eb11-8da9-e4434bdf6706.png

Naptha还支持读取表格文字,并将复制下来的文字粘贴到Excel里。

2a913849-d618-eb11-8da9-e4434bdf6706.png

Kevin承诺,Naptha未来还会加入翻译、除去文字水印、直接在图片上修改文字等功能。这些功能目前还处在beta测试阶段,处于不稳定或者不可用状态。

2b913849-d618-eb11-8da9-e4434bdf6706.png

不是OCR,是文本检测

光学字符识别(OCR)已经不是什么新鲜事了,虽然Naptha实现的功能看起来像OCR,但实际上它主要功能实际上是文本检测。

一般的OCR不包含语言模型,而Naptha则可以根据上下文的概率输出一系列字母。比如把一串字符判定成“hello”,而不是“he1 | o”。

OCR需要知道图片中的语言才能正确识别文本,Naptha使用的是一种称为“ 笔划宽度变换”的算法,该算法由微软研究院于2008年提出,它就像人一样,即使不知道是何种语言,也能猜到文字就在那里。

2e913849-d618-eb11-8da9-e4434bdf6706.png

结合其他算法,如连通分量分析(识别不同的字母)、otsu阈值(确定字间距)、不相交的集合森林(识别文本行),Naptha可以非常快速地建立文本区域、单词和字母的模型,识别图中存在哪些特定字母。

通过一些基本的布局分析和文本度量,Naptha还可以找出文本的对齐参数、字体大小和字体粗细。有了这些信息,它可以在同一个地方以类似的字体重新打印文本,或者将文本改成同字体的其他文字。

传送门

博客地址:

https://projectnaptha.com/

Chrome插件下载地址:

https://chrome.google.com/webstore/detail/project-naptha/molncoemjfmpgdkbdlbjmhlcgniigdnf

— 完 —

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

http://www.lbrq.cn/news/1313461.html

相关文章:

  • 网站产品展示怎么做/互联网运营推广是做什么的
  • 科技信息网站建设的背景/桂林seo顾问
  • 网站开发 沈阳/品牌推广活动策划案例
  • 无锡网站建设公司排名/百度开户联系方式
  • 网站怎么更换服务器/西安关键字优化哪家好
  • 企业网站色彩/百度搜索趋势
  • 问卷调查网站JAVA怎么做/客服外包平台
  • 酷炫网站源码/通州区网站快速排名方案
  • 中原区网站建设/seo裤子的关键词首页排名有哪些
  • 同一个公司可以做几个网站吗/活动推广
  • 31省市今天新增疫情最新消息/百度seo优化推广
  • 网站快速收录的方法/线上广告接单平台
  • 杭州企业网站/湖南网站建设加盟代理
  • 同性男做的视频网站/百度收录快的发帖网站
  • 网站建设网站公司/seo和sem是什么
  • 设计师推荐网站欣赏/怎么做网站广告
  • 恒华大厦做网站公司/中国互联网公司排名
  • 用织梦做网站费用/怎么样把广告做在百度上
  • 做租凭网站是经营性吗/百度浏览器官网入口
  • 网站建设发展史/企业推广视频
  • 网站制作需要哪些软件有哪些/2024会爆发什么病毒
  • 网站死链接检查/指数基金怎么买才赚钱
  • 中国建筑企业公司排名/站长之家seo信息
  • 驾校报名网站怎么做/我想学做互联网怎么入手
  • wordpress进阶教程/南京企业网站排名优化
  • 爱采购/北京推广优化公司
  • 网站开发哪家公司/最近的国际新闻大事
  • 中山企业网站制作公司/百度站长平台网页版
  • 做网站给客户聊天记录/黄页网站推广效果
  • 做的网站打不开/seo搜索优化工具
  • 查看.bin二进制文件的方式(HxD十六进制编辑器的安装)
  • IIS网站间歇性打不开暴力解决方法
  • Jfinal+SQLite java工具类复制mysql表数据到 *.sqlite
  • [源力觉醒 创作者计划]_文心大模型4.5开源部署指南:从技术架构到实战落地
  • 攻防世界——Web题 very_easy_sql
  • 大模型-量化技术