OCR
-
ocr识别原理和场景应用浅析
近些年来得益于AI技术的井喷式发展,OCR进入新的发展纪元,本篇主要介绍目前OCR的主流实现方案和评估指标。
-
OCR终结了?旷视提出支持文档级OCR的多模态大模型,支持中英文,已开源!
研究团队注意到原本可能需要几千tokens 的页面内容,通过文档图片输入,信息被Vary压缩在了256个图像tokens中,这也为进一步的页面分析和总结提供了更多的想象空间。
-
17个超级实用OCR开源项目
OCR技术能够实现多场景和多语言的识别,还能通过提取图像中的文本分析其所包含的语义信息,为机器理解图像提供高层语义线索。
-
12个完全免费的OCR开源项目
EasyOCR基于机器学习(CRNN)实现OCR功能。它能够识别超过80种语言的文字,包括简体中文和繁体中文。它是使用python开发的,因此使用Python调用也非常简单。
-
12个完全免费的OCR开源项目
EasyOCR基于机器学习(CRNN)实现OCR功能。它能够识别超过80种语言的文字,包括简体中文和繁体中文。它是使用python开发的,因此使用Python调用也非常简单。
-
文本识别 OCR 解决方案
chineseocr_lite 是一个轻量级中文 OCR 项目,提供将图片上的中文转成字符串的功能。支持竖排文字,识别支持 ncnn、mnn、tnn 推理 (dbnet (1.8M) + crnn (2.5M) + anglenet (378KB)),总模型仅 4.7M
-
自动数据采集的好处
在这个数字化的时代,企业每天都会收发许多文件。但从各种文件中提取非结构化数据对于企业来说依然是一件难事,如发票和采购单。如今,超过80%的数据是非结构化的,而且在2023年以后非结构化数据预计会增长继续增长。 然而,随着自动数据采集技术的出现,这一过程已被彻底改变。技术为企业带来了很多便利。
-
什么是光学和智能字符识别?
物理文档可能会损坏或丢失,而OCR和ICR可提供占用所需空间的数字备份。相比于手动搜索存储区域的文档,数字化信息可以快速搜索。
-
OCR在转转游戏的应用
在用户发布游戏商品时,我们希望用户将参数填得越全越好,这样有助于搜索、个性化推荐、统计数据。
-
使用Python和OCR进行文档解析的完整代码演示(附代码)
本文中将使用Python演示如何解析文档(如pdf)并提取文本,图形,表格等信息。
-
用OCR技术,自动识别各种验证码,工具已开源
OCR的核心技术包含两方面,一是目标检测模型检测图片中的文字,二是文字识别模型,将图片中的文字转成文本文字。
-
几款开源的OCR识别项目,收藏备用
一般开源项目,识别率肯定没有商用的那么高,只有通过训练自己的字库来提高识别率。
-
OCR+ChatGPT识别食品配料里的狠活!
这次的程序不两个不同的地方,第一,配料详情调用ChatGPT获取,免爬取,结果更精准。第二,web开发框架用gradio,gradio和streamlit类似,都是为了方便AI人员能快速构建web app的框架。