LEADTOOLS 创建基于HTML5的零占用OCR文字识别
moboyou 2025-07-08 04:16 11 浏览
LEADTOOLS提供了屡获奖项的文字识别OCR开发包。使用全新的HTML5查看器和RESTful Web服务,你可以创建一个令人难以置信的识别应用程序,它能够运行在任意的台式电脑、平板电脑或移动设备上。无需牺牲移动设备的速度和功能,开发者现在可以享受到强大桌面应用程序拥有的所有好处。由于应用程序本质上是跨平台的,因此程序员可以节省很多时间以及测试的成本,在更新和维护应用程序时拥有一个更平和的心态。
LEADTOOLS SDK HTML5&OCR的主要功能
· 用于跨平台图像查看的HTML5/JavaScript Viewer控件。
· 支持HTML5,可以运行在任何台式机、平板电脑或移动设备上的浏览器。
· 支持鼠标和多点触控(手势)输入。
· 交互模式包括:
a. 平移
b. 缩放
c. 区域缩放
d. 以点为中心缩放
e. 放大镜
f. 合拢分开手指进行缩放
g. 回弹效果
· 基于物理和逻辑单元显示图像。
· 图像操作内置以下动作:
a. 旋转
b. 翻转
c. 缩放
· 本地化的图像注释和标记。
· 包含源码,易于定制和品牌化。
· 扩展LEADTOOLS RESTful Web服务,添加高级功能,如扩展后文件格式支持(TIFF、PDF、DOC、DICOM等),OCR和条码。
· 快速、准确、多线程的OCR文字识别引擎,用于桌面应用程序或高性能的服务器环境。
· 整页和区域OCR。
· 支持广泛的语言和字符集,包括拉丁文、斯拉夫字母、东亚语言和阿拉伯语。
· 强大的文档图像清理和预处理功能
· 从任意颜色、灰度或黑白图像中提取文本。
· 使用LEADTOOLS Cloud SDK轻松创建灵活的、强大的和高效的分布式OCR应用程序。
包含 HTML5 & OCR文字识别技术的SDK产品
HTML5 / JavaScript Viewer控件
这个例子我们使用到HTML5 Image Viewer控件,展示了如何调用OCR RESTful web服务。文章中的示例并没有包含所有代码。
OCR RESTful Web服务
LEADTOOLS OCR RESTful Web 服务是将OCR功能添加到任意应用程序中的简单方法,无需下载庞大的语言识别库和可执行程序。它只需要一组简单的参数(原始图像和识别区域),并将结果以容易解析的JSON结构返回。
在这个示例中,我们为您展示了如何使用web服务执行两种类别的识别:部分的或整页的。第一种通过使用查看器内置的rubber band事件选择一块小区域完成。使用鼠标单击拖动或手指触摸屏幕滑动,用户可以在图像中选择一个矩形,触发事件然后将它们的坐标传递给后台的web Service。
一旦服务按照onReadyStateChanged事件处理完成,你就可以使用JSON解析响应,根据应用程序的需要显示或使用识别出的文本。在下面的例子中,我们会在一个警告框中显示文字。
_selectRecognizeArea_RubberBandCompleted$1: function HTML5DemosLibrary__ocrDemo$ _selectRecognizeArea_RubberBandCompleted$1(sender, e) { // 获取选中的区域,将它作为OCR文字识别的一个区域 var searchArea = Leadtools.LeadRectD.fromLTRB(e.get_point1.get_x, e.get_point1.get_y, e.get_point2.get_x, e.get_point2.get_y); var visibleRect = _viewer.imageControlRectangle(true); searchArea.intersect(visibleRect); searchArea = _viewer.convertRect(Leadtools.Controls.CoordinateType.control, Leadtools.Controls.CoordinateType.image, searchArea); if (searchArea.get_width > 3 && searchArea.get_height > 3) { this._recognize$1(searchArea); } }, _recognize$1: function HTML5DemosLibrary__ocrDemo$_recognize$1(searchArea) { // 当等待时,显示正在加载的图片 this.beginOperation; // 创建请求 var rest = this.buildServiceUrl('ocr.svc'); rest += '/GetText?uri='; rest += _viewer.get_imageUrl; var imageSize = _viewer.get_imageSize; rest += '&width='; rest += parseInt(imageSize.get_width); rest += '&height='; rest += parseInt(imageSize.get_height); if (!searchArea.get_isEmpty) { // 没有选择,则识别整个页面 rest += '&left='; rest += parseInt(searchArea.get_left); rest += '&top='; rest += parseInt(searchArea.get_top); rest += '&right='; rest += parseInt(searchArea.get_right); rest += '&bottom='; rest += parseInt(searchArea.get_bottom); } // 创建请求和事件句柄 var request = new XMLHttpRequest; var _this = this; var readyStateChanged = function { if (request.readyState === 4) { if (request.status === 200) { var results = null; if (request.responseText != null && request.responseText.length > 0) { results = JSON.parse(request.responseText); } else { alert('No text was found in the specified area, please select another area that contains text and try again.'); } request.onreadystatechange = null; request = null; _this.endOperation(false); if (results != null) { alert (results); } } else { _this.showRequestError(request); } } }; // 发送请求 request.onreadystatechange = readyStateChanged; request.open('GET', rest, true); request.send; },
你可能注意到了如果没有给识别函数传递矩形,它会为整个图像创建一个矩形,然后调用web服务。因此程序员需要做的只是创建一个简单的按钮事件处理器完成整个页面的OCR。
var recognizeButton = document.getElementById('recognizeButton'); recognizeButton.addEventListener('click', function(e) { // 发送一个空区域,识别整个图像 _this._recognize$1(Leadtools.LeadRectD.get_empty); }, false);
总结
LEADTOOLS为开发者提供了世界一流的稳定图像库。易用的高级编程接口使业务关键型应用程序的快速开发变为可能。
HTML5和OCR RESTful Web服务是LEADTOOLS诸多功能中的一个。
本站文章除注明转载外,均为本站原创或翻译
相关推荐
- 软件下载超级合集(软件大集合)
-
注:AutoCAD软件解压密码均为:www.cadzxw.com(网址就是解压密码)AutoCAD2004:链接:http://pan.baidu.com/s/1i5yL4UT密码:wpxcAutoC...
- Discuz! Database Error(discuzdatabaseerror怎么解决)
-
(1017)Can'tfindfile:'./xyw/common_syscache.frm'(errno:13)SELECT*FROMcommon_syscacheWHERE`...
- 想在天上赏月?最全攻略来了(形容在天上赏月)
-
“但愿人长久,千里共婵娟。”赏月,是中秋夜的传统习俗之一。在地上赏月,或许人们已经习以为常,但在天上赏月又是怎样一番景象?记者梳理发现,为了满足广大旅客“上九天摘星揽月”的需求,春秋航空、南方航空等多...
- APP检测:安卓系统四大组件介绍(安卓的四大组件是什么?分别有什么作用?)
-
1、Activity组件漏洞Activity是Android组件中*基本也是*为常见用的四大组件之一,是一个负责与用户交互的组件。Activity组件中存在以下常见的漏洞。(1)activity绑定b...
- Markdown + 文档管理 + 静态网页生成,集大成的 Markdown 应用:MWeb
-
上周给大家推荐了Typora,作为一款纯粹的Markdown应用来说,它的各种功能和细节可以说已经相当极致,然而,Ulysses用户表示:我们想要的不仅仅是Markdown。是的,Markdo...
- Istio多集群实践(多集群架构)
-
为了实现应用高并发和高可用,企业通常会选择将应用部署在多个地域的多个集群,甚至多云、混合云环境中。在这种情况下,如何在多个集群中部署和管理应用,成为了一个挑战,当然多集群方案也逐步成为了企业应用部署的...
- 源码建站的流程是什么(有源码怎么建站)
-
1.选择适合自己需求的源码:在进行源码建站前,需要根据自己的需求选定一款适合自己的源码,一般建议选择流行度较高、稳定性较好的开源程序,如WordPress、Discuz等。2.下载源码:根据选择的...
- 论坛站长福利!积分墙Discuz插件火爆上线!
-
一款新型的Discuz插件正在火爆袭来,克服种种插件的弊端,全新打造,让你成为最成功最轻松的赚钱能手,这就是积分墙Discuz插件。积分墙Discuz插件(http://www.jifenqiang....
- 2020年了,公司还有必要做企业网站吗?网站开发是否过时呢
-
作为一个以网站开发起步的程序员,回想起来,曾经为不少客户做了网站。而我自己的网站已经六七年没有更新了,本想重新设计升级,但一直忙于做客户的系统开发,自己的网站就一直不管了,反正也没什么用,做得好还经常...
- 放大招,这才是低代码真正的形态PHP工作流引擎
-
放大招,这才是低代码真正的形态。来点干货,今天上点重头戏。表单设计中其实相对还是比较复杂的,比如常见的脚本,比如要控制一个默认的数值,大家可以看平台能够做到页面可以想输,输出什么?添加的时候进行操作。...
- OA源码解析:深入研究企业办公自动化系统的核心代码
-
随着信息技术的迅速发展,企业办公自动化(OfficeAutomation,简称OA)系统已成为现代企业管理中不可或缺的一部分。这些系统通过集成各种办公功能,如文档管理、流程管理、协作与通信等,极大地...
- 用PHP写了个数据分析框架示例代码
-
下面是一个简单的PHP数据分析框架的示例:```php<?php//1.数据收集functioncollectData(){//从数据库或API获取数据//...}//2.数据清...
- 「2022/02/02」thinkphp源码详细阅读(一)
-
thinkphp源码详细阅读(一)请求流程1.从入口index.php开始2.实例化App,我们看一下实例化所做的工作3.设置thinkPath、rootPath、appPath、...
- 【源码】效果最好的网格Shader(迄今为止)
-
我一直都在写Shader,其中有一个特定的Shader我一直想写好,但我总是因为一些我无法完全理解的原因而失败。然后过了几年,我用新学到的知识再次尝试,越来越接近,然后又失败。是什么Shader?模拟...
- 干货来了,一夜加粉百万的柏拉图源码仍给你
-
相信大家这几天都看到过一些关于“柏拉图app”公众号被封号的文章,主要内容是由于“柏拉图APP”推送的一条图文,叫做《生成你的性格标签,为自己带盐》,然后再短短的数日,柏拉图APP公众号便涨粉百万,阅...
- 一周热门
- 最近发表
- 标签列表
-
- 外键约束 oracle (36)
- oracle的row number (32)
- 唯一索引 oracle (34)
- oracle in 表变量 (28)
- oracle导出dmp导出 (28)
- oracle两个表 (20)
- oracle 数据库 字符集 (20)
- oracle安装补丁 (19)
- matlab化简多项式 (20)
- 多线程的创建方式 (29)
- 多线程 python (30)
- java多线程并发处理 (32)
- 宏程序代码一览表 (35)
- c++需要学多久 (25)
- css class选择器用法 (25)
- css样式引入 (30)
- html5和css3新特性 (19)
- css教程文字移动 (33)
- php简单源码 (36)
- php个人中心源码 (25)
- 网站管理平台php源码 (19)
- php小说爬取源码 (23)
- github好玩的php项目 (18)
- 云电脑app源码 (22)
- js创建txt文件 (18)