Skip to content

WaterLemons2k/ddddocr-basic

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

ddddocr-basic

Basic version of ddddocr (OCR only).


DdddOcr,其由 本作者kerlomz 共同合作完成,通过大批量生成随机数据后进行深度网络训练,本身并非针对任何一家验证码厂商而制作,本库使用效果完全靠玄学,可能可以识别,可能不能识别。

DdddOcr、最简依赖的理念,尽量减少用户的配置和使用成本,希望给每一位测试者带来舒适的体验

项目地址: 点我传送


Logo

一个容易使用的通用验证码识别python库
探索本项目的文档 »

· 报告Bug · 提出新特性

上手指南

环境支持
系统 CPU 备注
Windows 64 位 部分版本 windows 需要安装vc 运行库
Windows 32 位 ×
Linux 64 / ARM64
Linux 32 ×
Macos X64 M1/M2/M3...芯片参考#67
安装步骤

从 pypi 安装

pip install ddddocr-basic

项目底层支持

本项目基于dddd_trainer 训练所得,训练底层框架位 pytorch,ddddocr 推理底层抵赖于onnxruntime,故本项目的最大兼容性与 python 版本支持主要取决于onnxruntime

使用文档

基础 ocr 识别能力

主要用于识别单行文字,即文字部分占据图片的主体部分,例如常见的英数验证码等,本项目可以对中文、英文(随机大小写 or 通过设置结果范围圈定大小写)、数字以及部分特殊字符。

# example.py
import ddddocr

ocr = ddddocr.DdddOcr()

image = open("example.jpg", "rb").read()
result = ocr.classification(image)
print(result)

注意

之前发现很多人喜欢在每次 ocr 识别的时候都重新初始化 ddddocr,即每次都执行ocr = ddddocr.DdddOcr(),这是错误的,通常来说只需要初始化一次即可,因为每次初始化和初始化后的第一次识别速度都非常慢

参考例图

包括且不限于以下图片

captcha

captcha

captcha

captcha

captcha

captcha


captcha

captcha

captcha

captcha

captcha

captcha

Sponsor this project

Languages

  • Python 100.0%