简介:
最近在浏览其他资料是无意间看见了百度云的图文识别,可以利用baidu-aip进行文字识别,感觉很AI,就更具官方资料自己动手
编写了一个简易的代码实现OCR
1.在百度智能云创建一个应用
有百度账号的直接登陆,没有的话需要先注册,登陆成功后点击管理控制台
点击文字识别
创建应用
应用名称和应用描述可以随意填写,然后点击确定,回到上一页面点击管理应用
其中的APPID、API key、secret Key都会在后面代码中用到
2.编写代码
点击技术文档,点击点击SDK文档,选择pythons语言——》快速入门
执行前需要先安装python SDK
如果安装pip 执行 pip install baidu-aip
新建python文件代码如下:
from aip import AipOcr
""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
常量APP_ID在百度智能云控制台中创建,常量API_KEY与SECRET_KEY是在创建完毕应用后,系统分配给用户的,均为字符串,用于标识用户,为访问做签名验证,可在AI服务控制台中的应用列表中查看。
通用文字识别
""" 读取图片 """
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
image = get_file_content('example.jpg')
""" 调用通用文字识别, 图片参数为本地图片 """
client.basicGeneral(image);
其中get_file_content中的expample.jpg是你所要识别完整图片所在的位置
完整代码:
#!/usr/bin/python
# -*- coding: UTF-8 -*-
from aip import AipOcr
import re
APP_ID = '22846287'
API_KEY = 'bHiBeiNHr38qXECDyYeefo76'
SECRET_KEY = '6mB4Gf4oZCStaPLlpZot5y1fYwdl8Tl5'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
image = get_file_content('ali.png')
res = client.general(image)
for item in res['words_result']:
print item['words']
识别效果:
此代码比较简单主要只是一个简单介绍,你可以添加文档中的参数来实现具体要求和更加完善的图文识别。