python+百度云文字识别api实现图片文字识别


简介:

最近在浏览其他资料是无意间看见了百度云的图文识别,可以利用baidu-aip进行文字识别,感觉很AI,就更具官方资料自己动手
编写了一个简易的代码实现OCR

1.在百度智能云创建一个应用

直达百度智能云

有百度账号的直接登陆,没有的话需要先注册,登陆成功后点击管理控制台

image-20201021083432303

点击文字识别

image-20201021083519560

创建应用

image-20201021083608111

应用名称和应用描述可以随意填写,然后点击确定,回到上一页面点击管理应用

image-20201021084008883

其中的APPID、API key、secret Key都会在后面代码中用到

2.编写代码

点击技术文档,点击点击SDK文档,选择pythons语言——》快速入门

image-20201021084320703

执行前需要先安装python SDK

如果安装pip 执行 pip install baidu-aip

新建python文件代码如下:

from aip import AipOcr

""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

常量APP_ID在百度智能云控制台中创建,常量API_KEY与SECRET_KEY是在创建完毕应用后,系统分配给用户的,均为字符串,用于标识用户,为访问做签名验证,可在AI服务控制台中的应用列表中查看。

通用文字识别

""" 读取图片 """
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

image = get_file_content('example.jpg')

""" 调用通用文字识别, 图片参数为本地图片 """
client.basicGeneral(image);

其中get_file_content中的expample.jpg是你所要识别完整图片所在的位置

完整代码:

#!/usr/bin/python
# -*- coding: UTF-8 -*-
from aip import AipOcr
import re
APP_ID = '22846287'
API_KEY = 'bHiBeiNHr38qXECDyYeefo76'
SECRET_KEY = '6mB4Gf4oZCStaPLlpZot5y1fYwdl8Tl5'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()
image = get_file_content('ali.png')
res = client.general(image)
for item in res['words_result']:
    print item['words']
    

识别效果:

image-20201021091436632

此代码比较简单主要只是一个简单介绍,你可以添加文档中的参数来实现具体要求和更加完善的图文识别。


文章作者: axing
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 axing !
评论
  目录