通用文字识别 OCR

HTTPS
识别图片中的文字信息并返回文字位置及其内容信息,可用于用户原创内容的图像文字信息提取、文档文字信息提取等。
免费套餐
套餐 1
套餐 2
套餐 3
套餐 4
0 / 50 次

雷达评级

AA

用户规模

10 万+

产品上线

4

通用文字识别 OCR

接口地址
https://tupu.apistd.com/v3/recognition/general-ocr
请求格式
multipart/form-data
响应格式
application/json
请求方法
POST
请求参数 (Query)
参数类型必须描述
keystring
string
请求 AccessKey, 请在控制台中查看
请求参数 (Body)
参数类型必须描述
imagefile
string|file
1、支持传图片URL或者直接post图片文件,不过两者不能混在同一请求中;2、支持多个image参数,也就是上传多个图片文件;3、只支持对静态图像的处理,如:png、jpg、jpeg、tif、webp,不支持动态图像的处理,如:gif;如需识别请参考视频识别;4、为了加快网络传输速度,图片大小必须在1M以内,且建议对图片进行压缩处理,等比压缩到[256, 512]之间。
tagstring
string
用于给图片或文本附加额外信息(比如:直播客户可能传房间号,或者主播ID信息)。方便后续根据tag搜索到相关的图片或文本。1、支持多个tag参数,和image或text参数一一对应;2、如果tag只有一个,或者tag数量少于image或text,缺省用最后一个tag补全(尾补全)。
refererstring
string
根据图片url下载图片时,将其赋值给HTTP Header的Referer,用于图片防盗链
返回参数 (Body)
参数类型描述
codenumber
number
请求的状态码
messagestring
string
请求的状态信息
timestampnumber
number
当前的服务器的Unix时间戳
noncenumber
number
随机数
dataobject
object
识别任务的结果
fileListarray
array
每张图片的识别结果
namestring
string
如果上传的image参数是url,则该值是图片url;如果是以图片文件上传,则该值为文件名
objectsarray
array
检测出来的所有物体
locationarray
array
物体方框坐标[左上角坐标,右上角坐标,右下角坐标,左下角坐标]
degreenumber
number
文字的旋转角度,取值范围是[-180, 180],正表示顺时针,负表示逆时针
textstring
string
识别到的文本信息
categorynumber
number
检测到的物体类别,0表示文字
scoresnumber
number
检测得分,得分越高结果越准确,取值范围[0,1]
请求返回示例
{
  "data": {
    "fileList": [
      {
        "name": "test.jpg",
        "objects": [
          {
            "degree": 0,
            "location": [
              [
                0.022727264404296874,
                0.1666666644725926
              ],
              [
                0.15909091186523439,
                0.1666666644725926
              ],
              [
                0.15909091186523439,
                0.3333333355274074
              ],
              [
                0.022727264404296874,
                0.3333333355274074
              ]
            ],
            "scores": 0.9978030323982239,
            "text": "微信号",
            "category": 0
          },
          {
            "degree": 0,
            "location": [
              [
                0.6306818542480469,
                0.6041666208376343
              ],
              [
                0.9147727355957032,
                0.6041666208376343
              ],
              [
                0.9147727355957032,
                0.7500001056674208
              ],
              [
                0.6306818542480469,
                0.7500001056674208
              ]
            ],
            "scores": 0.9997721206058156,
            "text": "15827934231",
            "category": 0
          },
          {
            "degree": -1.457413492101156,
            "location": [
              [
                0.6359872589111328,
                0.1807315155947982
              ],
              [
                0.9660818328857422,
                0.1807315155947982
              ],
              [
                0.9660818328857422,
                0.34521910696379554
              ],
              [
                0.6359872589111328,
                0.34521910696379554
              ]
            ],
            "scores": 0.9996555997775152,
            "text": "15827934231",
            "category": 0
          }
        ]
      }
    ]
  },
  "code": 0,
  "message": "success",
  "nonce": "0.3014124736010655",
  "timestamp": 1506812492943
}

通用文字识别 OCR-API接口介绍