票据识别

这项能力到底在做什么

票据识别，简单说，就是把发票、运单、回单、收据、签收单这类票据里的关键内容先提出来，变成后面系统和人都能继续使用的数据结果。

这项能力和普通 OCR 很像，但重点更窄、更具体。
票据类材料真正有价值的，往往不是整页文字，而是下面这些关键信息：

单号
金额
日期
开票方或承运方
票据类型
签收信息
关键费用项

票据识别真正解决的，不是“把整张票看过一遍”，而是先把对账、报销、结算、复核最需要的字段拉出来。

它通常接收什么输入

这项能力接进来的，通常是各种格式不一的票据材料。

常见输入包括：

发票扫描件
运单照片
回单图片
收据截图
PDF 票据
手机拍摄的纸面单据

一起带进来的上下文，常见还有这些：

票据来源
上传时间
业务对象编号
已知票种
需要重点识别的字段
对账场景
结算周期

这些上下文很关键。因为票据识别不是只认字，还要知道：

这张单到底是哪一类
哪些字段最重要
当前结果准备交给哪类后续流程

它能输出什么结果

票据识别最后交出去的，不应该只是整页文本，而应该是一组更适合对账和审核使用的字段结果。

常见输出包括：

输出项	说明
票据类型	这是发票、运单、回单还是别的票据
核心编号	单号、票号、运单号等
金额字段	金额、税额、附加费等
日期信息	开票时间、签收时间、运输时间等
主体信息	开票方、承运方、收款方等
票据状态	是否完整、是否模糊、是否缺页
可信度	当前字段识别是否稳定
可疑项标记	哪些关键字段建议人工复核

这样下游拿到的，就不是一张票据图片，而是一份更容易继续核对和流转的票据结果。

它在内部是怎么跑起来的

票据识别真正难的地方，不是只认字，而是先认清这是什么票，再把关键字段拉对。
它在内部通常会经过下面这条链。

1. 先判断票据类型

不同票据长得不一样，关键字段也不一样。
系统通常会先判断这张材料更像：

发票
运单
回单
收据
签收单

2. 再定位票据上的关键区域

票据里最重要的往往是固定区域，比如：

单号区
金额区
日期区
主体区
签章或签收区

3. 再提取关键字段

到了这一步，系统才真正把：

单号
日期
金额
主体名称

这些字段提出来。

4. 再做字段标准化

票据里的日期、金额、编号写法并不总是统一。
所以系统通常还会继续做：

日期格式统一
金额格式统一
编号去空格和符号
单位和币种整理

5. 再检查完整度和可疑项

很多票据不是完全识别不了，而是关键位置有问题，比如：

反光
模糊
遮挡
缺页

系统通常会把这些风险字段单独标出来。

6. 最后把结果交给下游并保留原图回查

真正稳的票据识别，不只给字段，还要让人工随时能回看原票据，确认系统拉出来的内容有没有问题。

票据识别的详细内部流程图

flowchart TB
    A[输入发票、运单、回单、收据等票据材料] --> B[识别票据类型]
    B --> C[定位单号、金额、日期、主体等关键区域]
    C --> D[提取关键字段]
    D --> E[统一编号、日期、金额和格式]
    E --> F[检查模糊、遮挡、缺页和关键字段缺失]
    F --> G{关键字段是否足够清楚?}
    G -->|否| H[标记可疑项并转人工复核]
    G -->|是| I[输出结构化票据结果]
    H --> J[人工确认后回流]
    I --> K[交给对账、审核、报销、结算等下游流程]
    J --> K

它最后会把什么交给下游流程

票据识别真正交给下游的，不只是识别文本，而是一组更适合票据处理的字段结果。

常见会交出去这些内容：

票据类型
单号和票号
金额和日期
主体信息
可疑字段标记
识别可信度
原图回查入口

这样后面的流程才能继续做：

对账比对
费用审核
报销复核
结算处理
异常追溯
留痕归档

它怎么接入业务才真正有价值

票据识别最怕的，不是识别不出来，而是识别完以后还是要人工重新抄一遍。

真正常见、也最有价值的接法，一般有下面几种：

1. 接在票据上传入口后面

票据一进来，系统就先把关键字段拉出来。
这样后面的对账和审核不会从图片重新开始。

2. 接在表格和对账前面

票据往往只是对账链的一部分。
前面先把票据字段取出来，后面才能顺利做比对。

3. 接在结算和复核前面

金额、单号、签收信息只要能先被结构化，后面的结算和复核动作就会轻很多。

4. 接在资料归档前面

识别之后，票据不再只是附件，而是能按字段查询和追溯的材料。

什么情况下必须转人工

票据识别虽然很适合自动化，但下面这些情况最好让人工复核：

票据图片反光严重
单号或金额被遮挡
同一页上存在多个单据
票据版式特别非标
关键字段本身印刷不清楚
多页票据缺页
金额和业务上下文明显冲突
票据将直接影响重大结算结果

真正稳的企业做法，不是让系统强行识别所有票据，而是让它先接住大部分标准票据，把高风险票据交给人确认。

为什么这项能力站得住

票据识别之所以在企业里很有价值，是因为很多结算、对账、审核动作，本来就卡在“先把票据里的关键字段拿出来”这一步。

1. 它解决的是“票在，但字段不在系统里”

只要关键字段还锁在图片里，后面很多流程都要靠人工搬运。
这正是它最核心的价值。

2. 它特别适合高频、标准票据场景

越是重复量大、版式相对稳定的票据，越适合先由这项能力接住。

3. 它能把票据和后续结算链直接接起来

前面识别票据，后面对账、复核、结算。
它正好处在这条链的最前面。

4. 它边界清楚，所以更容易落地

标准票据自动识别，模糊票据人工复核。
这种接法最符合企业现场，也更容易稳定运行。