跳转到内容

票据识别

票据识别,简单说,就是把发票、运单、回单、收据、签收单这类票据里的关键内容先提出来,变成后面系统和人都能继续使用的数据结果。

这项能力和普通 OCR 很像,但重点更窄、更具体。
票据类材料真正有价值的,往往不是整页文字,而是下面这些关键信息:

  • 单号
  • 金额
  • 日期
  • 开票方或承运方
  • 票据类型
  • 签收信息
  • 关键费用项

票据识别真正解决的,不是“把整张票看过一遍”,而是先把对账、报销、结算、复核最需要的字段拉出来。

这项能力接进来的,通常是各种格式不一的票据材料。

常见输入包括:

  • 发票扫描件
  • 运单照片
  • 回单图片
  • 收据截图
  • PDF 票据
  • 手机拍摄的纸面单据

一起带进来的上下文,常见还有这些:

  • 票据来源
  • 上传时间
  • 业务对象编号
  • 已知票种
  • 需要重点识别的字段
  • 对账场景
  • 结算周期

这些上下文很关键。因为票据识别不是只认字,还要知道:

  • 这张单到底是哪一类
  • 哪些字段最重要
  • 当前结果准备交给哪类后续流程

票据识别最后交出去的,不应该只是整页文本,而应该是一组更适合对账和审核使用的字段结果。

常见输出包括:

输出项说明
票据类型这是发票、运单、回单还是别的票据
核心编号单号、票号、运单号等
金额字段金额、税额、附加费等
日期信息开票时间、签收时间、运输时间等
主体信息开票方、承运方、收款方等
票据状态是否完整、是否模糊、是否缺页
可信度当前字段识别是否稳定
可疑项标记哪些关键字段建议人工复核

这样下游拿到的,就不是一张票据图片,而是一份更容易继续核对和流转的票据结果。

票据识别真正难的地方,不是只认字,而是先认清这是什么票,再把关键字段拉对。
它在内部通常会经过下面这条链。

不同票据长得不一样,关键字段也不一样。
系统通常会先判断这张材料更像:

  • 发票
  • 运单
  • 回单
  • 收据
  • 签收单

票据里最重要的往往是固定区域,比如:

  • 单号区
  • 金额区
  • 日期区
  • 主体区
  • 签章或签收区

到了这一步,系统才真正把:

  • 单号
  • 日期
  • 金额
  • 主体名称

这些字段提出来。

票据里的日期、金额、编号写法并不总是统一。
所以系统通常还会继续做:

  • 日期格式统一
  • 金额格式统一
  • 编号去空格和符号
  • 单位和币种整理

很多票据不是完全识别不了,而是关键位置有问题,比如:

  • 反光
  • 模糊
  • 遮挡
  • 缺页

系统通常会把这些风险字段单独标出来。

6. 最后把结果交给下游并保留原图回查

Section titled “6. 最后把结果交给下游并保留原图回查”

真正稳的票据识别,不只给字段,还要让人工随时能回看原票据,确认系统拉出来的内容有没有问题。

flowchart TB
    A[输入发票、运单、回单、收据等票据材料] --> B[识别票据类型]
    B --> C[定位单号、金额、日期、主体等关键区域]
    C --> D[提取关键字段]
    D --> E[统一编号、日期、金额和格式]
    E --> F[检查模糊、遮挡、缺页和关键字段缺失]
    F --> G{关键字段是否足够清楚?}
    G -->|否| H[标记可疑项并转人工复核]
    G -->|是| I[输出结构化票据结果]
    H --> J[人工确认后回流]
    I --> K[交给对账、审核、报销、结算等下游流程]
    J --> K

票据识别真正交给下游的,不只是识别文本,而是一组更适合票据处理的字段结果。

常见会交出去这些内容:

  • 票据类型
  • 单号和票号
  • 金额和日期
  • 主体信息
  • 可疑字段标记
  • 识别可信度
  • 原图回查入口

这样后面的流程才能继续做:

  • 对账比对
  • 费用审核
  • 报销复核
  • 结算处理
  • 异常追溯
  • 留痕归档

票据识别最怕的,不是识别不出来,而是识别完以后还是要人工重新抄一遍。

真正常见、也最有价值的接法,一般有下面几种:

票据一进来,系统就先把关键字段拉出来。
这样后面的对账和审核不会从图片重新开始。

票据往往只是对账链的一部分。
前面先把票据字段取出来,后面才能顺利做比对。

金额、单号、签收信息只要能先被结构化,后面的结算和复核动作就会轻很多。

识别之后,票据不再只是附件,而是能按字段查询和追溯的材料。

票据识别虽然很适合自动化,但下面这些情况最好让人工复核:

  • 票据图片反光严重
  • 单号或金额被遮挡
  • 同一页上存在多个单据
  • 票据版式特别非标
  • 关键字段本身印刷不清楚
  • 多页票据缺页
  • 金额和业务上下文明显冲突
  • 票据将直接影响重大结算结果

真正稳的企业做法,不是让系统强行识别所有票据,而是让它先接住大部分标准票据,把高风险票据交给人确认。

票据识别之所以在企业里很有价值,是因为很多结算、对账、审核动作,本来就卡在“先把票据里的关键字段拿出来”这一步。

1. 它解决的是“票在,但字段不在系统里”

Section titled “1. 它解决的是“票在,但字段不在系统里””

只要关键字段还锁在图片里,后面很多流程都要靠人工搬运。
这正是它最核心的价值。

2. 它特别适合高频、标准票据场景

Section titled “2. 它特别适合高频、标准票据场景”

越是重复量大、版式相对稳定的票据,越适合先由这项能力接住。

3. 它能把票据和后续结算链直接接起来

Section titled “3. 它能把票据和后续结算链直接接起来”

前面识别票据,后面对账、复核、结算。
它正好处在这条链的最前面。

4. 它边界清楚,所以更容易落地

Section titled “4. 它边界清楚,所以更容易落地”

标准票据自动识别,模糊票据人工复核。
这种接法最符合企业现场,也更容易稳定运行。