票据识别
这项能力到底在做什么
Section titled “这项能力到底在做什么”票据识别,简单说,就是把发票、运单、回单、收据、签收单这类票据里的关键内容先提出来,变成后面系统和人都能继续使用的数据结果。
这项能力和普通 OCR 很像,但重点更窄、更具体。
票据类材料真正有价值的,往往不是整页文字,而是下面这些关键信息:
- 单号
- 金额
- 日期
- 开票方或承运方
- 票据类型
- 签收信息
- 关键费用项
票据识别真正解决的,不是“把整张票看过一遍”,而是先把对账、报销、结算、复核最需要的字段拉出来。
它通常接收什么输入
Section titled “它通常接收什么输入”这项能力接进来的,通常是各种格式不一的票据材料。
常见输入包括:
- 发票扫描件
- 运单照片
- 回单图片
- 收据截图
- PDF 票据
- 手机拍摄的纸面单据
一起带进来的上下文,常见还有这些:
- 票据来源
- 上传时间
- 业务对象编号
- 已知票种
- 需要重点识别的字段
- 对账场景
- 结算周期
这些上下文很关键。因为票据识别不是只认字,还要知道:
- 这张单到底是哪一类
- 哪些字段最重要
- 当前结果准备交给哪类后续流程
它能输出什么结果
Section titled “它能输出什么结果”票据识别最后交出去的,不应该只是整页文本,而应该是一组更适合对账和审核使用的字段结果。
常见输出包括:
| 输出项 | 说明 |
|---|---|
| 票据类型 | 这是发票、运单、回单还是别的票据 |
| 核心编号 | 单号、票号、运单号等 |
| 金额字段 | 金额、税额、附加费等 |
| 日期信息 | 开票时间、签收时间、运输时间等 |
| 主体信息 | 开票方、承运方、收款方等 |
| 票据状态 | 是否完整、是否模糊、是否缺页 |
| 可信度 | 当前字段识别是否稳定 |
| 可疑项标记 | 哪些关键字段建议人工复核 |
这样下游拿到的,就不是一张票据图片,而是一份更容易继续核对和流转的票据结果。
它在内部是怎么跑起来的
Section titled “它在内部是怎么跑起来的”票据识别真正难的地方,不是只认字,而是先认清这是什么票,再把关键字段拉对。
它在内部通常会经过下面这条链。
1. 先判断票据类型
Section titled “1. 先判断票据类型”不同票据长得不一样,关键字段也不一样。
系统通常会先判断这张材料更像:
- 发票
- 运单
- 回单
- 收据
- 签收单
2. 再定位票据上的关键区域
Section titled “2. 再定位票据上的关键区域”票据里最重要的往往是固定区域,比如:
- 单号区
- 金额区
- 日期区
- 主体区
- 签章或签收区
3. 再提取关键字段
Section titled “3. 再提取关键字段”到了这一步,系统才真正把:
- 单号
- 日期
- 金额
- 主体名称
这些字段提出来。
4. 再做字段标准化
Section titled “4. 再做字段标准化”票据里的日期、金额、编号写法并不总是统一。
所以系统通常还会继续做:
- 日期格式统一
- 金额格式统一
- 编号去空格和符号
- 单位和币种整理
5. 再检查完整度和可疑项
Section titled “5. 再检查完整度和可疑项”很多票据不是完全识别不了,而是关键位置有问题,比如:
- 反光
- 模糊
- 遮挡
- 缺页
系统通常会把这些风险字段单独标出来。
6. 最后把结果交给下游并保留原图回查
Section titled “6. 最后把结果交给下游并保留原图回查”真正稳的票据识别,不只给字段,还要让人工随时能回看原票据,确认系统拉出来的内容有没有问题。
票据识别的详细内部流程图
Section titled “票据识别的详细内部流程图”flowchart TB
A[输入发票、运单、回单、收据等票据材料] --> B[识别票据类型]
B --> C[定位单号、金额、日期、主体等关键区域]
C --> D[提取关键字段]
D --> E[统一编号、日期、金额和格式]
E --> F[检查模糊、遮挡、缺页和关键字段缺失]
F --> G{关键字段是否足够清楚?}
G -->|否| H[标记可疑项并转人工复核]
G -->|是| I[输出结构化票据结果]
H --> J[人工确认后回流]
I --> K[交给对账、审核、报销、结算等下游流程]
J --> K
它最后会把什么交给下游流程
Section titled “它最后会把什么交给下游流程”票据识别真正交给下游的,不只是识别文本,而是一组更适合票据处理的字段结果。
常见会交出去这些内容:
- 票据类型
- 单号和票号
- 金额和日期
- 主体信息
- 可疑字段标记
- 识别可信度
- 原图回查入口
这样后面的流程才能继续做:
- 对账比对
- 费用审核
- 报销复核
- 结算处理
- 异常追溯
- 留痕归档
它怎么接入业务才真正有价值
Section titled “它怎么接入业务才真正有价值”票据识别最怕的,不是识别不出来,而是识别完以后还是要人工重新抄一遍。
真正常见、也最有价值的接法,一般有下面几种:
1. 接在票据上传入口后面
Section titled “1. 接在票据上传入口后面”票据一进来,系统就先把关键字段拉出来。
这样后面的对账和审核不会从图片重新开始。
2. 接在表格和对账前面
Section titled “2. 接在表格和对账前面”票据往往只是对账链的一部分。
前面先把票据字段取出来,后面才能顺利做比对。
3. 接在结算和复核前面
Section titled “3. 接在结算和复核前面”金额、单号、签收信息只要能先被结构化,后面的结算和复核动作就会轻很多。
4. 接在资料归档前面
Section titled “4. 接在资料归档前面”识别之后,票据不再只是附件,而是能按字段查询和追溯的材料。
什么情况下必须转人工
Section titled “什么情况下必须转人工”票据识别虽然很适合自动化,但下面这些情况最好让人工复核:
- 票据图片反光严重
- 单号或金额被遮挡
- 同一页上存在多个单据
- 票据版式特别非标
- 关键字段本身印刷不清楚
- 多页票据缺页
- 金额和业务上下文明显冲突
- 票据将直接影响重大结算结果
真正稳的企业做法,不是让系统强行识别所有票据,而是让它先接住大部分标准票据,把高风险票据交给人确认。
为什么这项能力站得住
Section titled “为什么这项能力站得住”票据识别之所以在企业里很有价值,是因为很多结算、对账、审核动作,本来就卡在“先把票据里的关键字段拿出来”这一步。
1. 它解决的是“票在,但字段不在系统里”
Section titled “1. 它解决的是“票在,但字段不在系统里””只要关键字段还锁在图片里,后面很多流程都要靠人工搬运。
这正是它最核心的价值。
2. 它特别适合高频、标准票据场景
Section titled “2. 它特别适合高频、标准票据场景”越是重复量大、版式相对稳定的票据,越适合先由这项能力接住。
3. 它能把票据和后续结算链直接接起来
Section titled “3. 它能把票据和后续结算链直接接起来”前面识别票据,后面对账、复核、结算。
它正好处在这条链的最前面。
4. 它边界清楚,所以更容易落地
Section titled “4. 它边界清楚,所以更容易落地”标准票据自动识别,模糊票据人工复核。
这种接法最符合企业现场,也更容易稳定运行。