{ "cells": [ { "cell_type": "markdown", "metadata": { "collapsed": false }, "source": [ "\n", "# 文本识别算法理论\n", "\n", "本章主要介绍文本识别算法的理论知识,包括背景介绍、算法分类和部分经典论文思路。\n", "\n", "通过本章的学习,你可以掌握:\n", "\n", "1. 文本识别的目标\n", "\n", "2. 文本识别算法的分类\n", "\n", "3. 各类算法的典型思想\n", "\n", "\n", "## 1 背景介绍\n", "\n", "文本识别是OCR(Optical Character Recognition)的一个子任务,其任务为识别一个固定区域的文本内容。在OCR的两阶段方法里,它接在文本检测后面,将图像信息转换为文字信息。\n", "\n", "具体地,模型输入一张定位好的文本行,由模型预测出图片中的文字内容和置信度,可视化结果如下图所示:\n", "\n", "