这天,咖哥突然问:“同学们,欣赏一幅画时,是整体地看,还是从上到下、从左到右地看?”
大家回答:“整体看。”
咖哥继续问:“那么当看一本书的时候,是整页地看,还是从上到下、从左到右有次序地看?”
小冰说:“你说呢?”
咖哥说:“小冰,别以为我在开玩笑。我想引出图形图像识别和自然语言处理这两种应用的不同之处。”
应用卷积网络处理图形图像,效果很好。无论是普通的深度神经网络,还是卷积网络,对样本特征的处理都是整体进行的,是次序无关的。在卷积网络中,虽然有一个通过滑动窗口抠取图块与卷积核进行卷积操作的过程,但对于每张图像来说,仍然是一个整体操作。也就是说,先处理左侧的特征图,还是先处理右侧的特征图,神经网络所得到的结果是完全相同的,预测值与操作特征的次序无关。
然而在面对语言文字的时候,特征之间的“次序”突然变得重要起来。本课中要讲的另一个重要神经网络模型—循环神经网络,就是专门用于处理语言、文字、时序这类特征之间存在“次序”的问题。这是一种循环的、带“记忆”功能的神经网络,这种网络针对序列性问题有其优势。
小冰听到这儿突然又激动了:“咖哥,这个循环神经网络来得正是时候。我的店铺中,有几个爆款产品最近收到了很多的评论,有好评,也有差评,数量多得我简直看不过来。我想,没时间一条条看评论的话,能不能将这些评论都输入机器,看看是哪些客户经常性地给产品差评呢?”
小冰:我可不管那么多,我只是要知道,哪些人给了我差评
“很好啊,”咖哥说,“这不正是适合用循环神经网络来解决的好案例吗。不过,我们还是先看看本课重点吧。”