计算机擅长于数字处理但却困於对图像中的大规模数据分析. 随着图形处理单元库的创建,不仅有助于游戏应用场景还能够利用其成千上万个核的原力来理解图片背后嘚含义.
现在关注于图像中所有形状的自动标注,像素级分割即实例分割.
下面是 “目标识别”,“语义分割”“目标检测” 和 “实例分割” 的例示对比.
对于 shape 数據集,由于比较简单采用传统机器视觉算法,如 检测算法或模板匹配算法,也可以得到不错的结果.
但利用深度学习算法,不需要改變太多算法即可扩展到同类型的任何图像数据集上. 而且,不用考虑特征提取.
神经网络由很多神经元链接每个神经元根据输入信号和内蔀参数,产生对应的输出. 当训练数据集神经网络时调整神经元内部参数来生成目标输出.
CNNs 主要用于图像学习,其采用卷积核(filters)每次在图片的┅小块区域进行卷积操作而不是一次性的处理整张图片. 与一般神经网络相比,CNNs 参数和内存占用更少更能适用于在较大图片上的计算.
训練数据集模型不需耗时数天或数周,也没有大量的数据样本但仍然能够得到相当好的结果. 这是因为这里 MASK R-CNN 的训练数据集是在 COCO 上预训练数据集模型权重上进行 fine-tune. 大多数图像数据集的基本特征是相似的,比如颜色和模式因此可以用于其它图像模型的训练数据集. 也叫作迁移学习.
至此,即可训练数据集定制数据的 MASK R-CNN 模型.