我们的大脑处理视觉信息似乎容易。我们人类不需要花费很大的力气去分辨狮子和豹子、读懂标牌、或识别人脸。但实际上这些都是难以用电脑解决的问题:它们只是看似简单因为人类的大脑拥有卓越的图像理解能力。

在过去几年里,机器学习这一领域在处理这些难题的方面取得了巨大的进步。值得一提的是,我们发现了一种深度学习模型——卷积神经网络(Convolutional Neural Network),其计算性能可以在高难度图像识别处理上得以体现——在某些领域中与人类大脑的性能相匹配甚至超越。

研究员们用ImageNet(计算机视觉的学术标杆)来验证他们的现有成果,从而证明了计算机视觉的稳步发展。其后的一些模型持续取得进展,每一次都获得最前沿的成果,例如QuocNet、AlexNet、Inception (GoogLeNet)、BN-Inception-v2。谷歌研究员和非谷歌研究员们都发表了描述这些模型的论文,但是难以得到一样的实验结果。我们现在来进入下一步,解析源代码,当中会使用最新的模型Inception-v3进行图像识别。

Inception-v3模型是使用2012年的数据训练的。这是计算机视觉的标准作业,模型尝试将所有图片数据归类到1000个类型里,例如“斑马”、“达尔马提亚狗”和“洗碗机”等。

这篇文章将教你如果使用Inception-v3。你会学到怎样使用Python将图片归类到1000个类型里。而且我们将讨论怎样从这个模型中提取出相对高级的特征,其可以重复使用在别的计算机视觉任务中。

 

源代码在此

 

以下命令将初始化你的运行环境——创建虚拟环境并激活、安装所需的包:

virtualenv env
source env/bin/activate
pip install -r requirements.txt

 

以下命令将运行你的模型、对以下熊猫图片进行归类:

python classify_image.py

 

如果模型正确运行,就会生成以下输出:

giant panda, panda, panda bear, coon bear, Ailuropoda melanoleuca (score = 0.88493)
indri, indris, Indri indri, Indri brevicaudatus (score = 0.00878)
lesser panda, red panda, panda, bear cat, cat bear, Ailurus fulgens (score = 0.00317)
custard apple (score = 0.00149)
earthstar (score = 0.00127)

 

如果想对其他图片进行归类,那么编辑--image_file参数:

python classify_image.py --image_file IMAGE_PATH

 

翻译自:https://www.tensorflow.org/tutorials/image_recognition

 

 

之后将解析源代码,请大家敬请期待。