在本章节

阿里AI获WebVision图像识别冠军

在第三届图像识别竞赛WebVision中,阿里AI以82.54%的识别准确率击败了全世界150多支参赛队伍获得冠军,并将万物识别领域的历史纪录提升了3个百分点。

据悉,WebVision由谷歌、美国卡耐基梅隆大学、苏黎世联邦理工大学等机构联合全球视觉技术领域顶级学术会议CVPR发起,是目前图像识别领域最权威的竞赛之一,被业界誉为人工智能“世界杯”。

阿里AI能够识别超过100万种实体

本届竞赛中,参赛的AI模型需按要求将1600万张图片精准分类到5000个类目中。相较于经过人工标注完毕的ImageNet数据集,WebVision所采用的数据集直接从互联网爬取,没有经过人工标注,含有较多噪音,且数据类别的数量组成极大不平衡,AI的识别难度更高。

此次竞赛,阿里AI引入了构建类别语义标签关系的模型,并采用了辅助信息模型进行图像去噪的深度学习技术。赋予阿里AI这样强大的辨识能力的,是阿里巴巴自研的可以支持数十亿图片分类训练的超大平台,而此次竞赛结果也表明,现代深度学习技术可以不完全以人工标注数据为基础,人工智能未来有望真正摆脱“人工”。

阿里AI的识别能力不仅限于图片领域。目前,阿里AI不仅能够以超级速度对海量图片进行分类,还能识别超过100万种物理实体,例如5万种植物、1万种鸟、1千种不同型号的车……基于愈趋成熟的万物识别能力,未来,阿里AI有望进一步提升对各式场景的理解能力,从“观察”“分辨”能力向“创造”能力进化,在AI自动复原图像、自动生成图像等领域“大展拳脚”。