深兰获ICPR2020大规模商品图像识别挑战赛冠军 深
日前,第25届国际模式识别会议(ICPR2020, International Conference on Pattern Recognition)正在意大利以线上的方式举行,各项挑战赛的结果也陆续公布。深兰科技DeepBlueAI团队,一举斩获“大规模商品识别挑战赛”和“图表信息提取竞赛”两项冠军,以及“EndoTect 胃肠道疾病自动检测竞赛”中两个赛道的亚军,既验证了技术实力,又为新零售、电商、医疗等领域提供了高效的解决方案。深兰科技也将在2021年,持续以人工智能技术为抓手,践行为各行业输送养分的“沃土”的理念。
作为模式识别的国际重要会议,已有50年历史的ICPR涵盖了计算机视觉、图像、声音、语音、传感器模式处理和机器智能等领域。本次会议的重量级竞赛——“大规模商品图像识别挑战赛”由ICPR 2020、Kaggle和JDAI等联合举办,要求参赛者对产品图片的细粒度分类提供解决方案,积极推动电商及新零售行业的发展。深兰科技Deep BlueAI团队勇夺冠军。
随着互联网技术和电子商务的迅猛发展,网购已成为主流的购物方式,如何快速地从图像和视频中自动识别出产品存货单元(SKU)级别的类别,并解决SKU级别的产品在视觉上相似、必须进行细粒度分类的需求,成为人工智能零售系统亟待完善的问题。JDAI构建了一个名为Products-10K的产品识别数据集,包含了约10000种经常被中国消费者购买的产品。挑战赛则基于该数据集展开,具有每个类别的数据量相对较少,并且类内间距大、类间间距小的特点,给分类带来了巨大的挑战。
DeepBlueAI团队针对大规模细粒度商品图像识别任务,通过数据分析、数据增强、网络结构设计以及Loss改进等方法,设计了一个简易的细粒度图像识别算法。该算法取得了Public & Private第一名的成绩,并领先第2名两个百分点,有望帮助人工智能零售系统快速并准确地从图像和视频中自动识别出SKU级别的类别,优化消费者的购物体验。据悉,同类方案已在深兰AI自贩柜中得以使用。用户通过扫描手脉,开门拿取商品、关门结算扣费,能实现犹如在冰箱准确取物的消费体验,其中对产品识别精确度的要求非常之高。
“图表信息提取竞赛”则由7个子赛题组成,任务涵盖图表分类、图表文本识别、文本功能分类、轴分析、图例分析、图元素提取等。对于每个子赛题,比赛按照数据集又分为UB PMC与Adobe Synth两个赛道,每个赛道单独计分,最终按照每个子赛题的得分总和进行排名。在该比赛的多个任务中,数据类别存在着分布极为不均衡的问题。联想、华南理工、合合等队伍参加了本次竞赛,DeepBlueAI团队最终拿下4个赛道冠军,以总分35分拿到总成绩第一名,获得本次比赛的总冠军。
“EndoTect 胃肠道疾病自动检测竞赛”,具有极大的社会意义。胃肠道检查通常使用内窥镜,这个方法高度依赖操作人员的技能和经验,可能造成人为误差。竞赛则意欲通过模式识别技术,帮助医生通过在内窥镜检查过程中进行实时自动框架分析,提高发现病变的几率。DeepBlueAI参加了竞赛三个赛道中的两个,数据集分布不均衡、多种类别类间间距小,息肉大小相差较大且形状不规则等实际情况,为比赛增加了不小的难度。最终,团队在赛道一“对23种常见消化系统疾病的肠镜图片分类”,以及赛道三“对常见的消化系统疾病息肉进行分割”中均获得亚军。
ICPR2020吸引了来自56个国家和地区的科研人员或机构,产生了诸多有价值的论文和解决方案,为各领域提供了新的想法和合作机会。未来,深兰科技将持续在计算机视觉领域推动核心技术的研发及创新,并不断扩展技术成果的应用落地,使人工智能更贴近民生、服务大众。