阿里安全图灵实验室发布新技术:用AI检索多层次商品图像
来源:Donews 2021-02-23 16:24:46
DoNews2月23日消息(翟继茹)23日,阿里安全图灵实验室透露,其与中国科学技术大学、浙江大学、华中科技大学等高校研究人员合作,研发包括“内容安全、文本反垃圾、AI模型鲁棒性、营商环境治理”4项新一代安全架构核心AI安全技术成果,均被国际会议ICASSP(International Conference on Acoustics, Speech and Signal Processing)2021收录。例如,在具体的在线零售场景中,如何通过文字搜索找到最符合要求的图像,看似简单却不然。目前,电商平台的各种模态商品数据迅速增长,文本到商品图像的跨模态检索任务也在加剧,比如单是商品图像中的一类“服饰”就表现出巨大的差异性,服饰可以穿在模特身上,也可以单独摆放,还可折叠起来展示,服饰图像背景往往也很复杂。此外,就整体来看,黑灰产还可能利用看似合规的图片来宣传“禁限售”商品。一直以来,业界的传统方法是,模型结构、相似度函数、损失函数等方面进行了大量的研究。据介绍,阿里安全图灵实验室此次采用了一种基于多层次编码、多粒度相似性学习的跨模态检索模型,在融合多层次特征的基础上,结合物体、图像两种不同粒度的跨模态相似性,来提升跨模态检索模型在商品图像检索任务上的表现。阿里安全图灵实验室介绍,多层次的编码模型HSL(Hierarchical Similarity Learning),可以增强跨模态特征的表达性。进而提出两种不同粒度的相似度度量方式,以实现对商品图像复杂内容的表达。在每一个层级上,通过物体粒度、图像粒度两种不同粒度的相似度度量同层级的文本-图像间的相关性。最终对各层级的相关性进行融合得到最终的相关性打分。
阿里安全图灵实验室资深算法专家华棠表示,这种新研究不仅可以于提升用户搜索体验,也会用在平台内容治理上,谨防黑灰产“钻空子”。“我们希望通过新一代安全架构核心AI技术来守护网络内容安全,净化网络环境,也通过AI来保护数字资产的知识产权,优化营商环境。”