[ad_1]
Bing通过更好地了解用户查询,图像和网页之间的关系,使其图像搜索引擎更加精确。
此外,Bing还通过新的向量匹配,属性匹配和最佳代表性查询匹配技术将多粒度匹配引入图像搜索。
存在 解释 这些增强功能将如何改善图像搜索:
“…Bing图像搜索已采用了许多深度学习技术,可将查询和文档都映射到语义空间中,从而大大提高了我们的搜索质量。但是,在许多困难的情况下,用户搜索具有特定上下文或属性的对象(例如:{留着胡子的金发男人},{戴玫瑰的女孩的舞蹈服装}),这是当前搜索堆栈无法满足的。这促使我们开发出进一步的增强功能。”
这是有关Bing的多粒度匹配的更多信息。
矢量匹配
Bing使用上述“带玫瑰的女孩的舞蹈服装”示例,说明了Bing的新矢量匹配用于图像搜索的工作方式:
“随着最新的进展,我们结合了BERT / Transformer技术,该技术利用1)预训练的知识来更好地解释文本信息…2)注意机制,使图像和网页彼此意识地嵌入在一起,从而使嵌入式文档很好地总结了以下内容:图片的显着区域和网页上的重点。”
属性匹配
属性匹配利用一组技术从查询文档和源文档中提取一组对象属性,并将这些属性用于匹配。
Bing使用示例查询“老人游泳图片”,展示了它如何应用属性检测器来提取人的外貌和行为的描述。
“尽管该网页的文本信息不足,但我们现在能够从图像内容及其周围的文本中检测出某些类似的属性。现在,由于查询和文档具有相同的属性,因此可以认为它们是“精确匹配”。
最佳代表查询(BRQ)匹配
Bing使用最佳代表查询信息丰富了图像的元数据。给定图像的最佳代表查询是该图像将获得良好结果的查询。
BRQ与用户查询类似,这意味着它们可以自然而轻松地与传入查询匹配。它们通常是网页主要主题和主要图像内容的摘要。
宾说,为图像生成更丰富的BRQ集会带来更好的搜索结果。