加利福尼亚州大学的电子与计算机科学专业教授努诺瓦斯康塞洛斯说,这种研究员们是通过修改一种普通的机器学习技术得到这种新方法的。 搜索引擎会自动根据图片中的对象来标记图片,比如“萝卜”、“伞”或者“游泳者”。
研究员们已经通过对一种普通的机器学习技术进行修改而找到了一种识别图片的更好的方法。
加利福尼亚州大学的研究员们声称他们已经找到了一种图片搜索新方法,据说这种新方法比现有方法更好,在准确度和效率方面均有很大提高。加利福尼亚州大学的电子与计算机科学专业教授努诺瓦斯康塞洛斯说,这种研究员们是通过修改一种普通的机器学习技术得到这种新方法的。 搜索引擎会自动根据图片中的对象来标记图片,比如“萝卜”、“伞”或者“游泳者”。瓦斯康塞洛斯说,由于这种方法利用词语来标记和分类图片,因此它与人们在网络上使用的关键字搜索很相似。
现在,利用关键字的方式来搜索图片有时行得通,有时行不通。这是由于大多数基于图片的搜索都使用了元数据文本比如文件名、日期或者与图片有关的其他基本资料来进行的,但是对于关键字搜索来说那些信息是不够的。 计算机科学家们一直在研究,希望找到一种更好的方法来识别图片,并且保证图片的可搜索时间达到十年以上,但是要想让计算机获得图片元数据之外的其他数据以及确定以图片中的什么对象作为搜索的关键字一直都是个很难解决的问题,到目前为止,大部分这方面的研究工作仍未取得令人满意的成果。
瓦斯康塞洛斯说,虽然加利福尼亚州大学的研究成果并未能完全解决这个问题,但是它提高了搜索的准确性和效率。而且这种方法弄清楚了一直以来限制人们解决这个问题的关键所在。
研究员们找到的这种方法是一种“基于内容的(content-based)”方法,它包括通过对图片中的色彩、纹理和线条进行分析,然后确定用以描述图片的对象。这些对象可以通过那些分析功能找出来并与其他图片中找到的结果产生互比性。
参与这项研究项目的Google公司研究工程师佩德罗莫雷诺说,新研究成果就是建立在这些研究之上的,但是它还增加了一个中间步骤。莫雷诺解释说,这个新增的步骤是用来得到关于图片的语义标签或者文字标签的,这样就可以通过许多特征对象而不是只依赖于数字组来识别图片。
例如,假设有一幅图片画的是一直爬在草坪上的狗。通过新方法分析得出的可比性对象是狗,它可以与同类图片中的其他对象如猫或者鱼形成对比,从而区分不同的图片。 然后计算机可以对那些对象进行统计分析,给出满足所有特征对象的图片。系统还可以评定搜索出的图片与想查找的图片之间的相似度,比如将其他画有狗的图片标注60%的相似度,而对带有猫或者鱼的图片标注20%的相似度。 这样,计算机就可以识别出图片中画了一只狗。莫雷诺说,这种方法的关键就是从语义的角度来定义图片。 这好象可以大大提高图片搜索的准确性。
研究员们使用的电脑拥有大量的素材,因为它拥有大量带有鲜明特征对象如山脉、花朵、人物、水和虎等的图片以及那些对象对应的语义标签。研究员们用一些带有尚未被标记的对象的新图片对新方法进行测试时发现结果很不错。 将人物标签与利用它搜索得到的图片进行对比时发现系统运行的情况很好,系统对一幅画着伏在长草中的老虎的图片进行分析后得到的对象关键字包括“猫”、“虎”、“植物”、“叶子”和“草”,而图片的插图说明中包括了“猫”、“虎”、“森林”和“草”等字眼。当研究员们将他们的系统标签与更普遍的基于内容的方法进行对比时,他们发现新方法的准确度比过去的旧方法要高40%。换句话说,它会得出更少与图片无关的关键字。
微软图片搜索研究员拉里泽尼克说,这项研究扩展了基于内容的搜索的限制边界。他说:“他们现在所作的就是分析我们可以在基于图片特征对象来进行图片搜索方面走多远。”但是他还是对这种新方法是否适用于更大数量的图片搜索如网络搜索持怀疑态度。
泽尼克补充说,加利福尼亚州大学的研究成果对于图片中的某种简单对象搜索非常有意义。然而,它可能不适用于其他的搜索领域如区分美国国会大厦与林肯郡州政府大楼等。 泽尼克说:“视觉问题是很难解决的,我认为没有任何一种方法是万能的。”
然而,Google公司从事图片搜索研究的软件工程师查克罗森贝格说,如果将研究员们刚刚发现的这种方法添加到搜索软件中可能会非常有用。如果将这种方法加入到桌面搜索中,人们就可以根据图片的相似度来搜索图片。
加利福尼亚州大学的瓦斯康塞洛斯预计至少还需要五年的时间才能实现计算机对更复杂概念的识别,比如幸福等。但是他说,这并不是说现在所作的研究就是无用的。 现在的研究成果更象是一种辅助,而不是一个答案。
文章评论 本文章有个评论