随着数字时代的到来,光靠文字检索已经不能满足人们的搜索,图像检索甚至视频检索也越来越成熟。 本文大致介绍了图像检索。
原理检索项目:主要分三个部分提取——图像特征,建立检索素材库,建立索引。
第一步:是选择合适的图像特征提取方法。 传统方法包括用hog直方图、小波滤波等方法提取特征,卷积神经网络等比较流行的深度学习方法; 根据实际情况合理选择,一般推荐卷积神经网络法,但复杂系统将两者结合使用。 例如淘宝拍立淘等。第二步:利用特征提取器对图像库提取特征并存储为向量;第三步:构建索引。 索引的好坏会影响检索速度。 常用的有哈希代码等; 过程给出一幅图像,先经过本体检查等,或从全图中提取特征; 然后与图像库中的图像特征进行特征匹配,一般计算余弦相似度指标。 余弦相似度可以用来测量两个向量的相似度,这方面的具体介绍可以看博主关于另一个余弦相似度的介绍。 最后按照相似度的大小排序,输出匹配结果即可。
注意事项:
主动进行检索时,检查是否有比较快的方法。 例如,knn的其他优化手段的结果,红色的方形是查询图,绿色的方形是完全一致的结果,其他是最相似的top。