編輯導語:在人工智能技術方面,圖像視覺應該是被應用最廣泛的技術之一。本文作者從關鍵技術和産品設計兩大方面,圍繞圖像檢索技術的應用進行了産品介紹,推薦想了解圖像檢索的童鞋看看。
前一節主要跟大家讨論了文本糾錯技術的應用,本節将跟大家讨論分享關于圖像視覺方面的應用——圖像檢索。
在人工智能技術應用方面,圖像視覺應該是被應用最廣泛的技術之一,從最早的安防監控,到後面落地最多的人臉識别,都是圖像技術的應用,本文想圍繞圖像檢索技術的應用進行産品介紹。
圖像檢索技術在實際應用中包括了檢索 識别(相似度度量)兩個部分,目前重點應用于泛搜索引擎中,百度搜索、谷歌搜索、淘寶拍立淘等都可以支持通過圖片檢索實現信息查找。
相對于文字搜索而言,圖像檢索更直觀,更易操作,尤其是對于陌生信息的檢索,可以直接通過拍照實現信息的檢索。
一、關鍵技術圖像檢索包括了基于文本的圖像檢索和基于内容的圖像檢索。基于文本的圖像檢索主要通過對圖像進行文本描述,提煉關鍵詞等标簽信息,後續在進行檢索時,可以通過檢索關鍵詞的方式查找對應的圖片,這種方式跟用百度查找“胡歌”返回胡歌的照片是一緻的;
基于内容的圖像檢索是通過提取圖像的紋理、顔色、梯度或者其他高層語義特征等作為圖像特征來計算圖像間的相似度,實現圖像檢索。
如果需要高查準率,就需要精确的标簽數據,而精确的标簽數據對于人工标注來說是耗時耗力的,甚至有些圖像很難用有限的關鍵詞能描述清楚。目前通常情況下會先基于圖像内容分析進行自動标注,然後隻要存儲圖像和文本标簽即可,雖然會降低查準率,但是仍然可以保證文本檢索。
雖然搜索精度不一定如文本搜索,并且容易受到圖像質量(光照、遮擋、背景複雜度等)的影響,但是對用戶而言,搜索難度将降低,可以實現所見即所得,隻要拍照出發搜索即可。因此,可應用範圍将更加廣闊。
除了關鍵的算法技術,還需要跟工程相關的分布式存儲技術,因為在實際工程應用中,涉及到的索引結構需要支持到10億量級的,所以如何構建并存儲圖片的特征索引信息,需要工程上進行優化(ps:由于過于技術化,筆者也不敢班門弄斧了)。
在實際應用中,基于文本和基于内容的圖像檢索一般是解耦的,産品設計可以選擇兩者并存,或者獨立使用。
比如在電商中,淘寶通過知識圖譜技術構建了大量的商品畫像,所以用戶可以通過文本搜索,同時拍立淘也支持圖像搜商品;而某些識花等小軟件則是單純通過以圖搜圖實現。具體的還是需要産品根據實際應用場景來決定。
本文下面将重點介紹的是基于内容的圖像檢索,其中基于内容的圖像檢索,從産品的輸入角度又可以分為以圖搜、以視頻搜和以音頻搜,列舉出來的話是圖搜圖、圖搜視頻、視頻搜視頻。
二、産品設計(1)目前常見的圖像搜索應用場景有以下幾種:
(2)本文選擇圖片庫類的圖片檢索為應用場景,講述産品設計中的業務流程和需要支持的産品能力,其中圖片庫類的圖片檢索應用場景有以下兩個:
先确定應用場景不僅是為了便于産品設計,也是為了檢索技術的選擇,從圖像檢索的特征來看一般包括兩種類型:
在圖片庫的圖片檢索應用場景中,這兩個場景都是要支持的,因此相同圖檢索,和相似圖檢索都需要包含的。
但是實際上相似圖的結果通常情況下是包含相同圖的,相同圖是相似圖的一個子集。之所以區分開來,是為了便于産品設計,因為在實際過程中,需要設定一個阈值來決定返回結果,但是如果想讓相似圖都能包含相同圖,則很難指定一個通用的阈值,因此,可以根據實際場景分别調用兩個模型。
(1)業務流程
産品的核心業務流程主要包括三點:
ps:相同圖和相似圖的特征提取是不一樣的,這裡為了簡化流程,因此畫在了一起。
(2)産品功能
這裡将列舉描述産品的主要功能,涉及工作因素,無法提供頁面交互功能細節。
(注意點:圖片的大小、圖片的分辨率、批量上傳的圖片數量等限制條件。)
産品設計中,還需要對産品性能進行評估,包括算法和工程兩個方面:
随着AI技術和互聯網應用的發展,圖搜這樣的智能化檢索方式将會有更多的落地場景,但是對于産品設計而言,需要根據實際場景結合技術現狀考慮。
比如在推薦場景中,為了更多能留住客戶,在盡可能保證高精确率的情況下,k的上限就會取得較大,這樣就能給用戶更多的返回結果。因此為了能滿足檢索業務的需要,同時提高用戶體驗,就需要産品能多思考實際業務場景。
本文由@Eric_d 原創發布于人人都是産品經理,未經許可,禁止轉載
題圖來自 Unsplash,基于CC0協議
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!