目前,百度视觉搜索引擎仅限于互联网,而移动视觉搜索所需技术更加密集。而卷积神经网络在进行搜索时非常有用,由于借助卷积神经网络,搜索引擎就像经由练习的神经一样可以从多角度识别搜索目标。
百度将面对不同以往的背景技术挫折,好比对相机水平参差不齐,恍惚、色彩失衡以及过度曝光等情况的控制。诀窍在于,百度开发的算法只比较被搜图像与百度分布式数据库里的图像,而非互联网上无数的资源,从而加快搜索速度。深度识别技术致力于模仿人脑运作,百度深度识别研究所已经研发出针对光学特点、人脸以及声音的深度识别算法,以用于在线广告和网站搜索。比拟之下,谷歌已经领先不少。
搜索引擎未来将转向移动视觉搜索。该技术可识别多样且被扭曲的图像,因而被应用于手写识别系统以及高速校对系统。
余凯表示,移动搜索确实是百度的目标,百度将充分利用移动传感装置给用户提供最天然的搜索体验,并且百度已经开始计划相关研发。据悉,百度视觉搜索基于一种被称为卷积神经网络的深度识别技术,与谷歌照片标签系统采用的技术相同。并且,百度选择从内部主存储器中而非硬盘 中提取用户所需的索引图像,节省了时间。
谷歌不同,百度视觉搜索在网络应用中紧靠私家CPU服务器,进步搜索速度,努力挣脱对图像处理器(GPU)的依靠(图像处理器运作速度快但更占能耗)。最后,百度搜索服务只利用影像特征信息来搜索图片,略去了图像所处网站的背景信息,减少了搜索信息量。百度视觉搜索项目组组长余凯表示,百度已经大幅进步了在线视觉识别的运算速度,以知足用户需求。