一种基于图片搜索视频的方案

日期:2023-02-20 19:56:21 / 人气:69

拍照搜索次要是对商品的主图停止特征婚配,这也就需求商品发布人员要制造尽能够与之婚配的图片,尤其需求美工设计人员的参与,从而添加了人力本钱。2.2难以支持短视频搜索随着近几年自媒体的开展,短视频逐步成爲互联网信息传达的次要手腕。而短视频可以以为是少量图片的集合,不能够对短视频的每张图片树立特征索引,由于这会糜费少量的计算机算力。3. 技术方案3.1 技术成绩以前商品引见次要以图文方式来展示商品,不只要展现商品主图还要配细节图,以及商品参数,从而到达片面涵盖商品信息的才能。而短视频可以全方位的展现商品,并搭配言语描绘以及背景音乐,可进一步抽象的给消费者引见商品的功用,给顾客更直观的体验,有助于促进下单。同时商家制造的短视频可将其推送到自媒体平台上,便于给商品导入流量,进步商品销量,从而拓宽了销售市场。因而短视频推广绝对于图文推广更有劣势,如何让顾客可以更快更便捷地搜索到其感兴味的商品短视频,是本创造所要处理的次要成绩。本方案次要处理的是商品短视频搜索,依照类目维度对商品短视频停止挑选,并进步视频搜索的命中率,爲商品短视频搜索树立桥梁。3.2 技术方案3.2.1 流程图流程图:3.2.2 详细描绘1.关键帧提取卖家在制造好商品引见的短视频后,在发布商品时对短视频停止上传,视频时长不能超越2分钟。对该视频停止关键帧提取。视频是由一组延续的图像组成,假如每张图片都存储上去,则会招致视频文件过大,因而视频都会被紧缩,在紧缩进程中,发生了I帧、P帧、B帧。I帧是画面的完好保管,它尽能够去除了图像空间的冗余信息;P帧则是记载与前一个关键帧的差异;B帧是记载本帧与上一帧和下一帧的差异。因而只需提取出I帧即可。在MPEG-4规范中,stss局部标识了哪些sample是关键帧,假如没有stss则全部sample是关键帧。当获取的关键帧太多时,以工夫轴维度,随机选取20帧的图像供商家选择,把商家选取的5张图片与视频文件一同保管到文件数据库中。Mp4规范2.特征向量计算本次的特征向量计算采用的是VGG16模型。由于关键帧的图片都是黑色图片,因而采用3通道。卷积核爲3×3,池化核爲2×2。以224×224的视频图像爲例,进程如下:输出图像大小爲224×224×3,经64个通道的卷积核3×3,步长爲1,共卷积2次,输入尺寸爲224×224×64的特征向量。停止池化,采用池化核2×2,步长爲2,输入尺寸爲112×112×64的特征向量。经128个3×3的卷积核,步长爲1,卷积2次,尺寸变爲112×112×128,停止池化,步长爲2,输入尺寸爲56×56×128。经256个3×3的卷积核,步长爲1,卷积3次,尺寸变爲56×56×256,停止池化,步长爲2,输入尺寸爲28×28×256。经512个3×3的卷积核,步长爲1,卷积3次,尺寸变爲28×28×512,停止池化,步长爲2,输入尺寸爲14×14×256。经512个3×3的卷积核,步长爲1,卷积3次,尺寸变爲14×14×512,停止池化,步长爲2,输入尺寸爲7×7×256。将数据拉平成一维数组,7×7×256=25088。经两层1×1×4096与一层1×1×1000的全衔接层,最终输入1×1000的特征向量。3.向量数据库向量在存储时要把文件数据库中的ID同时存上去,以及商品ID,从而树立向量、文件、商品的关系。向量搜索都是类似性搜索,经过两个向量在高位空间的间隔来做判别,其实就是在高维空间中找到与目的向量最接近的K个向量,普通采用欧式间隔计算,其公式:爲了召回精度高,暴力搜索的是很好的选择。但这会发生少量的不用要的计算,糜费了计算机资源。因而本方案采用类目维度停止切割。增加搜索范围。4.视频搜索买家需求选择要搜索的类目再停止图片上传,经过VGG16模型计算出特征向量,然后基于类目维度停止暴力搜索把最接近的K个向量挑选出来。最初再依据向量与文件的关系,把视频文件查找出来,前往给买家。5.视频淘汰战略每日停止定时巡检,关于长工夫没有流量或许流量低于阈值的商品,需求从向量库中对其短视频停止逻辑删除,尽能够增加搜索的体积,增加计算资源的糜费。告发/反应

作者:天游娱乐




现在致电 5243865 OR 查看更多联系方式 →

COPYRIGHT 天游娱乐 版权所有