原标题:电商搜索逻辑全解析
编辑导语:对于电商平台来说,搜索功能是至关重要的,可以说是最核心的功能,好的搜索设计往往可以吸引用户,促进用户点击商品,从而实现交易的转化。接下来,本文作者通过剖析电商行业的专属特点和需求,并结合其个人经验,为我们分享了他总结的解决方案,并且预测了电商搜索的未来趋势。 6park.com
编辑导语:对于电商平台来说,搜索功能是至关重要的,可以说是最核心的功能,好的搜索设计往往可以吸引用户,促进用户点击商品,从而实现交易的转化。接下来,本文作者通过剖析电商行业的专属特点和需求,并结合其个人经验,为我们分享了他总结的解决方案,并且预测了电商搜索的未来趋势。 6park.com
搜索功能一定是一家电商平台技术中最重要的核心的功能,我相信大家对此都无异议。 6park.com
因为无论产品经理设计了多么完美的产品逻辑,老板砸了多少钱去做拉新用户,如果用户在搜索体验时,搜索结果不符合预期或者不满足其搜索需求,那么之前所做的工作都会付之东流了。 6park.com
毕竟电商服务的行业属性还是促进业务的转化,实现买卖成单。 6park.com
本文通过剖析电商行业的专属特点和需求,并结合个人经验分享解决方案,希望对大家有所启发~ 6park.com
一、搜索的业务逻辑 6park.com
“搜索Query→查询语义理解→召回→排序→搜索结果” 6park.com
当用户在搜索框输入一个Query时,系统通过对语义的理解,召回相关文档或商品,在通过算法排序,安客户实际的搜索意图进行前后排序,最终解决其搜索需求,实现业务转化。 6park.com
其中【查询语义理解】与【排序】对搜索引导的业务目标最为重要。 6park.com
二、自然语言处理技术(NLP)在搜索上的应用 1. 概念介绍 6park.com
想实现搜索引擎效果的优化,就一定要对自然语言处理技术有一定的了解,因为用户输入一个Query里从学术角度解读,自然语言智能研究实现了人与计算机之间用语言进行有效通信,它是融合语言学、心理学、计算机科学、数学、统计学于一体的科学。 6park.com
自然语言处理被学者誉为”人工智能皇冠上的明珠“,研究覆盖了感知智能、认知智能、创造智能这样的学科,是实现完整人工智能的必要技术。 6park.com
1)感知智能 6park.com
是指从无结构化数据中识别出重要的要素。比如给一个query,分析出包含的人民、地名、机构名等。 6park.com
2)认知智能 6park.com
是在感知之上,能够理解其中要素的含义以及进行一些推理。比如“谢霆锋是谁的儿子 谁是谢霆锋的儿子”两句话。词和实体都差不多,但语义差别很多。这是认知智能要解决的问题。 6park.com
3)创造智能 6park.com
比如计算机指能够理解语义的基础上,创造出符合常识、语义、逻辑的句子。比如自动写出行云流水的小说、创造娓娓动听的音乐 能够无违和跟人自然聊天等。 6park.com
2. NLP搜索分析路径 6park.com
三、电商搜索的特点 1. 关键词堆砌 6park.com
例如:杨幂同款夏季连衣裙包邮。 6park.com
2. 词序对语义影响不大 6park.com
例如:杨幂同款女夏季连衣裙包邮;女夏季连衣裙包邮杨幂同款。 6park.com
3. 类目预测问题 6park.com
例如:当用户查询“苹果”时,可能查询的是水果,也可能是手机品牌。 6park.com
4. 搜索引导的业务转化比重较大 6park.com
据统计,综合类电商搜索引导转化占比40%以上,垂直类电商搜索引导转化占比60%以上。 6park.com
5. 稳定性要求较高,支持弹性扩容 6park.com
活动、大促系统QPS可能是平时的百倍千倍,需要平滑的扩缩容,保障系统的稳定。 6park.com
四、电商搜索优化核心内容 1. 分词(划重点!) 6park.com
1)分词效果的优化直接影响召回数量,减少无结果率,提高搜索召回质量 6park.com
例如: 6park.com
“火锅九块九包邮” 6park.com
”925银耳饰“ 6park.com
2)不同的分词方式直接影响着参与召回的关键词,从而影响召回的准确性 6park.com
目前很多开源自建系统难以实现很好的分词效果,主要原因是训练语料的数据量有限,不足以形成可以不断打磨深耕的行业数据。 6park.com
尤其电商行业商品种类丰富,中文字、词表达的意义多样,多音字、同义词又众多的情况下,靠自身算法工程师和开发团队很难实现快速的解决优化,这是一个不断积累训练的漫长过程。 6park.com
3)强烈建议选择云产品(电商推荐阿里云开放搜索、内容日志搜索推荐ES) 6park.com
现成的百万级训练语料、行业模板直接接入,毕竟专业领域交给更专业的人,我们才有更多资源投身到业务迭代中去。 6park.com
2. 实体识别 6park.com
1)电商搜索-实体识别含义 6park.com
识别Query中的品牌、品类、款式、风格等具有电商行业特色的实体。 6park.com
2)召回时保留重要性高的实体词,对重要性低的部分不影响召回,只影响算法排序 6park.com
例如:在电商Query中,在实体重要性如果按高、中、低三档来分。 6park.com
其中“品牌、品类”是在高档,也就是最重要的;其次“风格、款式、颜色、季节、人群、地点…”处于中档;最后“尺寸、修饰词、影响服务、系列、单位…”处于低档,可以丢弃不参与召回。 6park.com
3. 类目预测 6park.com
举例说明: 6park.com
类目预测就是根据类目下的文本信息和行为数据,计算query与类目的相关度,从而达到预测query的查询意图的目的,计算哪些类目与query最相关,用类目相关度影响搜索结果的排序。 6park.com
也就是说,当通过行为数据分析,发现搜索”华为”的用户,大部分的搜索意图都为“手机”,那么召回排序上优先“手机类目”。 6park.com
4. 排序算法 6park.com
电商排序常见问题: 6park.com
举例说明: 6park.com
1)搜索前引导 6park.com
2)搜索中引导 6park.com
下拉提示:智能推荐候选query,提高用户输入效率,帮助用户尽快找到想要的内容。 6park.com
五、电商搜索未来趋势 6park.com
以上内容就是我今天我和大家分享的,希望对你有所帮助,感兴趣可以关注【搜索与推荐技术】公众号~ 6park.com
作者:KKai,B端产品运营 6park.com
本文由 @KKai 原创发布于人人都是产品经理,未经作者许可,禁止转载。 6park.com
题图来自 Pexels,基于 CC0 协议