[返回科技频道首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[版主管理]
电商搜索逻辑全解析
送交者: 婉君[☆★★★不服⭐来赌★★★☆] 于 2020-09-24 1:57 已读 1313 次  

婉君的个人频道

原标题:电商搜索逻辑全解析


编辑导语:对于电商平台来说,搜索功能是至关重要的,可以说是最核心的功能,好的搜索设计往往可以吸引用户,促进用户点击商品,从而实现交易的转化。接下来,本文作者通过剖析电商行业的专属特点和需求,并结合其个人经验,为我们分享了他总结的解决方案,并且预测了电商搜索的未来趋势。 6park.com

编辑导语:对于电商平台来说,搜索功能是至关重要的,可以说是最核心的功能,好的搜索设计往往可以吸引用户,促进用户点击商品,从而实现交易的转化。接下来,本文作者通过剖析电商行业的专属特点和需求,并结合其个人经验,为我们分享了他总结的解决方案,并且预测了电商搜索的未来趋势。 6park.com


搜索功能一定是一家电商平台技术中最重要的核心的功能,我相信大家对此都无异议。 6park.com

因为无论产品经理设计了多么完美的产品逻辑,老板砸了多少钱去做拉新用户,如果用户在搜索体验时,搜索结果不符合预期或者不满足其搜索需求,那么之前所做的工作都会付之东流了。 6park.com

毕竟电商服务的行业属性还是促进业务的转化,实现买卖成单。 6park.com

本文通过剖析电商行业的专属特点和需求,并结合个人经验分享解决方案,希望对大家有所启发~ 6park.com

一、搜索的业务逻辑 6park.com

“搜索Query→查询语义理解→召回→排序→搜索结果” 6park.com

当用户在搜索框输入一个Query时,系统通过对语义的理解,召回相关文档或商品,在通过算法排序,安客户实际的搜索意图进行前后排序,最终解决其搜索需求,实现业务转化。 6park.com

其中【查询语义理解】与【排序】对搜索引导的业务目标最为重要。 6park.com

二、自然语言处理技术(NLP)在搜索上的应用 1. 概念介绍 6park.com

想实现搜索引擎效果的优化,就一定要对自然语言处理技术有一定的了解,因为用户输入一个Query里从学术角度解读,自然语言智能研究实现了人与计算机之间用语言进行有效通信,它是融合语言学、心理学、计算机科学、数学、统计学于一体的科学。 6park.com

自然语言处理被学者誉为”人工智能皇冠上的明珠“,研究覆盖了感知智能、认知智能、创造智能这样的学科,是实现完整人工智能的必要技术。 6park.com

1)感知智能 6park.com

是指从无结构化数据中识别出重要的要素。比如给一个query,分析出包含的人民、地名、机构名等。 6park.com

2)认知智能 6park.com

是在感知之上,能够理解其中要素的含义以及进行一些推理。比如“谢霆锋是谁的儿子 谁是谢霆锋的儿子”两句话。词和实体都差不多,但语义差别很多。这是认知智能要解决的问题。 6park.com

3)创造智能 6park.com

比如计算机指能够理解语义的基础上,创造出符合常识、语义、逻辑的句子。比如自动写出行云流水的小说、创造娓娓动听的音乐 能够无违和跟人自然聊天等。 6park.com

2. NLP搜索分析路径 6park.com


三、电商搜索的特点 1. 关键词堆砌 6park.com

例如:杨幂同款夏季连衣裙包邮。 6park.com

2. 词序对语义影响不大 6park.com

例如:杨幂同款女夏季连衣裙包邮;女夏季连衣裙包邮杨幂同款。 6park.com

3. 类目预测问题 6park.com

例如:当用户查询“苹果”时,可能查询的是水果,也可能是手机品牌。 6park.com

4. 搜索引导的业务转化比重较大 6park.com

据统计,综合类电商搜索引导转化占比40%以上,垂直类电商搜索引导转化占比60%以上。 6park.com

5. 稳定性要求较高,支持弹性扩容 6park.com

活动、大促系统QPS可能是平时的百倍千倍,需要平滑的扩缩容,保障系统的稳定。 6park.com

四、电商搜索优化核心内容 1. 分词(划重点!) 6park.com

1)分词效果的优化直接影响召回数量,减少无结果率,提高搜索召回质量 6park.com

例如: 6park.com

“火锅九块九包邮” 6park.com

”925银耳饰“ 6park.com

2)不同的分词方式直接影响着参与召回的关键词,从而影响召回的准确性 6park.com

目前很多开源自建系统难以实现很好的分词效果,主要原因是训练语料的数据量有限,不足以形成可以不断打磨深耕的行业数据。 6park.com

尤其电商行业商品种类丰富,中文字、词表达的意义多样,多音字、同义词又众多的情况下,靠自身算法工程师和开发团队很难实现快速的解决优化,这是一个不断积累训练的漫长过程。 6park.com

3)强烈建议选择云产品(电商推荐阿里云开放搜索、内容日志搜索推荐ES) 6park.com

现成的百万级训练语料、行业模板直接接入,毕竟专业领域交给更专业的人,我们才有更多资源投身到业务迭代中去。 6park.com

2. 实体识别 6park.com

1)电商搜索-实体识别含义 6park.com

识别Query中的品牌、品类、款式、风格等具有电商行业特色的实体。 6park.com

2)召回时保留重要性高的实体词,对重要性低的部分不影响召回,只影响算法排序 6park.com

例如:在电商Query中,在实体重要性如果按高、中、低三档来分。 6park.com

其中“品牌、品类”是在高档,也就是最重要的;其次“风格、款式、颜色、季节、人群、地点…”处于中档;最后“尺寸、修饰词、影响服务、系列、单位…”处于低档,可以丢弃不参与召回。 6park.com

3. 类目预测 6park.com

举例说明: 6park.com

类目预测就是根据类目下的文本信息和行为数据,计算query与类目的相关度,从而达到预测query的查询意图的目的,计算哪些类目与query最相关,用类目相关度影响搜索结果的排序。 6park.com

也就是说,当通过行为数据分析,发现搜索”华为”的用户,大部分的搜索意图都为“手机”,那么召回排序上优先“手机类目”。 6park.com

4. 排序算法 6park.com

电商排序常见问题: 6park.com

举例说明: 6park.com

1)搜索前引导 6park.com


2)搜索中引导 6park.com

下拉提示:智能推荐候选query,提高用户输入效率,帮助用户尽快找到想要的内容。 6park.com


五、电商搜索未来趋势 6park.com

以上内容就是我今天我和大家分享的,希望对你有所帮助,感兴趣可以关注【搜索与推荐技术】公众号~ 6park.com

作者:KKai,B端产品运营 6park.com

本文由 @KKai 原创发布于人人都是产品经理,未经作者许可,禁止转载。 6park.com

题图来自 Pexels,基于 CC0 协议

喜欢婉君朋友的这个贴子的话, 请点这里投票,“赞”助支持!
[举报反馈]·[ 婉君的个人频道 ]·[-->>参与评论回复]·[用户前期主贴]·[手机扫描浏览分享]·[返回科技频道首页]
帖子内容是网友自行贴上分享,如果您认为其中内容违规或者侵犯了您的权益,请与我们联系,我们核实后会第一时间删除。

所有跟帖:        ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )


    用户名:密码:[--注册ID--]

    标 题:

    粗体 斜体 下划线 居中 插入图片插入图片 插入Flash插入Flash动画


         图片上传  Youtube代码器  预览辅助

    打开微信,扫一扫[Scan QR Code]
    进入内容页点击屏幕右上分享按钮

    楼主本栏目热帖推荐:

    >>>>查看更多楼主社区动态...






    [ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ] [ 版主申请 ] [ Contact us ]