目前网上有很多介绍淘宝搜索排序的文章,大多是淘宝卖家们根据自己经验摸索整理出来的,里面提到的很多办法也很正确。只是搜索排序算法不是固定不变的,几乎每天都在变化,与时俱进。下面是淘宝搜索技术团队负责人鬼脚七对于淘宝搜索排序算法的一些看法。
很多卖家抱怨为什么不公开排序算法?排序算法无法公开。不知道有谁知道百度的排序算法是怎么样的?Google的排序算法是怎么样的?排序算法之所以无法公开,有很多原因。其中一个原因正是因为公平才不公开。算法是死的,人是活的。一旦算法公开,很多卖家估计就不专心去服务买家,而把精力放在如何找这些算法的漏洞来提高自己的搜索排名了。这对其他卖家来说,就很不公平。
我虽不能告诉大家排序具体算法,但可以告诉大家排序的主要原则,告诉大家如何去针对自己的店铺做一些优化。这篇文章也是希望给大家介绍一下目前淘宝搜索排序的主要原则。而且这个介绍只是适应于现有的排序算法(2010年4月),以后有大的变化,在搜索blog上也会及时给大家更新。
淘宝搜索现状
淘宝搜索产品有很多,如果数一数,应该有几十个。当然这不是什么值得炫耀的事情,理想情况下,如果做好了,一个搜索入口搞定了用户所有需求。几个比较大的搜索有:店铺搜索、商城搜索、宝贝搜索。顾名思义,店铺搜索主要是搜索店铺,可以搜索店铺名称、店铺主营宝贝等。商城搜索主要是搜索商城内的商品。宝贝搜索则可以搜索所有商品,包括商城内的商品。本文讲的主要内容也是针对宝贝搜索的。
宝贝搜索又包含了不少tab:所有宝贝、人气、二手等。大家最熟悉的莫过于人气和所有宝贝了,有一段时间,搜索默认结果有一部分是直接到人气排序的。但现在搜索上默认结果都是所有宝贝排序了(从2010年3月4日开始到今天)。宝贝搜索中有两种搜索需求,一种是按照类目浏览的,基本上没有关键词,都是在浏览某个类目。url是以list.taobao.com开头的;另外一种是带关键词搜索的,url一般以search.taobao.com开头。大家最近在论坛上问的比较多的问题说新版搜索和旧版搜索的问题,旧版搜索的url是以search1.taobao.com开头,新版搜索是以search.taobao.com开头。不要再琢磨回到旧版搜索了,因为以后不会支持旧版了。旧版搜索的功能大都已经迁移到了新版搜索,算法也基本一致。
还有一个搜索,叫search8的搜索,即淘宝客搜索。这个搜索结果的URL是以search8.taobao.com开头的,主要搜索内容是参加淘宝客的商品。结果数比全网的要小一些。有些非法淘宝客会采用一些手段串改用户浏览器的淘宝搜索请求,把所有淘宝搜索的流量直接跳转到淘宝客搜索,从而来获利。所以大家一定要警惕。 淘宝客搜索的排序也很有意思的,不过不在本文的讨论放范围之内。
几个常见的错误观点
最近我一直在关注搜索官方论坛,论坛中看到有很多人在提一些问题,也有很多观点。在这里觉得有必要跟大家澄清一下。
* 淘宝直通车和淘宝搜索排名
每次搜索改版或者排序规则变化的时候,无论改得好还是改得坏,都会有人反对。因为变化会造成搜索流量的重新分配,得到更多流量的卖家,基本不会啃声,一部分卖家的既得的利益受到损失时,就开始在论坛(http://bangpai.taobao.com/group/400769.htm,本文中说的论坛,都是指淘宝搜索官方论坛)里叫起来的。这时候大家最容易看见的一个观点就是:这是在逼卖家,做直通车,做了直通车排序才能排序靠前。其实这是最大的误区。大家千万不要为了提高搜索排名而去做直通车,因为二者之间没有关系。搜索的任务是帮助用户快速找到想要的商品,排序算法中没有任何信息是这个商品是否参加了淘宝直通车。过去几年和将来几年,赚钱都不是淘宝的目的,更不会是淘宝搜索的目的。
* 淘宝搜索和中小卖家的利益
淘宝上有几百万的卖家,根据二八原则,20%的卖家占了80%的交易,可能在淘宝搜索的比例比这个还要高,15%的卖家,占了80%的交易。在论坛上,经常有人在说,我们中小卖家生意没法做了,淘宝不关心我们。其实这个理解完全错了。大卖家之所有得到更多的流量,就是因为他们更熟悉搜索的一些规则,做了更多的优化。而中小卖家,商品数,经验相对少一些,自然得到的流量也少一些。在淘宝内部,大家非常关注如何保护中小卖家的利益,在每个项目开始的时候,内部都会讨论,是否会对中小卖家有帮助?比如说,人气搜索不太适合中小卖家成长,后来就直接不放到默认了。在排序中也一直在找一些参数来帮助中小卖家成长。但淘宝是大家的淘宝,不只是有中小卖家,大卖家也是淘宝的客户,同时还有消费者的利益是更不能损害的。因此,对于咱们中小卖家,建议还是静下心来研究一下自己的店铺,研究一下搜索,看如何能提高排名。
* 新版搜索和旧版搜索
自从切换到新版搜索以后,很多人在论坛上提出要求回到旧版搜索。理由是很多东西搜索不到。其实绝大部分时候只是一个误会!新版搜索和旧版搜索在改版的时候,算法都是一致的。后台系统也是同一套系统,只是结果页展现不一样。如果在新版搜索上有问题,那么在旧版搜索上一样有问题。而新版上增加了一些新的功能,例如:销量排序、减去关键词、自定义筛选区等。淘宝的产品经理和工程师也不会都是傻子,肯定新版搜索有更多的好处才做修改的。这个时候,建议大家不要拘泥于新版还是旧版了,仔细研究一下新版的功能,看看哪些功能点你是可以利用到的。
说了这么多,想必大家有点等不及了:到底淘宝宝贝搜索排序的原则是什么呢?
宝贝搜索的排序
宝贝搜索上,有两种主要的排序方式,人气排序和所有宝贝排序。人气排序目前不是默认的排序方式,这里也不作为本文主要的介绍对象。所有排序中还有按照价格从低到高、从高到低排序、销量排序、信用从高到低排序的选项,这些排序的原则也很明确,基本上是按照选 项来的,从名字上就可以知道其规则。这里需要另外说明的是,这些特定排序中,会有一些宝贝会被过滤掉。也就是说,默认排序中的宝贝数目,和特定排序中的宝贝数目可能会不一样。哪些会被过滤掉呢?包含两种宝贝:一种是被处罚的商品(本文后面搜索降权会详细解释),另一种是相关性不好的商品。
默认的排序,目前的参考原则很明确:相关性、作弊降权、橱窗推荐、下架时间、消保。用一段描述来说就是:如果你的宝贝没有作弊,相关性好,是在橱窗推荐里的,参加过消保,那么就会按照下架时间来排序。
相关性:技术上对相关性有比较复杂的计算。但简单理解就是你的宝贝和搜索的关键词是否相关。相关和不相关也不是绝对的。例如:搜索”篮球”, 最相关的应该就是”篮球”的商品,其次才会是篮球鞋、篮球服等商品。因为现在算的相关性主要是关键词和标题的相关性,所以大家一定要重视标题。标题如何描述一方面会影响相关性,另一方面也会影响用户体验。有些卖家为了让宝贝被找到,标题堆砌一堆关键词,其实这是会被降权的。这就叫过犹不及。
作弊降权:如果你发现你的商品在默认宝贝排序上无论怎么搜索,都排序排在最后几个,那么肯定是有一些作弊行为被处罚了。接下来“搜索降权”部分会做详细解释。
橱窗推荐:卖家要珍惜你的橱窗推荐位。在搜索结果中,卖家橱窗宝贝是会被优先排序的。
下架时间:这一直是排序中比较重要的因素,用来保证每个商品都有机会展现。因此你的商品上架时间也很重要,如何让你的商品在一天不同时间段都有展现,这个有很多技巧。最好在宝贝展现的时候,卖家能在线服务,否则买家想买也联系不到卖家。淘宝的交易高峰时间,或者是说购买人群最多的时段在一天之内有三个:早上10:00-12:00, 下午3:00-5:00, 晚上8:00-10:00. 正常情况下,周一到周五的人群比周末要多。所以如何安排你的宝贝下架时间,也成了一个有用的工具。
消保:消费者保护的简称,在淘宝上有很多消保的认证。现在默认排序,大部分类目对是否参加消保,是很依赖的。如果没有参加消保,这些商品肯定会排在参加消保商品的后面。淘宝搜索最直接的用户是消费者,为了保证消费者的利益,淘宝鼓励卖家参加消保。这不是对淘宝的承诺,是对消费者的承诺。
有些卖家说我的商品怎么在搜索结果中看不见?搜索结果目前每页只展现40条,总共可以查看100页,也就是说,通过点击可以查看的搜索结果数是40*100=4000个。如果搜索一个商品,结果数大于4000,肯定有些商品是看不见的。但搜索结果实时在变化,只要你的宝贝符合上述因素,就有机会排在第一页。
搜索降权
淘宝搜索基本上是实时的,也就是说,你修改了宝贝,上传了宝贝或者宝贝下架了,会很快在搜索中反映出来。目前来看,最晚不会超过15分钟(凌晨的时候除外)。 是否能在淘宝搜索中搜被找到,有个很简单的检验方法:把你的宝贝标题全部copy输入到搜索框,如果发现在所有结果中都找不到你的宝贝,那估计是有问题了。
没有进入淘宝搜索有一种情况是因为“滞销商品”。滞销商品目前的定义是:半年前发布的,而且最近3个月没有卖出过任何一件的商品。这一类商品是不会进入搜索库的,也就是说你用所有的标题去搜索,肯定找不到你的宝贝。如果希望让其进入索引,目前的方式是建议重新修改一下标题、价格后重新发布。
搜索中还有一些处罚措施叫降权。意思宝贝就是也能被找到,但是排序肯定是靠后的。如果有100条结果,被降权的商品,估计就排序在99位或者100位。如果有10000条结果,那估计你怎么浏览也找不到你的被降权的宝贝了,因为排序已经排在最后,而从搜索结果上点击只能查看前4000条。
检测宝贝是否被降权,还有种办法,在销量排序中是会被过滤掉的。也就是说,如果你按照销量排序,发现你的宝贝找不到,说明你的宝贝被降权了。
被降权有很多原因:基本上所有不规范的操作,都会被降权。例如:炒作信用、刷销量、故意堆砌关键词、广告商品、价格作弊、重复铺货、邮费虚假等。详细参看http://blog.search.taobao.com/?p=244。惩罚力度也各有不一样,目前最长的是从最后一次不规范的操作开始计算,30天左右结束。被降权还有一种是连带惩罚。如果你整个店铺中被识别为作弊的商品过多,那么对整个店铺的商品都有影响,基本上你所有的商品都会被降权。例如:炒作信用严重的。
最近很多人在论坛上问为什么别人的商品也有类似的操作,没有被惩罚,而自己的宝贝被惩罚了。其实这个问题没有意义,我经常说的一句话:“出来混,迟早要还得!” 既然你违规了,就做好被处罚的准备,不要眼红其他人。就像社会上被抓的小偷抱怨说为什么别的小偷没被抓一样没有意义。
有人在论坛上说,你看我用直通车,花了不少钱,好不容易把这个宝贝搞得比较畅销,偶尔一次刷销量就被降权了,你们忍心么?这是个误区。越是你好不容易培养出来的宝贝,你越要小心谨慎,不要有污点。搜索降权与不降权,与你做不做直通车广告没有任何关系。
在论坛上还存在一些现象,很多卖家把问题列出来,有小二回答了原因,但卖家自己始终说没有人给他解答。例如:小二告诉你说宝贝有些是重复铺货的,有些是有虚假交易的。这已经是解答了,这个时候你就自己去查啊,不要存在侥幸心理。这时候在论坛上大发脾气也没有用,解决不了问题。大发脾气只会让整个过程变得很不和谐,而且肯定不会加快处理的进度。
降权规则,是一视同仁的,不会针对某个卖家来具体惩罚。如果你的宝贝被降权了,想想为什么自己被降权,而别人没事?肯定有一些地方你的做法和别人是不一样的。那就尽量把这些问题改过来。如果你实在不知道原因,就在论坛上问,小二会尽力给大家回复。不要总是加小二的旺旺了,这样让小二也很为难,很多在论坛中回复问题的小二,都是搜索技术部门的小二,不是专业的客服人员,还有很多其他的工作。
一旦被降权,你可以把你的有问题的宝贝删除。这样的话不会因为这些宝贝造成对其他宝贝的影响。如果舍不得删除的话,那就等着降权结束,目前最长的时间是30天左右。
很多人问我说不知道某些操作是否会被识别成作弊。这些操作是否会被识别成作弊,就看你的行为是否是正常行为。注意,有时候普遍行为不一定是正常行为。例如,别人都是这么做的啊?如果别人都是在炒作信用,或者把价格搞得很低然后说只做批发不做零售等,这些可能是普遍现象,但不是正常现象,都是要被处罚的。如果是正常行为,那就放心的去做,所谓为人不做亏心事,半夜不怕鬼敲门。
未来的方向
淘宝排序算法一直在优化,搜索降权也是希望能规范市场,让诚信的卖家能有更多的回报,让买家有更好的体验。相信绝大多数卖家都是支持的。
目前搜索正在做的事情是,对卖家的服务质量作为排序的参考,如果卖家对客服服务质量好,那么我们会让这些卖家的宝贝优先的。如果卖家一直很诚信,行为很规范,他的宝贝也是会排序靠前的。
另外,和卖家的沟通机制也在陆续建立,以后会有更多的渠道来跟卖家沟通,让大家清楚的知道搜索的一些规则和变化。
淘宝搜索,我们会秉着公正公开的原则,跟卖家沟通交流。因为技术原因,可能不一定能做到那么公平,但只要你是诚信经营,衷心为客户服务的,肯定会有好的回报。
淘宝搜索用户体验好了,用的人会更多,那么卖家的生意也才会更好。如果都是垃圾商品,骗子商品,淘宝搜索用的人就会越来越少,卖家的日子会越来越难过。相信这些循环大家都很清楚。