登陆注册
11251400000004

第4章 长尾词

主笔 葛维樱

24小时随时可以下单购物,这是我们当下的消费新景。可是,海量的物与人,你如何找到你要的那款物件?或者说,卖家又如何迅速识别你的需求?

你冥思苦想认为足以把想要之物描述清楚的词汇之中,有一个不那么显眼却至关重要的词叫作“长尾词”。这是网络消费的关键。

简单讲,在网络世界里,卖家与买家都在茫茫人海里寻找彼此,如何找到对方?在搜索里,你用一个特别显眼的词当然会吸引眼球,比如“连衣裙”,但结果大家发觉,“连衣裙”搜出了1900万个结果。如何在如此庞大的数据里选择?这是不可能的任务。可以,如果你为这个词加上“尾巴”——“夏天连衣裙文艺复古”,结果大为缩小,只有4000多个答案。所以,你的“尾巴”越丰富,你寻找到需要的物件的可能性越大。

一个行业说法是,一件物品的关键词库至少有500个。因而,对于卖家来说,你得随时更新和有效变换,导致找出能卖掉货物的词,这是卖家的长尾制胜法宝。微小市场累积起来就会占据市场中可观的份额——这就是长尾的思想。这其间的巧妙就是,在热词与热词的衍生物之间,你的选择不是前者而是后者。比如,一件不怎么样的商品用了竞争力很大的热词“韩版”,那么引擎搜到它之后,会被毫不留情地排除掉。但如果使用一个会和最热的词产生关联的“长尾词”,比如“韩国优雅奢华代购”,那么这件商品就很有可能变成一笔成功的交易。

所谓“长尾词”,它是关键词选词矩阵SEM(结构方程模型)的术语,也就是搜索引擎营销的方法论。它有两个特点:细和长。细,说明是份额很少的市场,甚至是不被重视的市场;长,说明这些市场虽小,但数量众多。一旦找到,好像得到一把开启大门的钥匙,就能进入一个消费的隐秘花园。使用一个长尾词来描述商品,是在基本属性之外,缩小集中、优化搜索结果。

真正指引我们购买的咒语是什么呢?长尾词类似买家和卖家在互相破招。中心关键字通常很难把一个商品送上主页,即便能做到,也不会安稳,容易被其他货品挤下去,需要投入很多的人力物力去保护。所有的商家都希望第一时间出现在你搜索栏的结果中?不,答案绝没有这么简单。数据表明,前六页搜索结果购买率并不高。阿里巴巴DT战略的第一步,是要在全球最大的电商公司中,实践“数据化运营”。事实上淘宝首页和引导频道的不断变化和推陈出新,全部都是大数据运算的结果。“天猫‘双十一’,你看到的一切,几乎都是由算法决定的。”天猫数据挖掘专家李博介绍,哪些商品能进入“双十一”,出现在哪些用户的页面和什么位置,都有算法在背后支撑。这就像一场游戏,数据是变量,算法就是游戏规则,设定什么样的游戏规则,将决定游戏最终的结果。

这个算法是长尾词背后的大数据支撑。长尾词看起来非常难以捉摸,可能是淘宝主推的,即将火爆,也可能是有意打击竞争对手做出来的,更有可能只是商家心血来潮的一时灵感,关键在于只要有卖点,任何词都可以成为“热词”。针对长尾词现在已经出现了非常多的“采集器”软件,教卖家用软件来挖掘真正根据网站变化的长尾词,最终得以挤上搜索排序前列位置,并且转化为真正的消费。

长尾词指向的排序结果和购买成功率,乍一看是个语文问题,实际上是一个数学问题。“阿基米德排序”是2010年7月8日上线的淘宝搜索结果排序方法。当时淘宝把“店铺服务质量”作为重要因素加入到搜索中来影响排序,在消保优先、相关性、橱窗推荐的三大前提下,在一定时间范围内,按照店铺服务质量权重排序。具体参数包括:是否违规、是否作弊、退款率、超时退款率、发货速度、响应速度、滞销商品率……参数有几十个,只是权重不一样。

引擎由两名斯坦福大学理学博士拉里·佩奇和谢尔盖·布林发明于1996年。不再像往日抄写符号代码地址,而是以“最相关”来直接告诉你答案。这个“最相关”,在消费数据里远远比网络世界容易实现。“谷歌和百度没能完成的,可能会由淘宝引擎来完成。”卖家最害怕的一个词是“跳出率”,就是好容易用长尾词吸引进来的客人,都可能冷酷无情地走掉。数学是神奇的,程序算法会把客人鼠标停留时间短的商家降低排名,这就叫“跳出率”。一名没找到猎物的猎人绝不会游荡。智能手机让消费者拥有“秒关”的任性,整个互联网移动化时间比预期提前了5年。

在非购物类页面里,引擎只是把搜索页面里的关键字售卖给广告主。而一大排长尾词的用意在于告诉搜索引擎,“我有什么,快来搜我”。长尾词部署的理想状态,是每个页面都能非常快速地被搜索引擎承认,当长尾词得到排名提升的时候,每个具备长尾词的页面都会成为流量的引入入口,使每个页面都发挥其作用。一个具体页面长尾关键词部署三个之内,如果能根据长尾关键词以扩展编辑,这是最好的表现形式。

无限制的长尾词,对于消费者实际上给搜索提供了最大限度的可选择自由。网络消费的决胜之处其实不在于技术实力,而在于用户的需求是否真实,数据是否足够大。2014年11月6日阿里巴巴宣布,其大数据团队自研的实时数据计算平台Galaxy,目前每秒可运算数据超过500万条,预计“双十一”当天每秒运算量将超过1000万条,日处理消息数将超过1万亿条。针对每一笔交易数据,系统将实时反复检测70余次以保证数据质量。

自由的另一点不确定性有趣之处在于,网购时没有人知道你要买什么。我们在网购时可以按照地域(这决定了你的收货速度、运费,但也限制了你的搜索范围)、天猫(这决定了你是否需要品牌)、全球购(是否走海外代购渠道)、价格排序(特定商品很有效果,因为价格真的相差甚远)等条件筛选结果。在“热点”里,还会有非常多的标签式的词语出现,“小香风”“学院风”这些词仿佛魔咒一般,我们甚至可以只写“设计师款”而不写到底买什么,来试试搜出来的外套、椅子、钟表和暖水壶哪个更吸引人。

数据和算法推演导致长尾词和它的目标永远都在变化。搜索引擎带给我们的消费品页面从来没有一致过。试试用同一台电脑,换着用自己的账号和别人的账号登录,再试试用同一账号,在PC、iPad和智能手机上登录。搜索网页目前引擎只能得到关于你所在地域的信息,但在一个电商购物平台里,你买故你在。“以往是淘宝制定排序规则,告诉卖家应该怎样做。在做了个性化排序之后,是卖家告诉淘宝网自己的用户特点,淘宝网就会将相应的消费者通过搜索平台匹配给卖家。”很明显你是一个上午10点到12点在办公室打开网购登录页面,下午17点到18点在交通工具上用手机登录,晚上23点左右又要用iPad登录的人。为什么9元包邮的体恤不会推荐给“高富帅”,过季的打折连衣裙也不会推荐给“白富美”,这是网络在“长尾词”之后,一个平台的整体性进步,即引擎会根据消费者的历史购物行为,学习和理解每个消费者的偏好,同时将“猜你喜欢”推荐给你。

李博表示,“双十一”当天的购物行为高度集中,如果每一个消费者看到的页面和推荐商品都一样,事实上将会压抑大量长尾的消费需求。要想让每个人看到的“双十一”都不一样,大数据就必须了解每个消费者喜好的商品的属性。

这个规则叫作搜索的“维度”。基于大数据的个性化搜索正在不断变换规则和复杂化。个性化排序并不是一个全新的排序方式,而是在以往“阿基米德排序”的基础上引入了个性化的维度。“现在搜索的考核权重包括相关性、下架时间、市场规则、卖家质量、商品质量、人气分、反作弊、个性化,与之前相比,只是多了个性化这个权重因素。”淘宝搜索产品“小二”说,动态评分对于搜索有很大的影响,下架时间在默认排序中的权重依然非常高。

“维度”包括性别、购买力、卖场、卖家规模、店铺、商品标签和品牌。搜索引擎带着所有联动的网站,正在不断优化,实现比人强大得多的信息收集能力。“未来还会不断增加新的维度,逐渐丰富对用户喜好的刻画。”

商品排序的后台人工干涉程度在下降,算法推演和随机性在上升。广告费可以购买直通车进入首页,但是实现销售依然不那么容易。拿“羽绒服”这个关键词来说,会在一段时间内从很小的基数,突然增加到很大的搜索量,可能这段时间天气变冷,购物网站把这个词变成主推词了。这一方面是消费者的需要,更重要的是网站和商家早就已经作好了各种准备。主推词会在存活时间上有特别的限定。可是这么激烈竞争的环境下,想要脱颖而出实现销售,不再是“爆款”的世界。一个好的网络电商平台的首页橱窗制作,比一本时尚杂志花费更多,要赏心悦目又紧跟潮流,浪费流量给一些“月销万件”的某一个廉价热销品的时代将一去不复返。

让有特色的店铺找到你这位特别严苛、审美特别挑剔的客人,这就是引擎带来的“主动”。引擎的个性化做得越细,对商品的要求也就越细,“小而美”的店铺有更多机会。为什么你总是买得过于宽松且色差也大,而她拥有精致的肩线和恰到好处的颜色配比?引擎是个非常善于讨巧的两面派,一方面它衡量买家,另一方面通过对商户的重要性作出客观评价,不断更新搜索结果。当然广告和访问量都很重要,但是访问量属于会被“刷”出来的门槛最低的技术手段,卖家可以购买流量作“直通车”。网络当然不完美,很多商户通过网络数据找到漏洞的方法,电商培训课是“教你14天上首页”之类,还有7天螺旋和14天螺旋的商业操作模型。但所有奥秘的终极指向还是,“产品质量才能真正实现盈利”。

2014年3月,阿里巴巴举办了首届大数据竞赛。第二赛季的优胜者实战参与天猫“双十一”的算法设计。他们是6个“90后”学生组成的团队。天猫将当天会场流量的10%到30%分配给学生团队,天猫自己的算法团队也用同样的流量进行算法比赛,如果学生团队胜出,那么他们6人将共同获得100万元比赛奖金。竞赛吸引了来自全球的7276支队伍共1万多人参赛,并在第二赛季开放了5.7亿条脱敏数据。这是中国网络里数据最丰富、维度最广的平台。数据足够大且规则一直在改变的情况下,事情变得更有趣了。

数据演算正在尽可能地把各种标着代购、设计、小众的衣服和搭配包包、模特示范穿着的商品排序给你。因为最近你搜一件羊绒大衣时,引擎后面已经有一双看不见的眼睛将你定位成经常浏览代购、喜欢小众店铺、价格区间偏高、退货率约等于没有、特别爱给好评甚至爱秀照片的买家了。

往年的“双十一”,哪些商品能够进入天猫“双十一”的会场,是由淘宝人工决定的。商家报给天猫运营“小二”10款畅销商品,“小二”再进行人工挑选。2014年引入大数据算法后,系统根据报名商品的过往销售量、细分行业趋势、消费者需求,来判断这些商品是不是最有热销潜质的款式。

为了实现更精准的推荐,大数据记录的商品标签越来越细致,长尾词越来愈多。以前搜索一双耐克球鞋,只会匹配两个标签,但今年就会细致到一双蓝色的36码耐克球鞋,价格、功能、面料、配色都会被打上标签。通过大数据人物画像,一个成熟的网购用户背后可能有上万个喜好标签,包括喜欢穿休闲裤还是牛仔裤,喜欢喝茶还是咖啡,喜欢豆豆鞋还是运动鞋。“给它一堆商品,和一群人,大数据就能判断出谁更喜欢哪个商品,匹配度是多少。”文本识别引擎将关键词过滤升级为语法语义分析,同时引入机器学习算法,取代了人工搜索和经验判断。在此基础上建立起来的信息排查平台,对全网10亿级的商品数据进行全量检索和处置,支持多达60个维度的组合条件筛选,每天消息处理量2亿以上。

担心自己看不到其他新鲜的商品?担心自己被定型成一个无趣的人?谁也不愿意社交网路被一些推送垃圾广告信息的店铺占领。“推送”的好感度在广告中排列最低,人们依然喜爱的是橱窗。算法和交互设计上当然首先考虑了这个问题,所以被网购平台捧红的偶像层出不穷,“切糕王子”的2015限量版切糕才能几小时立刻售罄,这可是一个长红不衰的网络小店,你能想象有多少人从此真正喜欢上了切糕这种食物吗?

网购平台提供开发工具意味着鼓励小前端自己创造,如果大平台只创造市场,让小前端来分抢现成大单,让成本领先者往往从中受益,导致趋同,就会让网购生态系统倒退。从苹果经验中就可以看出,开发工具水平的高低,往往直接决定多样性水平的高低。而那些你反复看又靠谱的商家,即使广告费少也会被网站排到前面。而给你推荐的各色稀奇古怪的店铺,不管是卖二手日本海报,还是一些完全没销量的代购北欧的盘盘碗碗,5个小时就会被放进大数据重新洗牌一次,然后你又会看到一个全然不同的新的消费世界。

同类推荐
  • 哈尔姆斯中短篇小说集

    哈尔姆斯中短篇小说集

    本书是哈尔姆斯创作巅峰时期的作品汇编,前30篇均来自他最有名的短篇小说集《意外》,第31篇是广为流传的中篇作品《老太婆》,其余四篇则选自他手稿中的情色小短篇。这部作品可以看作是了解、认识哈尔姆斯最好的起点,它短小精悍、幽默诙谐,充满了梦境一样的碎片。有日式漫画中的夸张与无稽,也有暴力与笑料。从题目《意外》就可以看出,整本书就是一个个生活中不经意间发生的故事,主人公们或坠落、或碰撞、或对视、或猝死。
  • 就告诉你一个人

    就告诉你一个人

    曾热爱过文学的人,大概都不会忘记欧·亨利、都德、契诃夫、海明威、鲁迅、汪曾琪等作家的短篇作品,即使是“先锋”、“现代”、“后现代”的作家,也不乏短小精致的传世之作。在当下时尚的文学消费潮流中,能够挽回文学精致的写作和阅读,张扬短篇小说大概是有效的方式之一。本书精选了衣向东20篇优秀短篇精华,其中《就告诉你一个人》更是一部显示作家优秀才能的短篇小说。
  • 神雕侠侣(全四册)(纯文字新修版)

    神雕侠侣(全四册)(纯文字新修版)

    南宋末年,江南少年杨过自小在全真教学武。全真教教规森严,天性叛逆的杨过在教中吃尽苦头,忍无可忍,终于逃出全真教。被活死人墓中的小龙女收留为徒。师徒二人在墓中一起练武、一起长大,渐生情愫。但师徒通婚违背宋朝礼教,二人爱情不能为世俗所容,其间尝尽聚合离散之苦,杨过更得知了父亲身死的真相,但在国仇家恨的权衡中明白了更多。杨龙二人的感情一再波折,最终分离十六年。二人十六年后重逢,无限欣喜……杨过带着小龙女离开深渊,前往襄阳。杨过以高强武功,于万军之中杀死蒙古皇帝,蒙古大军顿时崩溃,在襄阳就要失守时解了襄阳十六年的围困。经此一役,神雕侠侣天下扬名,杨过却带着小龙女悄然隐退……
  • 莫泊桑短篇小说选

    莫泊桑短篇小说选

    莫泊桑千余字的短篇小说情节高度集中,人物呼之欲出,同时寄寓着深刻的社会意义,这当中对照艺术的运用也发挥着重要的作用。《莫泊桑短篇小说选(世界短篇小说之王的经典之作)》便是他的作品合集。
  • 骗局

    骗局

    一部中国式的《阴谋与爱情》,一部现实版的《楚门的世界》,一部男人版《回家的诱惑》,一部演绎情场与商场的“现形记”。
热门推荐
  • 衣锦美人

    衣锦美人

    曲款冬觉得自己的前半生就是“硕人”里的庄姜夫人,“硬件”高配,“软件”没有………就在她几乎放弃“治疗”的时候,老天爷突然大发慈悲了,还送她一个原来只敢仰望的男人……款冬觉得自己手有点抖……收还是不收呢?穆明决:咳~咳~款冬秒回:收!————原来人生中有的缺席,只是在等待一个最好的时机。
  • 三国之霸业

    三国之霸业

    东汉末年,群雄并起。穿越者秦成,凭借自己对历史的一知半解,在铁血中开创自己的末汉霸业。正所谓:凛凛人如在,谁云汉已亡!不做悲情英雄,在这里,将会开启一个不一样的三国时代!
  • 残局(中国好小说)

    残局(中国好小说)

    影视中心的包大哥突然去世,由他的死,牵扯出影视中心人事斗争的复杂。单位里的人际关系就像一个象棋的残局,每一个人都是其中的一个子。车书记与朱主任的明争暗斗,在影视中心搅起了风云。老实本分的包大哥深陷其中,处处碰壁,被人利用,最后成为弃子。小说刻画了职场小人物的命运,具有深刻的现实意义。
  • 礼教下延之后:文化研究论文集

    礼教下延之后:文化研究论文集

    《礼教下延之后:文化研究论文集》主要内容包括:礼教下延,色情上升:中国文化的分层互动、重读《红旗歌谣》:试看“全民合一文化”、无邪的伪善:俗文学的道德悖论、从金庸小说找民族共识、双单向道:20世纪中西文化交流的基本势态、三层茧内:华人小说的题材自限、无根者之梦:海外小说中的漂泊主题、好一双“中国式眼睛等。
  • 末世当大佬

    末世当大佬

    突如其来的黑暗遮蔽了天空,然而这只是末日的警告。当大地升起了迷雾,才是末世的开始。死去的尸体若不妥善处理,将会再次“活”过来!活着的生物也开始了变异,人类失去了往日主宰其他生灵的身份。在这末世,要想活下去,只能变强,为了变强,我可以不择手段!――徐昊。
  • 小只无赖大只学神

    小只无赖大只学神

    “原来你学习这么好,怎么不去上学?”16岁的甄西无意间捡到一只在小西镇从未遇见的“学神”,无赖到底的将袁皑尤送进谦和高中,这一来,就彻底改变了所有人命运........“我会感谢那个傻女人的傻劲,不然我不知道现在会在哪里苟活一生。”10年后,袁皑尤对着手机苦涩的说。
  • DRAMATIC LYRICS

    DRAMATIC LYRICS

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。汇聚授权电子版权。
  • 痴情酷王爷:恋上替嫁小厨娘

    痴情酷王爷:恋上替嫁小厨娘

    “喝了它。”一碗堕胎药,葬送了她所有的温情与希望。“你还不配拥有本王的孩子。”冰冷的笑意迎向他绝情的双眸,毅然离开……再次出现,她已是为魔,为情而着魔,杀尽天下绝情男儿。可是,真正面对他时,她竟然下不了手……
  • 誓不成婚:帝少索情99天

    誓不成婚:帝少索情99天

    21世纪杀手组织首领的千金颜堇舒与未婚夫厉爵遭人设计陷害坠入悬崖后,意外穿越到一个神秘星球。原本相爱的两个人穿越后,各自遇到了另类的姻缘,颜堇舒落入神秘星球的第一黑暗大家族,与家族腹黑高富帅-二少洛玮恩擦出火花,他夺走她的唯一,当作筹码,对她日夜掠夺折磨,从此上演一段虐恋。
  • 土豪王爷的从商妃

    土豪王爷的从商妃

    伊琦玉赶上了穿越到班车,来到古代的位置竟然是睡在棺木里,夫君和侧妃的合谋,她才会至此。在现代被爱情负了,在古代她可不会期望爱情她一心想挣大钱,刚好她的夫君正是皇上的三儿子,这不是现成的提款机吗?她就来了一个鲤鱼翻身,现代的她带着一帮丫鬟姐妹闯天下,挣得了大钱,斗得过小三,训得了公主,智得过众臣,气得过神医,胆大的过皇上,引得了美男,当得了正妃,坑得过王爷,生的了萌娃,骗得了王爷的大MONEY。【慈慈需要亲们的点击,收藏,推荐,不用怜惜,往死里点,么么哒】