微博推荐架构的演进,谁在投无人零售

原标题:饿了么“短平快”创新项目的架构取舍之道

最近新零售这个概念很火,那什么是新零售呢,那我们先明确下零售的定义,零售即是面向终端消费者提供产品和服务的领域。那什么是新零售呢,运用大数据、人工智能等先进技术手段,对商品的生产、流通与销售过程进行升级改造?我觉得大数据,AI这些都是其中的某些方法。在我理解,只要是围绕零售的各个链条,提高了零售商业过程中的经营效率,有了新的零售形态,给予消费者更好的服务和体验,都可以算作新零售。
今天我想谈一下新零售领域的一家明星公司——猩便利。猩便利的定位是一家主打即时便利消费的新零售公司。

引言

无需置疑,正在吹响的无人零售战斗号角,背后打的是一场资本的战役。

本文根据史海峰老师在〖2018 DAMS中国数据资产管理峰会〗现场演讲内容整理而成。

猩便利的业务——无人货架和智慧便利店

微博(Weibo)是一种通过关注机制分享简短实时信息的广播式社交网络平台。微博用户通过关注来订阅内容,在这种场景下,推荐系统可以很好地和订阅分发体系进行融合,相互促进。微博两个核心基础点:一是用户关系构建,二是内容传播,微博推荐一直致力于优化这两点,促进微博发展。如图1所示:

亿欧公司创始人黄渊普在《新零售创业挖人指南》一文中指出,以以往团购、打车、共享单车等领域的历史经验判断,像无人零售一样快速成长的巨大市场,要成功必须“先规模,后优化”。以无人零售目前细分的三个领域(无人便利店、无人货架、智能零售终端)来看,无论选择哪个赛道,都需要巨大的资金投入。

图片 1

  • 无人货架
    无人货架模式,目前市场上有较多的竞争对手,主要有智能货柜,开放式货架和是否组合冰箱鲜食这几种。

图片 2

无人便利店和智能零售终端需要大量研发成本,来快速迭代产品并确保能够实现量产;无人货架虽然前端没有技术门槛,但是所有人都在拼速度,需要大量的BD人员迅速铺点。此外,三者的都需要强大的后端数据和运营团队来做支撑,更是拼到后期见内功时的重要壁垒,参考饿了么几千人的技术团队,如果团队技术人员配备不足一半,可能在B轮前就碰到诸多无法解决的问题(补货周期、货损率)。

(点击“此处”可获取史海峰演讲完整PPT)

1.无人货架的本质逻辑是什么
在我看来,就是在特定的时间,场景下,提供给用户唯一的选择,无限的趋近用户,从而占领用户心智,成为习惯。

图1 微博推荐的使命

所以说,弹药是否充足,从一开始就决定了一个无人零售玩家能走多远。而且,这次无人零售的风口吹得似乎比前几次更猛,已经超过去年的共享单车和今年初的共享充电宝。目前,赛道内不仅玩家众多,几乎所有的投资者都一致看好,不论是机构投资者、战略投资者,还是ATJ这几个传统的大阵营,都在快速布局。

讲师介绍

在微博推荐发展的过程中遇到体系方向的变化、业务的不断更迭、目标的重新树立,其产品思路、架构以及算法也随之进行变迁。本文主要阐述在这个过程中推荐架构的演进,从产品目标、算法需求以及技术发展等维度为读者呈现一个完整的发展脉络,同时也希望通过这个机会跟大家一起探讨业务与技术的相互关系。

那么,作为一个无人零售创业者,你需要知道的是,究竟是谁在投无人零售?他们在投哪些细分领域?一般投多少?当然,还有更重要的是:谁还攥着筹码,在观望?

史海峰,饿了么高级总监,曾在神州数码、亚信联创长期从事电信行业业务支撑系统集成工作,参与移动、联通多个项目,具有丰富的大型业务系统研发实施经验。曾在当当负责总体架构规划、技术规范制定和技术预研推广,并负责技术委员会组织管理工作,发掘最佳实践、推动技术革新,组织内外部技术交流。负责饿了么技术创新部,2017年推出NOW无人货架,切入新零售风口。

  1. 智慧便利店

为了便于理解微博推荐架构演进,在介绍之前需要陈述一下微博推荐在流程上的构成,其实这个和微博本身没有关系,理论上业内推荐所存在的流程基本都是相同的。如图2所示,推荐是为了解决用户与item之间的关系,将用户感兴趣的item推荐给他/她。那么,一个item被推荐出来会经过候选、排序、策略、展示、反馈到评估再改变候选等等形成一个完整的回路。

追上风口的VC

大家好,我今天的分享主题是“从0到1:创新项目架构取舍之道”。大概一两年前,饿了么的CTO在会上问大家,你们觉得像饿了么这样级别的互联网公司,最重要的资产是什么?作为一个技术领导者,有没有考虑过这个问题?到底是数据、代码、客户、人才、系统?其实到最后会发现每一种资产都很重要,还有创新能力也非常重要。

图片 3

作为“风口制造机”,各路VC自然不会放过无人零售这样一个性感的概念。有趣的是,与以往不同,这次VC们似乎一致看好这个方向,各种风格的机构都已经入场,不论是投天使早期的还是投B、C轮的,不论是一线大机构还是VC新兴力量,也有原先较少涉及零售或O2O领域的机构。可以想见,这次不会有“错失50亿美金共享单车的吴世春”了。

我今天也会提到一些这方面的考虑,主要内容是以下四点:

  1. 目前两种业务的结合点

图2推荐的链路

亿欧:无人零售领域机构投资者

  • 创新项目从0到1架构演进策略:一个项目从0到1,你要上来就搭个大的架构还是慢慢来?顾虑是对手可能比你还敏捷,中间有很多环节顾不上,别人上的我也要上,那怎么办?
  • 成熟技术体系中如何快速创新:饿了么这么大一个公司,已经拥有成熟的体系,如果想做一些创新,怎么才能实现?
  • 敏捷迭代中的技术债如何偿还?
  • 技术怎么与创新业务齐头并进?这两点都围绕技术问题展开,情况是开始可能技术不够成熟,后面功能越来越丰富,数据越来越多,是不是可以做技术驱动业务的事情?
  1. 物流共用,智慧便利店可作为前置仓,节约了物流成本,提高了物流效率。
  2. 数据的互通反哺,根据顾客在便利店的消费数据,反过来指导该便利店辐射范围内办公室的货架选品,同时办公室货架的选品,也可以反过来指导货架辐射内智慧便利店的进货选品数量。
  3. APP涵盖两种业务,流量互通,互相曝光,将只知道便利店的用户,转化为潜在申请货架的用户。同时将那些只知道无人货架的用户,增大他们去便利店进行更舒适,针对性的采购行为的概率。

在上述整体流程的基础上,微博推荐架构经历了如图3所示的三个阶段:

1、VC偏爱无人货架

一、案例引入

猩便利的商业模式

图片 4

可以看出,VC们普遍更喜欢无人货架这一细分领域,尤其是真格、经纬这些以天使、A轮为主的机构。

我们用一个案例来分析:去年饿了么做了无人货架这个业务,无人货架是2017年新零售行业的一个风口,很多公司的办公室里面都有。去年的9月份开始,到现在不足一年,所以还有很大的发展空间。它的作用是放在办公室里面,如果你饿了,想吃点什么喝点什么,走过去扫码就可以。

电商平台自身的交易额
目前标品的毛利低,所以为了扩大毛利,业界都在加码鲜食,便当,水果等等。这些方向更加符合追求健康的趋势,并且可以进一步覆盖白领群体的早中晚饭场景。
流量生意
在目前线上流量获客成本高企的背景下,线下无人货架的平均获客成本是及其可观的,那么低价圈入的大量流量就有了极高的价值,流量变现的可能方向:
1.例如分众传媒,做精准群体的广告生意。
2.线上做一些品牌广告将流量变现,如一些导购性质的图文消息页。
3.线上商城,线下自提,提高了便利店的坪效,讲线上流量导流到线下。
4.进一步发展便利性,实现线上下单,线下配送,物流团队可能采用第三方团队,非自营。
增值服务
打造会员体系,围绕线上线下的体验,提高会员的付费率和续费率,效仿业界传奇Costco的会员体系,是否能以极低的价格,享受到及其品质化的服务。
IP周边变现
猩猩的IP形象,和统一的店面VI形象,售卖一些周边文化产品,例如从社交软件Line走出的布朗熊和可妮兔,可能也会有一个XX猩,萌萌的走进生活?
规模化效应
货架和便利店数量大之后,反向供应商抽取佣金。
大数据价值
数据的变现,精准营销,用户画像。

通常架构的产生都会来自于团队和业务环境,源于环境因素而致力于解决环境中的问题,架构形成会带着较为强烈的特点,在其实施中会产生交给针对性的效果。本文将从环境因素、架构组成与特点以及实施效果这三个方面进行阐述微博推荐的三个阶段。

这背后的逻辑其实也很简单。首先,相比无人便利店,无人货架门槛低,不需要等待某个关键性的技术突破(机器视觉、生物识别)。无人货架在早期,主要拼的是创始团队的经验、资源和整个公司的执行力,配以千万级元的弹药,跑到B轮基本没问题。目前这个风口已经吸引足够多优秀的人才,对于信奉投人至上的天使投资人来说,可控的风险下在早期换取更多筹码,何乐而不为?

为什么它是新零售的风口?跟你在路边买水果直接扫码有什么区别?我们展开来讲:

猩便利业务模式的一些难点

1 独立式的1.0

1.1 环境

影响架构形成的环境因素可以分为内部环境因素以及外部环境因素。内部因素主要是团队及其成员相关内容,而外部因素主要来自于外部门、整个公司或者整个行业领域。

微博推荐1.0的这段时间是从2011年7月份到2013年2月份左右,其主要的目标就是实现当前的业务需求。对于独立式的解释:每一个业务项目都是一套完整架构流程,架构之间相对独立,甚至包括技术栈。之所以称之为独立式其内部因素有几点:

1) 当时团队是一个新团队,成员也相对较新,相互的合作不多,缺乏推荐领域整体性经验。

2) 团队成员对于推荐架构都有自己的一些或多或少的理解,但是对于在当前场景下的微博推荐架构,共识并没有形成。

当然起决定性因素的还是外部环境,是因为内部原因还是比较好协调和进化的。当时的外部环境因素包括:

1) 项目需求很多,在当时一个5人团队并行开发的项目平均在3-5个左右,当然最重要的因素是当时的微博产品正处于高速发展期,很多地方都需要微博推荐的支撑。同时,项目周期也很短,排期仓促,很难有时间进行细致的整理和抽象。典型产品包括:微吧、微群、微刊、微话题、用户以及内容排序等等。

2) 团队是一个支撑性的,绝大部分需求来自于外部团队,各个外部团队不同的产品方向也导致疲于应付需求。

3) 当时业内的推荐架构也有不同的发展方向,大家都在尝试摸索一些符合自身发展的架构思路。

由于上述的那些原因,通常我们面对一个接一个的项目时,都会根据自己的理解使用熟悉的技术栈来搭建流程,这样形成了一个又一个的独立架构。

1.2 架构组成与特点

上节中提到了独立架构形成的原因,大家可能觉得架构组成没有必要去描述了,这是不对的,事实上后来的分层以及平台架构的基础恰恰都来源于这个阶段,没有这个阶段团队不断踩坑总结就没有因地制宜产生的后续进化。因此,我们需要为大家剖析一下推荐1.0的架构组成与特点。

1) 技术目标

参考图2所示,以业务实现为主要目标的微博推荐1.0,没有建立起完整的反馈以及评估体系,同时排序也是被策略取代,那么讲主要的重点体现到了候选、策略以及展现上。上述推荐流程被转化为:候选à策略à展现简单形态。

2) 架构组成

如图4所示,我们试图将每个项目的架构能够在图中表达出来,在真正的实施过程中,每一个项目负责人会选择使用apache+mod_python作为服务架构同时,使用redis作为存储选型。在一些特定的项目中,引入了复杂运算从而诞生了c/c 的服务框架woo;同时,对于数据的存储要求特型化的项目中又自己研发了一系列的db,比如早期存储静态数据的mapdb,存储key-list的keylistdb等等。当然,在部署中会比下图更加随意一些,一个项目几台服务器部署好微博服务提供http请求,然后再找几个服务器安装redis作为数据支撑,来源数据和业务方定好规则使用rsync传输就OK了,大部分策略在python中实现。

图中可以看到主要的技术栈:

  • web服务:apache+mod_python,后来发展成为社区更为完善的mod_wsgi。使用python作为WEB开发语言主要是因为平时处理数据使用的都是python,同时上手快,学习曲线平缓。
  • 运算服务:c/c ,形成woo内部服务框架
  • db:redis/mapdb/keylistdb等等,分为两种存储方法:redis以及自研型
  • 数据来源:rsync文件传输,firehose作为微博相关内容来源[微博内部使用的一种数据队列]

图片 5

图4 微博推荐1.0架构简图

3) 架构特点

将架构特点划分为优点和缺点进行描述。那么优点是:

  • 简单,易于实现,不需要额外的基础支撑
  • 利于业务的功能快速实现
  • 利于多业务并行开展,相互不影响

而不足是:

  • 推荐流程不完整,缺乏反馈、评估等等重要内容,对于数据方面也极度缺乏统一处理方法
  • 没有提供给算法相关的支撑,很难将推荐做的深入
  • 几乎无法进行专业运维
  • QA的测试仅仅能到功能层面,模块级别的测试几乎不可能,因为太过于分散
  • 很难进行团队协作,不利于项目的分解

1.3 成果

尽管存在诸多的缺点,但是在其发展的过程中,也给后面的架构优化奠定了基础,其成果如下:

1) 在微博高速发展的过程中,满足了微博对于推荐的业务支撑要求,在这段时期里面共完成二十多个独立项目。

2) 诞生了woo的基础框架,后面的内部高效运算框架来源于此

3) 诞生了mapdb的静态存储,成为后期微博推荐静态存储的雏形

4) web应用层的不断需求的总结,组建形成推荐通用应用框架

此外,业内有一个没那么靠谱的推断:无人货架可能在基本跑完时反攻无人便利店和智能终端,参考滴滴以出租车市场为切入点,反攻专车市场,干掉更早入局的其他专车平台,这里按下不表。

  • 无人货架模式定位在办公室里,这是一个封闭的公共空间。如果想吃饭可以叫饿了么,但是想吃点零食或者喝点水,无人货架三十秒之内就可以拿到手,而且不用考虑我什么时候去买去囤,因为随时都可以。
  • 货架面对空间里这么多的人,核心问题是怎样最大程度地满足需求,以及在此基础上是否能给一些新的口味。甚至再进一步,在这些流量上能不能做一些拓展,架子上没有的东西是不是也可以卖,比如新鲜水果。很多公司可以看到有冷柜和热柜,热柜负责保温的,标准化的场景是可以热乎着吃,放个豆浆、包子等。所以无人货架是一个很好的零售业务场景。
  • 我们可以对接企业的需求,比如老板看大家挺累,我们来喝个下午茶,买光架子上的零食水果,大家随便吃也没多少钱。所以这个模式有很多展开空间,未来行业里,会有更多的玩法。
  • 商业模式涉及多方,起量慢
    由于交易需要撮合方较多,需要撮合场地方,供货方,用户,物流配送方,所以达到规模化效应的速度也会变慢。像共享单车业务,只需撮合用户这一方,所以起量就特别的快,滴滴比共享单车业务稍慢,外卖业务撮合三方,起量最慢。
  • 基础设施服务和推广哪个先行?先有鸡还是先有蛋
    先推广到用户时,若用户所在公司没有货架,那么用户很快就会流失,因为并不能享受到服务。若先铺设货架,那么需要完成用户教育过程,就会自然产生购买。但是你需要知道哪些公司能铺设,所以铺设货架的速度和精度对BD的依赖度是很高的,导致起量不会那么快。所以目前的货架认领模式个人觉得非常好,这个是面向C端的宣传,制造品牌形象和服务,引起用户兴趣,期望通过宣传到1个员工就撬动这个公司,通过这个意向的员工,连接到那个Key Person,从而大大提高了BD的效率和精准度与成功率。

2 分层式的2.0

上一节介绍完独立的1.0,按照架构发展的道路,我们到了分叉路口,一边是流行的LAMP架构,另一边是符合广告、搜索的CELL架构。LAMP架构数据策略分离,脚本语言作为业务开发主要语言,项目快速开发和迭代的首选。CELL结构强调本地流程处理,数据与业务耦合性强,自研的服务以及数据库较多出现,适用于高性能效果型产品。最终我们选择兼容两者,倾向于业务的架构体系。为何如此呢?让我们再来看看当时的环境。

2.1 环境

微博推荐2.0的时间段是2013年3月份到2014年年底,这段时间内部环境因素是:

1) 当前团队成员合作已经很长时间,彼此相互熟悉,同时对于技术选型有了一定的共识。

2) 团队产品进行了聚焦,针对内容/用户/垂直类三类推荐进行了整理,同时对于场景分别进行了重点划分:feed流内、正文页以及PC首页右侧。这种聚焦有利于进行架构统一,同时也为技术争取了时间。

而外部因素是:

1) 公司对于推荐有了比较明确的定位,提高关系达成以及内容传播效率,同时为推荐型广告打好技术探索、场景介入以及用户体验的基础。

2) 推荐领域里,各个公司都纷纷有了对于架构的产出,对于微博推荐有了很好的指导意义。

2.2 架构组成与特点

团队在执行核心业务实现的时候,不断演进工具以及框架,构建2.0的目标呼之欲出。

1) 技术目标

与1.0不同,仅仅实现业务需求已经不是2.0的技术目标了,针对完整的推荐流程,我们需要解决:

  • 首先要实现完整的推荐流程,架构覆盖候选、排序、策略、展示、反馈和评估。
  • 以数据为先,提炼出数据架构。实现数据对比,效果以数据为准;实现数据通道,体现反馈;实现数据落地,承接业务需求。
  • 提供算法方便介入的方式。
  • 既能保证业务的快速迭代和开发,又能支持高效运算。

2) 架构组成

微博推荐2.0的架构如图5所示,它不再是一个个独立的系统,也不是会让开发人员使用不同的技术解决相似的问题。这个架构图主要包括几个部分的内容:

应用层:主要承担推荐策略以及展现方面的工作,其特点在于充分发挥脚本语言的特点响应迭代需求。大部分的推荐内容经过排序之后已经可以展示了,但是由于前端产品策略的设定需要融合、删选以及重排操作,需要这一层来完成,在技术层面属于IO密集型的。在技术选型上,早期在原有apache+mod_python基础上进行了框架开发产生了common_recom_frame。该框架面向的是二次开发者,基于此框架可以很好的实现推荐业务流程。该框架的核心思想是提炼出project、work以及data的三层interface,project针对每一个推荐项目,work针对每个推荐项目中不同推荐方法,而data则是管理下游数据的访问方法。同时,设定了两个规范:一个是统一了推荐接口,无论是用户、内容还是垂直业务;另一个是屏蔽了不同协议数据库访问方法,极大提高了开发效率。common_recom_frame框架的诞生基本上解决了产品的各种推荐策略需求,走在了产品的前面。

图片 6

图5 微博推荐2.0架构示意图

计算层:主要承担推荐的排序计算,主要消耗CPU,在这一层给算法提供介入方法,支持算法的模型迭代。在这一层的技术选型上,我们继承了原有的WOO协议框架,一种基于c/c 开发的内部高效通讯框架。当然也做了不少扩展,依然借用了上面提到的common_recom_frame的思想,在WOO框架基础上实现了对于project/work/data的管理,提供给二次开发者更为高效的开发工具。在团队的开源项目中包含这个工具:

数据层:主要承担推荐的数据流以及存储工作。数据层的工作主要是解决数据的IN/OUT/STORE问题。其中IN数据如何进入系统,OUT表示数据如何访问,STORE表示数据如何存。当在进行数据层规划的时候,又分析了微博推荐的数据特点,可以将其分为两类:静态和动态。静态数据的定义为: 更新需要全量同时频次较低的大规模数据;动态数据的定义为:动态更新同时频次较高的增量数据。这样在IN/OUT/SOTRE的大方向下,同时区分对待静态和动态数据,产生了RIN/R9-interface、redis/lushan、tmproxy/gout代理的工具或者框架。在这里展开讲一下,RIN支持数据动态数据的接入,通过web服务的方式接收数据,后端使用ckestrel进行队列管理,辅以多服务集群的消费框架,使用者只需要进行自己业务的开发即可快速上线消费动态数据。R9-interface处理静态数据的接入,推荐的大量静态数据来源于Hadoop集群的运算,r9-interface框架勇来解决静态运算[MR、HIVE SQL以及SPARK 运算]的通知、管理以及数据载入。针对推荐数据的存储,动态数据大量使用了redis集群,静态数据则使用了lushan集群。对于lushan这个工具在团队开源项目中也包含了:

基础服务:推荐系统的基础服务主要包括监控、报警以及评测系统,数据监控系统分为性能以及效果监控两类,评测系统主要用来进行下线评估,在上线之前对效果有一定预期以及减少无效上线。图6展示了基础服务的UI。

图片 7

图6 基础服务系统的UI

3) 特点

优点是:

  • 支撑完整的推荐流程,对于数据方面拥有统一的处理方法
  • 在兼顾业务功能快速实现的同时保证了效果技术的不断深化
  • 给算法提供了很好的支持
  • 提出以数据为先的思想,可以全面对比效果,推荐效果不断得以提升
  • 封层体系易于部署以及QA介入进行测试

而不足是:

  • 和推荐核心有一定的距离,并没有完全为推荐量身定做
  • 将推荐的策略算法完全交给了开发者,不利于推荐通用型
  • 对于算法的训练并没有涉及,仅仅是一个线上投放系统,不足以构成完整的推荐体系

2.3 成果

微博推荐2.0的诞生产生很好的收益,其成果如下:

1) 微博推荐的核心业务均在该体系下完成:正文页推荐、趋势用户推荐、趋势内容推荐、各个场景下的用户推荐、粉丝经济的粉条、账号推荐等等产品

2) 诞生了lab_common_so的基础框架,并进行了开源

3) 诞生了静态存储集群解决方案lushan,并进行了开源

4) RUF框架的诞生极大提升了业务生产效率,同时也为openresty社区做出一定贡献

2、加码第三方服务商,曲线入局

二、创新项目从0到1架构演进策略

未来的可迭代点

3 平台式的3.0

上节中描述2.0的时候提到了一个重要不足是“和推荐核心有一定的距离,并没有完全为推荐量身定做”,我们希望能够在推荐3.0中解决它,这个不足会带来什么问题,以及为何在已经满足业务需求的同时推荐的架构再次往前发展呢?那么接下来为各位展现微博推荐平台式的3.0设计,我们还是先看看所处的环境。

3.1 环境

微博推荐3.0的时间段是2014年底至今,当前的内部环境因素是:

1) 推荐产品不在扩张,对效果更为看重,将工作重点从业务开发和迭代转化为以效果为目标的技术迭代。

2) 新项目或者迭代推荐业务的时候发现重复的事情很多,而架构没有解决,工作存在冗余。

而外部因素是:

1) 公司也从业务扩展转变为效率为先,提升用户体验以及内容质量上来。

2) 微博推荐在推荐技术环节距离领域内有一定距离,当下有条件进行追赶。

3.2 架构组成与特点

当前的环境也能体现出3.0的技术目标:

1) 技术目标

与2.0不同,全覆盖推荐流程已经不是3.0的目标,其目标是:

抽象出推荐流程中对于候选/排序/训练/反馈的通用方法来推荐是一个算法数据问题,应该以一个算法的角度构建推荐系统,因此需要更为贴近算法策略

2) 架构组成

如图7所示,是微博推荐3.0的架构,也是当前实行的架构体系,大家其实可以发现,这是基于2.0 发展起来的,既然还保留了大量2.0中使用的分层体系以及工具框架。在这里重点描述几个差异:

两个标准:一个是针对应用层,作为整体框架输出,应用层设定all in one 接口标准,其标准包含了输入以及输出参数;另外一个是针对动态输入rin,由于离线计算我们可以确定结构,因此一个输入层工具r9-interface不需要设定规范,但是rin是需要进行标准设定,从属性/交互数据/日志等等层面进行划分。

计算层增加对于候选的标准生成方法:Artemis内容候选模块,item-cands用户候选模块、……,在项目开发中只需要选择这些候选生成方法即可。

增加了策略平台EROS,解决算法模型的问题。EROS主要的几个功能是:1)训练模型 2)特征选取 3)上线对比测试。

数据层中的r9-interface以及rin增加对于候选的生成方法,在线以及离线使用推荐通用策略生成结果。

图片 8

图7 微博推荐3.0的架构示意图

3) 特点

主要描述其优势:

  • 继承了原有2.0的特点,保留了其优势
  • 对于推荐理解更为深入,结合更为紧密
  • 解决了推荐候选/排序/训练的算法最重要问题

3.3 成果

微博推荐3.0的诞生,其成果如下:

1) 微博推荐的核心业务会逐步迁移到该体系下,以算法数据作为驱动,提升效果

2) 诞生了EROS的训练流程,提出了训练的标准方法

3) 针对推荐设定了标准的输入输出方法

4) 针对候选,产生了具有抽象意义的推荐方法集合

此外,有些机构显然也偏爱“淘金路上的卖水者”这样的故事,在无人零售吸引大量热钱进入的同时,必然也会有相当大一部分流入一些更成熟、专业的第三方服务商手中,甚至可能直接催生新的细分行业。

图片 9

  • 智慧便利店
    在满足自助购物需求的同时,叠加休憩和体验品质生活的物理空间。个人觉得未来可以像日本的7-11一样,充值水电煤公交卡等等,ATM取款机,推出更多的便民服务。一切围绕着真正的便利出发,为人们的生活效率做出最大的提高。

  • 前台APP

4 总结

上文中对微博推荐架构演进做了较为详实的介绍,在这个演进的过程团队以及个人收益很大,技术与业务的关系在架构中得到了很好的体现。有几点可以跟大家分享的是:

1) 技术来源于业务同时提升业务发展,业务发展又反过来推动技术的前进,他们是一个相互影响相互促进的关系。和业务共同发展的技术才是有生命力的。

2) 技术架构的选型建议是寻找当前最短路径,然后进行不断优化迭代,一口气吃撑是不现实的,也是不合理的。

3) 推广某个框架和工具最好的方式不是行政命令也不是请客吃饭,而是的大家都是参与者,如同开源项目,每个人都是它的主人,这样人人维护,人人使用。

4) 团队崇尚简单可依靠,它说起来容易做起来难,不过有一个好方法就是懂得自己不应该做什么,而不是应该做什么。

5) 说到推荐这个特殊领域上来,设定目标,跟踪目标很重要,把数据和目标摆出来,产品、架构以及算法都会想办法去解决的。

以过往零售业所使用的第三方服务来看,主要涉及到支付硬件、选址及客群分析、分销系统、CRM系统等各类软硬件解决方案。反观无人零售,出现了一些依靠出售或出租软硬件整体解决方案为主要盈利模式的第三方服务商,他们不参与选址、运营,机器及软件一旦售出或签下租约,即有稳定可观的收入。一些偏好企业服务领域、又觉得现在直接进入正面战场时机略晚的机构,可能会更多关注人力资源、SaaS及智能终端硬件商等领域。

去年8月6日业务团队提出要试水项目的时候,我们知道一些创业公司做的风生水起,甚至一些大公司比如京东、顺丰、苏宁都已经开始进入这个领域,包括后来的猎豹。这个业务上我们是后来者,后发优势就是你知道别人是怎么做的,但面临的压力也很大。试水期间(8月6日~23日),我们做了商品调研、业务场景调研,也提了一些解决方案,跨部门协作开发,还做了Demo在公司里试用。

  1. 增值服务精准化
    例如某款产品的忠诚用户/充值会员用户,即某用户总是买这一款产品,是否可以给他这一款产品更低的价格,而这个价格在其他地方是没有的。这是优化营销资源和精准化的体现。
  2. 主题资讯模块
    增强导购类文章,增加内容导购形式,激发用户的阅读欲与购买欲,带来更高的GMV
  3. 解决非标品保质期短,耗损高的问题
    根据生产日期数据,若该非标品快要过期,则对该非标品覆盖的货架用户推送PUSH,大额折扣或第二件半价,刺激用户购买清库存。
    当用户正常扫码购买时,根据生产日期等条件判断,自动提示该产品现在有第二件半价
  4. 内容社区
    发现好货,通过用户UGC,看看用户喜欢的零食爆款是什么?同时也进行专业的PGC承载精致内容的宣发。并且内容社区,可以承载一个用户反馈的呼声,比如这个办公室大家更想要什么零食,可以一键反馈意见,通过后台统计,看看更可能去上新什么货品。
  5. 线上即时电商
    目前是到店取,将来如果物流团队配送,可能会吞食部分外卖市场的生意,不过个人感觉概率不大,毕竟做物流配送的投入太大,更大可能接入第三方,或者是众包配送,照样也是对外卖市场的侵蚀。

3、朱啸虎会投谁?

9月6日无人货架项目立项;9月20日V1.0.0产品正式上线。整个过程看起来还比较顺利,业务总体反馈也都比较好。但是当时这个项目没有任何后端体系,比如营销后台、运营后台、供应链等,就是业务团队去买一堆货,自己往上面放,这种模式完全不可控,不具备扩展性。

  • 后台系统

回到上面提到的问题:还有谁可能进场,却仍在观望?

11月20日,我们打通了饿了么当时原有的供应链系统。到今年3月5日,对接饿了么新零售地网供应链系统,采购仓储物流这些都打通了。CRM、预售、拼团、鲜食等都是今年上半年我们做的一些拓展尝试,下一步也会做智能货柜。

  1. CRM系统
    PUSH精准化,根据用户消费过的货架和实体店数据,当有对应货架/实体店上新/好物推荐时,进行PUSH。
  2. 供应链系统
    用户呼声,用户反馈给选品团队,更想要什么,选品团队站在父爱逻辑角度上,给出更优选择,告诉用户需要什么。

从饿了么到滴滴,再到近一些的共享单车(ofo)、共享充电宝(小电),每个风口,金沙江都在早期就参与了。只是无人零售到现在,金沙江仍然缺席。

三、成熟技术体系中如何快速创新?

至此,笔者就已经分析完了猩便利这家新零售公司,相信未来猩便利会围绕即得性深耕细作,带给用户更好的购物体验。

此外,天图资本这家以投资消费品牌著称的机构,还没有出手,此前投资了江小白、八马茶业等消费品牌以及小红书、百果园等线上线下零售企业;类似的还有君联资本,也没有出手。

我们说一下成熟体系和创业公司的区别是什么。

亟需新血的战略投资者

图片 10

尽管消费升级的大浪已经猛烈扑来,尽管中国零售行业在部分指标上已经超越美国,但二级市场上的零售企业,却并未受到持久的追捧。

饿了么拥有一个大型、成熟、弹性、多活的技术体系。日订单量千万级别,整个技术团队上千人,系统指标要求很高,所以基础设施必须完善,不可能靠人力天天操作;架构设计有严格的评审机制和一套规范的操作流程。2017年饿了么做了一个行业比较牛的“异地多活”,在两个机房之间可以调度流量,并做日常演练。最后就是容器化、混合云、计算力外卖等,这些关键词大家可以网搜一些文章了解一下。面对这样的体系,我们刚才说的无人货架这种短平快小项目如何应对?

百联在与阿里联姻的短暂狂欢后,并没有实质性的转型动作,甚至在今年中报中出现了营收、净利同比双双下滑;其他综合商超的成绩单也不那么好看。反例则是近年在新零售、生鲜、跨境电商等领域频频发力的永辉,在2016全年实现了净利同比超100%的增长。

分析一下其中优劣:

如何为传统零售输入新鲜血液,不只是马云在说,众多零售企业已经在积极探索。

  • 首先要求一定是快,而且需求可能变。今天这么玩,明天一拍脑袋那么玩,即敏捷迭代,快速试错,灵活响应。你不能跟他说你能不能有点谱,因为大家都不知道该怎么玩。那优势在于饿了么有非常完善的机制,高水平人才充足,比如我们想成立一个团队,拉起来很容易。业务立项会分到某一个技术团队,前后端测试、项目管理等的磨合过程中,团队配合度已经很好。不必从0到1建设一个新的产品技术团队。
  • 但是劣势就是我们有太多条条框框,由于饿了么体系很大,架构规范严格,不可能自己再做一套用户体系,不可能自己做支付,一定得对接公司的。那就得跨团队沟通。做这样一个试水的创新项目,跟公司整体项目的级别一定是不匹配的。有时就是需要去刷脸,才能把这些提上去。
  • 最后,如果我们今天数据出了一个bug,想把数据修一下,不行。按照严格的操作流程,这个事情不能你去操作;而且要进行评估:风险有多大,一次要多少条,会不会对性能有影响。这个时候可能业务团队已经忍不了,所以其实是优势劣势并存的。

亿欧:无人零售领域战略投资者

我们要把这个事情做成的话应该怎么办?首先得有一支能打的团队:召之即来、来之能战、战之必胜。我们搞的是一个独立的项目,全新的系统,但是所有参与项目的人,都是从各个团队拉过来的。团队都坐在一起,在“小黑屋”里,环境相对来说封闭,能更专心,更高效,更团结一心。以创业的状态进行,把所有的任务都排好然后开始开发,最后所有的任务都是完成状态。

这些战略投资者大部分都拥有成熟的供应链、较强的产品研发能力和相对充足的资金储备,缺的是在现有体系外实现转身、寻找增长点的机会。对于传统零售企业来说,在自身的体系内进行孵化,成功的可能性不大,引进拥有互联网基因的成熟团队,为他们提供产品、供应链和资金支持,是比较可行的方法。

上帝用七天创造了世界,我们最终用六天把这个项目做好了。期间有什么事情?除了刚才讲的攒人,还有对架构的取舍。

此外,大型商超的存量市场格局基本稳定,它们的危机在于,电商之后,市场又受到便利店的不断侵蚀。在碎片化的、不断贴近消费者的新兴场景中,如果再次失掉先机,对它们的打击将是巨大的。

图片 11

所以可以看出,这些战略投资者的主要标的也以新型、无人便利店为主。一是因为它们需要体量足够大的增量市场,同时有可能改善现有的成本结构,无人货架显然不足以支撑;二是它们有足够的资源来做支撑,也不寻求短期内的高额回报。

  • 微服务:虽说一开始没有那么多要拆分的微服务,但是毕竟是互联网主流架构,要把系统做得特别灵活,为了能拓展。但也不需要考虑那么远,所以有考虑,以后再说;
  • 技术栈:饿了么现成的拿过来用,大家都熟,再选择其他技术栈是不太可能的;
  • 自有的IDC:很多创业公司都是在阿里云上做起来的,我们当时也考虑说是不是干脆找个阿里云。阿里云都在自己手里头,想怎么玩怎么玩,不用关心公司的条条框框。但是最后想了一下,还是要用自己的系统。因为比如你要跟公司的用户系统、公司的用户系统、支付系统打通,你不能说我外挂一下,除非自己做。不能自己再做一套基础的体系,成本太高了。跟很多创业公司不同,他们往往数据库只有一个,反正用户数据少,能活着就行,但我们在一个体系里面,这些技术是现成的,我们要用;
  • 异地多活:有没有必要呢?有必要,但是暂时可以绕过。因为我们一般切换服务的时候是在晚上,是有人在办公室甚至熬夜到两三点钟会用无人货架,但是毕竟不是常态。我们先不考虑多活,因为实现多活更复杂;
  • 中间件:一定是公司现成的,包括数据库的中间件,数据的备份等;
  • 测试环境:也是公司现成的,同上;
  • 持续部署:需要知道谁发了什么版本,而且要有工具想回滚就能回滚;
  • 容器化:暂不考虑,我们直接来台虚拟机当成裸机来用也OK,容器化有更高的技术复杂度,我们现在只要做一个简单的业务跑起来;
  • 日志监控:日志监控这个体系是公司现成的,对当前的业务有很大帮助。当时我办公室的电视上接了个监控视图,有天早上一看,业务量爆增,我说这一定有问题,查了一下发现有人在爬我们的数据,这种情况如果没有监控,你根本就不知道。

BATJ?

四、敏捷迭代中的技术债如何偿还?

在现有的互联网几大阵营中,只有阿里在比较积极的引导、布局新零售包括无人零售。阿里已经跟上了亚马逊的脚步,打造出了自己的无人零售样板“淘咖啡”;还有“新零售第一业态”盛名的盒马;生鲜电商巨头、占据了天猫超市等诸多入口的易果。然而在无人零售领域,阿里至今没有投出第一笔外部投资。但是在有盒马的先例下,阿里出手只是迟早的事情。

同样的我们欠了很多债,下面分析一下:

京东延续一贯的作风,在靠近核心业务的事情上都亲力亲为。近日有消息,称京东的无人便利店已经在一个神秘的围挡里加紧建造了。

  • 业务层:包括一开始只是设置价格就进行销售,没有做营销、促销,运营的策略等。比如说在不同架子的相同的位置上摆不同的货,这些都是后来做的,一开始没有考虑,都是放上去就OK。供应链,业务级的监控,权限(运营、业务操作等这些权限),一开始也没有做那么多,是后来补上的;
  • 应用层:反爬、埋点、缓存、搜索、多活等这些也是这样。多活,刚才说了,影响不大但是是有影响的;
  • 数据层:我们一开始对用户的行为数据没有埋点收集(比如,他进来浏览了多少东西然后跳出了,或者他点了什么是不是失败的),当时没有考虑那么多。但毕竟有个基础的东西在,比如最后一个爬虫,我们做好了也可以爬别人,看看其他公司的怎么样;
  • 系统层:容器化暂时不用。

腾讯一直以来,也都对外宣称自己的投资逻辑是拿小股份、战略合作为主,而且几乎全部是在接近C轮时才入局,短期内布局无人零售的可能性不大。

对于现在这个架构,我们做的取舍其实是一种选择,以最快满足业务上线,具备基本功能为目标,而不是一拍板就定了。

百度刚刚痛定思痛,也不可能这么快打脸。但是,百度一向引以为豪的AI技术和大数据能力。在无人零售中会不会有出色的发挥?

五、技术怎么与创新业务齐头并进?

BATJ都处在观望阶段,倒是阿里阵营中的苏宁有了更为实际的行动,开出苏宁体育无人店“Biu”,也是唯一一家在日用百货范畴之外的新零售样本。不过要说对外投资,苏宁大概率也是跟随阿里的节奏,在后期择机进入。

再往下延伸,要考虑几个问题:

综合上述三类投资者,无人零售投资形成了以VC机构为主力、传统零售企业为补充、阿里为风口导向者的局面。并且根据投资者已投项目的特点,基本形成了以规模导向、技术导向和第三方服务商为主的三种玩家。这不仅是创业者及其团队强项的体现,也一定程度上体现了投资者的偏好,并且是在不久后的洗牌阶段,决定谁能活下去的护城河所在。

  • 调整策略,从突击队到正规军:现在我们已经有上万的点位,已经有稳定的业务,那后面如果想怎么着就怎么着,想怎么变就怎么变,想怎么玩就怎么玩,想怎么抓数据就抓数据,这个一定是有风险的。一开始,从0到1搞起来,这个阶段有点损失没关系。但是一旦业务、技术、运营都是稳定团队的话,就需要转换你的战略。不再用突击,要用正规军的方法;
  • 控制节奏,提高协同效率:我们会调整我们项目的结构,提高协同的效率,大家提前做沟通,做一些规划;
  • 合理分配资源,偿还技术债;
  • 架构规划,模块拆分;
  • 沉淀数据,智能运营:把这些数据收集起来,一个业务没准两三年以后能有更大的市场,那这些数据沉下来就是有价值的。比如前两天饿了么就在准备重启一个去年被停掉的项目,那个项目之前运行了大概两年,一旦老板决定重启,我们所有的代码、数据都还在,可以随时使用。不过要想重启,可能最大的问题是人,就是原来那些人去做其他项目了,有多少人还留在这个团队都不好说。但数据代码的资产都还在,很快就能拉起来;
  • 做减法,保持架构健康度:之前做这么多需求,业务团队有这么多想法,现在都还有用吗?不见得。很可能一个东西上来之后发现用户不买账,但它还是系统的一部分,依然天天运行着,还要考虑他的运维等,这时候做减法更能保持架构的健康度。

六、总结

所以总结一下:在风口创新里面,快一定是第一位,天下武功唯快不破。既然技术要去支持业务,那绝对不能拖后腿;但从0到1并不需要想那么多,以MVP为第一目标,不追求技术先进、架构完美。

还有,既然我们是一个比较成熟的体系,而且相对来说更有经验,那么我们要适度地前瞻一些。把产品、把架构设计得稍微好一点、灵活一点,将来拓展就不用改太多,不用推翻了就要重来,然后针对不同阶段、不同策略,适时做一些调整。

最后,技术上,先支持业务,深入理解业务,再驱动业务。一开始业务人员让你干什么你就干什么。接下来你还要深入理解,然后才能和业务的同学平等对话。如果业务是比较轻量级,2C的,这种情况下大家要互相沟通。如果你已经做的量级非常大,可能从业务、从运营的角度来讲,难以了解全国情况,比如我们做的O2O,基于地理位置不同,各地都不太一样。全国各地业务什么特点这都不好说,需要有一个强大的体系把数据收集起来,去做数据分析,去做策略指导业务,而不是靠一个人即兴的想法。所以我们要做到更好,就需要更多的数据,根据这些数据来分析用户,可以去看我们业务的趋势,能做一些更好的指导,接下来可能成为用技术驱动业务。不是说用人员驱动业务,而是一套比较大的系统,这个系统能够驱动业务,把公司业务能力固化在体系里。

最近一个在政府单位工作的同学和我聊起创新,创新很重要,但更重要的是有没有一个合理的体系,换句话说就是不能指望某个人力挽狂澜,不是一个有志之士想激发创新,就能创新。要靠一个公司或者一个组织,要有活力,要能保证多样性,要能够实时变化,这需要一套体系。所以在座的各位手里都有那么多数据,希望我们可以给后面的人留存更多的资产,能给我们后面的业务给予指导和帮助。

Q & A

Q1:快速迭代的时候,你的时间有限,像这种时间控制里面有什么东西?

A1:没有更多的选择,但是一旦你迭代的节奏调整过来,每个迭代多少大家都是有数的,而且一个比较好的团队有这个优势,开发一定要自测。

Q2:货架的数据是从哪些维度进行收集?

A2:比如登录网站,或者打开一个APP,你是在什么样的环境下(4G、3G、WiFi还是其他的),还有比如你使用什么样的手机、登录进来之后你先点了什么,这些都是可以记录的。最常见的,如果你前面的页面做得不那么友好,可能用户找不到他想要的东西,因为手机屏幕很小,需要翻页,那么怎么翻是合理的?一定是按照货架上的顺序吗?不见得。一开始大家都在乎货架上的顺序,从上到下第一层、第二层、第三层、第四层,但是我可能上来就想拿最底层的。或者说如果有促销,那把促销的东西放在最上面,让人看到,给他引导。这些东西可以通过你的布局操作,但前提是有数据,你才能进行设计,不然你不知道他是不是按照你预想的来做。返回搜狐,查看更多

责任编辑:

本文由财神彩票注册登录发布于财神彩票app最新版下载,转载请注明出处:微博推荐架构的演进,谁在投无人零售