PAGE 1 PAGE 1 大数据构建京东智慧物流系统 青龙系统从2012年研发版本1.0,到目前的6.0的演进过程中,我们也逐步熟悉到,以大数据处理为核心是构建智慧物流的关键。 2015年,在国务院提出“互联网+”行动战略之后,以“互联网+物流”的智慧物流概念也被不断提及,但是,由于物流系统本身的复杂性和业务差异性,毕竟怎么样打造智慧物流系统,鲜有落地的方案。 许多人对京东物流的高效印象非常深刻,使用者真实的体验受到广阔用户的认可,但是,在这些体验背后隐蔽着昂扬的经营成本。青龙系统作为支撑京东物流的核心系统,在这样的一个过程中,也渐渐为外界瞩目,日处理数百万订单,大促销期间上千万单,数十万操作人员在这个物流网络中服务,智慧化物流系统成为迫切需求。 青龙系统从2012年研发版本1.0,到目前的6.0的演进过程中,我们也逐步熟悉到,以大数据处理为核心是构建智慧物流的关键。 “大数据”的经典定义是可以归纳为4个V:海量的数据规模(volume)、快速的数据流转和动态的数据体系(velocity)、多样的数据类型(variety)和巨大的数据价值(value)。从青龙系统看,每天处理亿级数据,具有海量信息的数据规模;支持快速的数据流转,实现了物流各个节点实时数据监控优化;系统处理各种各样的信息,包含了结构化和非结构化数据;数据具有极大的价值,推动系统成本和效率优化1%,能节约上亿成本,具有了显著的大数据特征。 如何从大数据到智慧系统 我们在实战中熟悉到,把大数据转化为智慧系统,需要具备两个基础: 首先是业务数据化,并且具有数据质量保障。京东物流在青龙系统的支撑下,实现了全部物流操作的线上化,也就是数据化,并且,对每个操作环节都是能够直接进行实时分析,这就奠定了很好的基础。假如业务都是线下操作,或者系统无法精确准时收集数据,那么,即时数据量够大,缺乏关键数据和数据不精确,也会给大数据处理带来非常大的困难。 第二基础就是大数据处理技术,包括收集,传输,存储,计算,展示等一系列技术。青龙系统在数据处理技术上也踩过许多坑,最早我们用数据库生产库做一些数据的分析,发觉很快性能就不行了,因为数据分析SQL一执行,生产库性能急剧下降,然后开始利用读库,并结合MQ,也就是操作数据库的时候,会发出一个MQ,数据分析处理系统接收MQ重新解析,但是,也不能很好处理问题。后面,我们总结发觉一点,作为传统的技术人员,我们是试图用OLTP的方法来解决OLAP的问题,这在方向上就有一定的问题。 上面的图是我们的总结,当你做一个大数据应用,首先要分清你自己的应用场景。至少有两个维度:一个是实时性的维度,你做大数据分析是秒级的还是离线小时以后拿到也没问题。另一个是全都性维度,你对全都性究竟是怎样的要求,要求是百分之百全都的,另外许多场景不要求全都,许多的消息推送不要求全都。 从这两个维度来看可以划分四个场景,强实时性强全都性、强实时性弱全都性、弱实时性强全都性、弱实时性弱全都性。究竟你的应用落在什么样的场景,你要分清晰。 你假如问你的运营团队和业务团队,他确定说要百分之百全都,确定要实时,不仅是分钟量级的,最好是秒级的,甚至比秒级还小,完全一样的。你可以告知他,要实现这个没问题,但你要实现这个对应的代价特别大,你用代价换取价值是不是足够。 其他的还有一个维度,就是数据量。你的数据究竟是怎样的量级,GB、TB,甚至是PB。从现在新系统发展来看,架构支撑业务两年发展已经足够了,要对两年内数据量有一个预估。 这几个维度确定以后,现在从ETL数据抽取到数据传输、数据存储,以及数据计算,技术相对来说还是比较成熟了,你可以再一次进行选择合适的技术。 下面是京东大数据平台的系统架构。 这个系统对于实时数据,离线数据,都有完整的解决方案,对于青龙系统来讲,可以基于公司大数据平台,进行对应的实时数据处理和离线数据分析。大数据平台技术栈许多,有些公司可能不会自己开发,但它特别重要,因为它可以从技术上供应基础数据质量保障。假如数据质量得不到保障的,那你后面做所进行的分析就是不靠谱的,数据平台本身数据质量就很差。 另外假如你对全都性要求很高,它可能10%的信息都丢失了,假如你对实时性要求很高,它可能延迟好几个小时,在这种状况下数据分析应用不可能做好。 在牢靠的数据源和处理技术基础上,就可以逐步构建智慧物流系统。 第一步主要是通过大数据技术精确准时还原业务。也就是我们可以准时精确采集业务运行的数据,并分不同层次需求展示出来。 上图是闻名的南丁格尔的玫瑰图,从这张图中可以清晰看到,因为卫生条件差、治疗和估计不足,导致的可治疗却死亡了的人数所占比重特别大,是因为受伤而死亡人数的几倍。 对于物流系统来讲也是一样,图形化展示,一图胜千言。在时间维度,实时展示实各个节点的生产量,相邻节点的差异,可以很好把控业务。我们还发觉,移动端的开发,对业务特别有帮助。 对于物流来讲,是商品流,实物流,资金流,信息流的结合,因此,地理维度展示也特别有帮助。青龙系统做到了车辆,配送员实时展示,例如在京东APP上就可以查看订单的实时轨迹。 第二步就是通过大数据提升业务。这块对于离线数据,大家都比较熟识,包括业务日报,周报,月报等,这都是业务管理的基础,假如不能做到准时精确,数字化运营是无法进行的,更不用说智慧化了。对于物流这种劳动密集型行业,我们利用实时数据,进行业界排行,对现场也起到很好的激励作用。 在对业务能够进行实时监控和精确评估后,就可以进行第三步,也就是利用大数据对业务进行预估。 预估一直是大数据应用的核心,也是最有价值的地方。对于物流行业,假如能够提前进行业务量预估,那么,对于资源调度等特别有意义,不仅能够实现更好的时效,而且能够避免铺张。举一个青龙系统的例子,就是单量预估,依据用户下单量,仓储生产能力,路由状况等,可以进行建模预估。 最终一步就是依托大数据进行智能决策。做到了这一步,才可以称作智慧物流。目前,做决策最好的方式依旧是人机结合,能够利用大数据和人工智能的技术,为人工供应辅助决策,让人工的决策更加合理。 我们也有一个实际案例,京东的用户,都有过配送员给大家送货的经历,配送员也就是从配送站取货送给客户。因为京东业务每年增长也特别快,就遇到如何增加配送站的问题。在以前没有系统辅助决策,就只能拍脑袋,但随着规模越来越大,发觉拍脑袋代价会很大,于是,我们就想用大数据的方法来解决一下如何建配送站的问题。 首先,建站依靠于什么?大家看过《大数据时代》的话就知道,利用大数据进行预估,特别重要的是找到它的关联物,建站最直观的是跟订单相关的,我们也从订单开始着手来分析这个问题。 我们从订单分布数据,加上我们的客户分布数据进行分析,通过订单聚合等技术手段,找到订单很密的点,这个过程有许多的模型可以供参考。然后,加入更多的数据,包括位置信息、当地租金成本、管理成本、从分拨中心到传站的距离等,我们就能输出一个模型分布,依据不同的维度,将建站预估展示给用户,辅助业务管理人员进行决策,并且,可以依据业务人员的使用状况,输入更多的业务学问,形成业务闭环,让系统更加智能化。 上面的图,是研发青龙系统的总结,分成了两个维度,一个是你做这个系统的难度,另一个是你做这个系统的价值。 首先,要选择应用场景,选择正真适合的大数据技术架构,把数据质量能够做好。然后,要对业务进行分析,第一步主要进行业务还原,包括业务节点,环比、同比,环节差异,最好用图形化的方式展示出来。 之后能够直接进行下一步,做业务评估,评估业务健康度,这也有许多的方法,犹如比,环比,和业界平均指标对标的方法。假如能通过大数据做到和友商实时对标,就能发觉自己的薄弱点,哪块是需要改进的,就能够直接进行优化,优化完,系统指标运行一下,可以看看是不是真的改进了。 利用灰度的方法,也可以对业务改进进行效果评估。大数据来讲最核心预估,作为一个业务负责人,假如能够提前知道业务状况,现场的管理就能处理的更好。再往上走就是业务决策系统,Google的AlphaGo就是一个典型例子,但是实际的业务可能更为复杂。 智慧物流,我们大家都认为就是以大数据处理技术作为基础,利用软件系统把人和设备更好的结合起来,让人和设备能够发挥各自的优势,达到系统最佳的状态,当然,这个是不断进化的过程。 当前,青龙系统已经具备初步智能化的特征,上面是我们2016年的规划,我们会持续进行软件系统优化,利用机器学习等智能化技术,另外,引入更多的智能硬件,不断将智能化深入,从而支持京物流更高效,为用户供应更好的体验。
1.2幼儿语言教育的目标、内容及方法(课件)-《幼儿语言教育活动设计与指导》同步教学(劳动版).pptx
2.2幼儿注意的培养(课件)-《幼儿心理学》同步教学(劳动版).pptx
第一单元第二课信息技术的综述 课件 2022—2023学年青岛版(2010)初中信息技术九年级下册.pptx
第6课 智慧社会 课件 2023—2024学年浙教版(2023)初中信息技术九年级全册.pptx
【cnzj5u】《幼儿园玩教具操作与活动指导》课件:第四章++第一节建构类玩教具配备.ppt
原创力文档创建于2008年,本站为文档C2C交易模式,即用户上传的文档直接分享给其他用户(可下载、阅读),本站只是中间服务平台,本站所有文档下载所得的收益归上传人所有。原创力文档是网络服务平台方,若您的权利被侵害,请发链接和相关诉求至 电线) ,上传者
新闻推荐
【2024-05-14】
【2024-05-14】
【2024-05-14】
【2024-05-14】
【2024-05-13】
【2024-05-13】
【2024-05-12】
【2024-05-01】
【2024-04-30】
【2024-04-30】
【2024-04-30】
【2024-04-29】