企加云基于英特尔至强可扩展平台和英特尔机器学习库的解决方案

针对零售行业的转型需求,企加云基于英特尔®至强®可扩展处理器以及其他技术,研发了企加云销量预测系统,实现多数据源的融合,同时,基于大数据与AI技术的更精准预测,降低业务人员对数据提取、处理、分析和预测的难度,提升业务分析和决策能力。

intel.jpg插图

你是否有过上方的体验?电商平台合事宜地给你推荐了一款你近期可能需要购买的商品。

是的,电商平台可以根据你的购买历史、浏览历史等信息准确定位到你可能需要购买的产品,让你花最短地时间、购最快的物。这就是新零售带来的数据化的改变。

如今,企加云基于英特尔® 至强® 可扩展平台和英特尔机器学习库的解决方案为新零售赋能。

背景

”新零售“出现的这一年以来实现了数据化,以前消费群体买商品,现在商品也开始“挑人”了。新零售的核心要义在于推动线上与线下的一体化进程,其关键在于使线上的互联网力量和线下的实体店终端形成真正意义上的合力,从而完成电商平台和实体零售店面在商业维度上的优化升级。随着新零售概念的逐步清晰化,以及零售产业链运转效率的加速,销量预测成为供应链中关键的一环,准确且及时响应的销量预测有利于降低库存压力、满足瞬息万变的市场需求,并提升消费者体验。因此,如何有效地组织和利用大量的历史订单数据,用户历史行为数据,外部环境数据以及内部其他数据,构建一个完整、高效的销量预测系统,为整体供应链起牵头作用,动态地实时地掌握销量趋势变化,成为推动新零售转型的重要因素。

销量预测并非大型企业的专利,对于寻求向新零售转型的企业来说,其内部的 ERP (Enterprise Resource Planning)、CRM (Customer Relationship Management)等信息化工具往往已经使用多年,积累了丰富的商品价格、销售流量、转化率、商品属性等多种类型的数据,而且由于内部机制更为灵活,可以更灵活的推行新的零售转型策略,这些都为开展精准销量预测打下了坚实的基础。

新零售销售预测面临的挑战

新零售,是企业以互联网为依托,通过运用大数据、人工智能等先进技术手段并运用心理学知识,对商品的生产、流通与销售过程进行升级改造,进而重塑业态结构与生态圈,并对线上服务、线下体验以及现代物流进行深度融合的零售新模式。利用线上的用户消费数据,我们可以搭建出如图1所示的预测与推荐模型,并可应用于商品推荐等诸多实际场景中,达到提升用户忠实度,提高商品销量的目的。然而,在搭建预测与推荐模型以获得更多商机的过程中,新零售业将面临以下挑战:

1111.jpg插图(1)
图1.预测与推荐模型

如何实现多数据源的融合

对于零售企业来说,其最重要的数据是历史的交易数据,但是交易数据中的波动却是受很多外部环境因素影响的,如:天气情况、节假日、突发事件、商品的热搜趋势等,忽略这些数据可能会导致销量预测与真实情况偏离。只有将这些多源数据进行融合,才能生成精准的数据洞察。

如何基于大数据与AI技术实现更加精准的预测

销量预测并不是一个新名词,但是在相当长的时期内,其更依赖的都是人员经验以及小样本集的分析,如历史的同比、环比销量,线上/线下门店的商品最近的几个月的销售数据进行预测,效果与真实情况往往会存在一定的偏差。在大数据、AI技术出现之后,零售企业可以构建更加智能的分析算法和模型库,从而提高预测能力和准确率。但同时,这也要求其对数据、预测算法、预测应用场景有着深刻理解,并建立相应的预测模型,技术门槛很高。

如何加速销售预测

销售预测模型的建立、优化、运行需要基于海量数据进行训练,这种计算密集型应用往往会对性能提出非常高的需求。如果要想快速生成准确的预测结果,用户需要从基础设施、算法、软件等多个角度,提升运行效率,在快速生成销量预测结果的同时,节约系统开销。

解决方案

基于在新零售领域的技术和业务方面的积淀,企加云打造了多数据源融合的销量预测系统。系统在硬件上基于英特尔® 至强® 可扩展处理器平台,在软件上,方案底层采取了英特尔的 Python环境,以及英特尔® MKL 与英特尔® DAAL,开发了多数据源融合处理模块、多方法的特征分析模块、多模型的集成预测与测试模块。业务人员无需关注底层系统与技术细节,就可以高效的构建销量预测模型,形成报表,为决策提供准确的数据依据。

2222.jpg插图(2)
图2. 解决方案架构图

其中,配备了英特尔® 至强® 可扩展处理器的服务器有助于在提供卓越性能、灵活性、可靠性和安全性的同时保持成本低廉。英特尔® 至强® 可扩展处理器以英特尔® QAT 技术、英特尔® 超线程技术、英特尔® Turbo Boost技术、英特尔® AES-NI,英特尔先进的 AVX-512 向量指令集等为基础,提供了高度并行的性能和本地内存带宽的高效利用。针对最新一代英特尔® 至强® 处理器优化过的机器学习工作负载可以比非优化代码执行得快得多,并且可以显著加快诸如训练吞吐量和训练时间等指标。

英特尔® MKL 可为最新一代英特尔® 处理器轻松优化代码,其高度优化、线程和矢量化的数学函数,可显著提升应用程序性能并缩短开发时间,且能够与主流的编译器、语言、操作系统及模型 兼容。英特尔® DAAL 则是一种高性能库,它提供了丰富的算法集,从面向数据集的最基本的描述统计,到更高级的数据挖掘和机器学习算法,可以帮助开发人员轻松地开发高度优化的大数据算法。该预测系统的框架及其中提供的算法如图3所示。

3333.jpg插图(3)
图3. 销售预测系统软件框架及算法变化

利用英特尔提升的性能效果

系统的计算执行效率显著提升

在销量预测模型的搭建过程中,对于目标硬件进行深度学习框架和模型的直接优化,提升执行效率至关重要。为了验证 3 个主要模块在使用英特尔解决方案后的数据处理效率,企加云进行了对比测试,对照组为利用原生 Python 环境 + Pandas 数据处理 库+ scikit-learn 机器学习库,测试配置如下表所示:

4444.jpg插图(4)
表1.测试平台系统配置对比

测试结果如图 4 所示,结果证明,英特尔提供的 Python 环境,多数学库及算法模型库帮助企加云销量预测系统实现了性能上的大幅提升,执行时间可以缩短超过 70% ,被证明可以提升整个机器学习项目过程中多个过程步骤的计算执行效率。

5555.jpg插图(5)
图4. 不同测试环境下的测试结果

注:随着更多测试的开展,性能指标评测结果可能会进行修改。结果取决于测试中使用的特定平台配置和工作负载,可能不适用于任何特定用户的组件、计算机系统或工作负载。结果不一定代表其他性能指标评测,其他性能指标评测结果可能或多或少地受到抑制的影响。性能结果基于截止到 2018 年 10 月 31 日的测试,可能未代表所有公布的安全更新。请查看配置声明了解详情。没有任何产品能保证绝对安全。

计算执行效率的大幅提升在很大程度上源于英特尔的 Python 环境、英特尔® MKL、英特尔® DAAL 针对英特尔® 处理器核心的加速优化处理,其为设计高效的机器学习系统奠定了坚实的基础,同时为更大数据量提供了分布式计算框架的支持,满足不同客户不同库存量单位(Stock Keeping Unit, SKU)的销量预测需求。

6666.jpg插图(6)
图5. 某企业数据处理和模型训练时间对比

注:随着更多测试的开展,性能指标评测结果可能会进行修改。结果取决于测试中使用的特定平台配置和工作负载,可能不适用于任何特定用户的组件、计算机系统或工作负载。结果不一定代表其他性能指标评测,其他性能指标评测结果可能或多或少地受到抑制的影响。性能结果基于截止到 2018 年 10 月 31 日的测试,可能未代表所有公布的安全更新。请查看配置声明了解详情。没有任何产品能保证绝对安全。

在某大型企业的智能销量预测实践中,基于英特尔机器学习库的企加云销量预测整体解决方案,被证明可以更便捷、高效地对大批量数据进行处理和模型训练,将训练时间(一组超参数情况下)从从一个多小时缩短到十多分钟,总处理时间从 90 多分钟减少到不到 40 分钟,使得人员能够较快地进行模型参数的调整和迭代优化,支撑更加准确的决策。

帮助零售企业提升销售预测的精准度

相较于传统的人工报表统计和有限的分析维度,企加云销量预测方案可以帮助用户构建端到端的销量预测应用。其将历史交易数据、外部环境影响因子等多源数据整合起来,并通过数据清洗、合并等方式来对数据进行初步处理,之后基于机器学习方法,从多维度构建端到端的分析与预测网页应用,从而方便了计划人员把握商品的销售趋势,对商品的数量变化精准预测,从而平衡产销存。

在客户的部署实践中,企加云销量预测系统成功把原来的各运营商的平均预测误差从 23% 降低 12% ,并将每个月的增量预测平均误差从 18% 降低至 10% ,从而实现了更加精准化、细致化的销量预测,为业务增长提供了强大的数据支撑能力。

结论

零售业的未来将更多的与AI算法、模型联系在一起,这有利于零售企业通过海量数据获得对业务精准的洞察力,做出更好的业务决策。企加云通过与英特尔进行合作,并利用英特尔机器学习库来大幅度改善数据处理与模型训练效率,帮助用户缩短端到端的处理时间,降低了系统压力,从而为更多企业的数字化转型赋能。

相关文章