书名:数据思维:从数据分析到商业价值
作者:王汉生
格式:MOBI
出版:中国人民大学出版社
出版日期:9月 2017
大小:19.83MB
语言:中文
生存回归起源于医学领域,例如分析癌症病人的存活概率。近年来,生存回归分析被广泛应用于诸如市场营销、人力资源等管理学领域。例如,它可以帮助企业人力资源部门分析员工的离职情况,在客户关系管理中分析影响客户流失的因素等。
生存数据的最大特点就是截断,即在某个观测期内,有的个体可以观测到确切的“死亡”时间,而有的个体则观测不到(观测期末仍然存活)。在管理学领域,很多有趣的问题适合采用生存回归分析。本案例就以某超市在售的全品类洗发水数据为例,研究新产品在架时长的影响因素。
数据来源和说明
超市中货架产品的摆放是一门学问。超市的货架空间有限,对于新上架的产品,其在架时长会受到哪些因素的影响?合理安排每种产品的在架时长不仅可以有效利用货架空间,而且可以极大地促进超市的整体销售。
本案例所用数据来自国内某大型连锁超市所有在售的洗发水数据,共记录了从2010年7月到2013年12月29295条观测。所要研究的是新产品的在架时长,那么如何定义新产品呢?为此可以人为地将2010年7—9月三个月作为新产品识别期,这三个月在售的洗发水并不是我们的研究对象,所以可以看到,根据本案例的研究问题,观测时间段并不是从2010年7月开始,而是从2010年10月开始。当数据清理成适合做生存分析的结构后,接下来我们整理了应用于回归分析的若干自变量,具体变量说明如表3-22所示。