漏斗分析的含义:
分析师定义一个业务路径,路径上各个步骤的完成人数会逐渐递减,呈漏斗状
漏斗分析的结果表设计:
中间汇总表:
主要作用:
记录每个漏斗模型的每个步骤上完成的人数,以便给分析师快速查询报表
计算逻辑:
主要思想:利用正则表达式来判断用户的行为事件序列的模式是否匹配漏斗模型定义中的要求
步骤:
1.先将用户的事件序列,按照漏斗模型定义的条件进行过滤,留下满足条件的事件
2.将同一个人的满足条件的事件ID收集到数据,按时间先后排序,拼接成字符串
3.将拼接好的字符串,匹配漏斗模型抽象出来的正则表达式
1,"e3,e1,e4,e1,e3,e4,e5,e1"
.*?(e1).*? =>1
.*?(e1).*?(e2).*? =>2
.*?(e1).*?(e2).*?(e3).*? =>3
.*?(e1).*?(e2).*?(e3).*?(e4).*? =>4
hive的正则表达式
1.RLIKE,判断字符串是否满足指定的正则模式
select ”e1,e1,e3,e1,e3,e4,e5,e2“ rlike “.*?e1.*?e3.*?e4.*?e5.*?” ;
2.regexp_extract,从字符串中提取正则模式所框定的部分
select regexp_extract('ab8cce6ff','\\w+(\\d+)\\w+(\\d+)\\w+',2);
3.regexp_replace,正则替换,把字符串中匹配正则模式的部分,替换成指定的值
select regexp_replace('ab8cce6ff','\\d+','xxx');