import pandas as pd
df = pd.read_excel('data/user_traffic.xls')
df.head()
流量来源 | 来源明细 | 访客数 | 支付转化率 | 客单价 | |
---|---|---|---|---|---|
0 | 一级 | -A | 35188 | 0.0998 | 54.30 |
1 | 一级 | -B | 28467 | 0.1127 | 99.93 |
2 | 一级 | -C | 13747 | 0.0254 | 0.08 |
3 | 一级 | -D | 5183 | 0.0247 | 37.15 |
4 | 一级 | -E | 4361 | 0.0431 | 91.73 |
df.info()
<class 'pandas.core.frame.DataFrame'> RangeIndex: 22 entries, 0 to 21 Data columns (total 5 columns): 流量来源 22 non-null object 来源明细 22 non-null object 访客数 22 non-null int64 支付转化率 22 non-null float64 客单价 19 non-null float64 dtypes: float64(2), int64(1), object(2) memory usage: 960.0+ bytes
df.iloc[:13].head()
流量来源 | 来源明细 | 访客数 | 支付转化率 | 客单价 | |
---|---|---|---|---|---|
0 | 一级 | -A | 35188 | 0.0998 | 54.30 |
1 | 一级 | -B | 28467 | 0.1127 | 99.93 |
2 | 一级 | -C | 13747 | 0.0254 | 0.08 |
3 | 一级 | -D | 5183 | 0.0247 | 37.15 |
4 | 一级 | -E | 4361 | 0.0431 | 91.73 |
df.iloc[:,[0,4]].head()
流量来源 | 客单价 | |
---|---|---|
0 | 一级 | 54.30 |
1 | 一级 | 99.93 |
2 | 一级 | 0.08 |
3 | 一级 | 37.15 |
4 | 一级 | 91.73 |
df.iloc[13:18,0:4]
流量来源 | 来源明细 | 访客数 | 支付转化率 | |
---|---|---|---|---|
13 | 二级 | -A | 39048 | 0.1160 |
14 | 二级 | -B | 3316 | 0.0709 |
15 | 二级 | -C | 2043 | 0.0504 |
16 | 三级 | -A | 23140 | 0.0969 |
17 | 三级 | -B | 14813 | 0.2014 |
df[df['流量来源'] == '一级'].head()
流量来源 | 来源明细 | 访客数 | 支付转化率 | 客单价 | |
---|---|---|---|---|---|
0 | 一级 | -A | 35188 | 0.0998 | 54.30 |
1 | 一级 | -B | 28467 | 0.1127 | 99.93 |
2 | 一级 | -C | 13747 | 0.0254 | 0.08 |
3 | 一级 | -D | 5183 | 0.0247 | 37.15 |
4 | 一级 | -E | 4361 | 0.0431 | 91.73 |
df.loc[:,['流量来源','客单价']].head()
流量来源 | 客单价 | |
---|---|---|
0 | 一级 | 54.30 |
1 | 一级 | 99.93 |
2 | 一级 | 0.08 |
3 | 一级 | 37.15 |
4 | 一级 | 91.73 |
df.loc[df['流量来源'].isin(['二级','三级']),
['流量来源','来源明细','访客数','支付转化率']
]
流量来源 | 来源明细 | 访客数 | 支付转化率 | |
---|---|---|---|---|
13 | 二级 | -A | 39048 | 0.1160 |
14 | 二级 | -B | 3316 | 0.0709 |
15 | 二级 | -C | 2043 | 0.0504 |
16 | 三级 | -A | 23140 | 0.0969 |
17 | 三级 | -B | 14813 | 0.2014 |
print('访客数均值:',df['访客数'].mean())
print('转化率均值:',df['支付转化率'].mean())
print('客单价均值:',df['客单价'].mean())
访客数均值: 8498.0 转化率均值: 0.07547727272727273 客单价均值: 72.86
df[df['访客数'] > df['访客数'].mean()]
流量来源 | 来源明细 | 访客数 | 支付转化率 | 客单价 | |
---|---|---|---|---|---|
0 | 一级 | -A | 35188 | 0.0998 | 54.30 |
1 | 一级 | -B | 28467 | 0.1127 | 99.93 |
2 | 一级 | -C | 13747 | 0.0254 | 0.08 |
13 | 二级 | -A | 39048 | 0.1160 | 91.91 |
16 | 三级 | -A | 23140 | 0.0969 | 83.75 |
17 | 三级 | -B | 14813 | 0.2014 | 82.97 |
df.loc[(df['访客数'] > df['访客数'].mean()) &
(df['支付转化率'] > df['支付转化率'].mean()) &
(df['客单价'] > df['客单价'].mean())]
流量来源 | 来源明细 | 访客数 | 支付转化率 | 客单价 | |
---|---|---|---|---|---|
1 | 一级 | -B | 28467 | 0.1127 | 99.93 |
13 | 二级 | -A | 39048 | 0.1160 | 91.91 |
16 | 三级 | -A | 23140 | 0.0969 | 83.75 |
17 | 三级 | -B | 14813 | 0.2014 | 82.97 |