38 Pandas+Pyecharts | 奥迪汽车销量数据分析可视化
- 可视化系列
- 5天前
- 912热度
- 1评论
大家好,我是欧K~
本期将利用Python分析某平台「奥迪销售数据」,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。
传统德系三大豪门”BBA”中的A就是指奥迪(audi)常见的奥迪汽车型号分为:
- A系:A系是奥迪的民用轿车版本,奥迪的大部分车型都是A系,如A4,A6,A8等,车身更轻便小巧,适合城市通勤。
- S系,是A系列上的运动版本,搭载高性能发动机和运动套件,目前大部分A系车都有S版本比如S3,S8等。
- Q系:Q系是奥迪的SUV车型,常见车型有Q5,Q7等。Q系列作为SUV则有更好的视野和更好的底盘。
涉及到的库:
- Pandas — 数据处理
- Pyecharts — 数据可视化
1. 导入模块
import jieba
import pandas as pd
from pyecharts.charts import Line
from pyecharts.charts import Bar
from pyecharts.charts import Pie
from pyecharts.charts import Scatter
from pyecharts.charts import WordCloud
from pyecharts.charts import Radar
import pyecharts.options as opts
from pyecharts.commons.utils import JsCode
2. Pandas数据处理
2.1 读取数据
df = pd.read_csv('奥迪汽车数据.csv')

2.2 数据信息
df.info()

2.3 数据处理
df1 = df.copy()
df1 = df1[~df1['百公里油耗'].str.contains('百公里电耗')]
df_tmp = df1['行驶里程'].str.split('km',expand=True)
df1['行驶里程'] = df_tmp[0]
df1['行驶里程'] = df1['行驶里程'].astype('int')
df_tmp = df1['百公里油耗'].str.split('L百公里油耗',expand=True)
df1['百公里油耗'] = df_tmp[0]
df1['百公里油耗'] = df1['百公里油耗'].astype('float')

3. Pyecharts数据可视化
3.1 奥迪用户购车时间分布
def get_line():
l1 = (
Line()
.add_xaxis(x_data)
.add_yaxis("", y_data)
.set_global_opts(
title_opts=opts.TitleOpts(
title='1-奥迪用户购车时间分布',
pos_top='1%',
pos_left="center",
title_textstyle_opts=opts.TextStyleOpts(color='#00838F',font_size=25),
),
)
)
return l1

- 购车时间在2014-2016年这三年之间处于一个顶峰的位置,2020年也迎来了一波小高潮。
- 近两年随着国产车的崛起,购买奥迪的用户出现持续走低现象。
3.2 奥迪各系销量占比饼图
def get_pie():
p1 = (
Pie()
.add("",
[list(z) for z in zip(x_data, y_data)]
)
.set_global_opts(
title_opts=opts.TitleOpts(
title='2-奥迪各系销量占比',
pos_top='5%',
pos_left="center",
title_textstyle_opts=opts.TextStyleOpts(color='#00838F',font_size=25),
),
)
)
return p1

奥迪A系销量超过了全系的2/3,S系销量占比在1%左右。
3.3 奥迪各系销量占比

3.4 奥迪全系销量占比

从全系销量来看:奥迪A6和奥迪A4的销量几乎占据了半壁江山。
3.5 奥迪全系销量及裸车价格
def get_bar():
bar = (
Bar()
.add_xaxis(x_data)
.add_yaxis("销量",y_data1)
.set_global_opts(
title_opts=opts.TitleOpts(
title='5-奥迪全系销量及裸车价格',
pos_top='1%',
pos_left="center",
title_textstyle_opts=opts.TextStyleOpts(color='#00838F',font_size=25),
),
)
)
return bar

全系裸车价格基本在20-80万之间。
3.6 奥迪百公里油耗分布

百公里油耗基本在6L-13L之间
3.7 各项指标平均评分雷达图
def get_radar():
radar = (
Radar(init_opts=opts.InitOpts(width='1000px', height='600px',bg_color='#CFD8DC')chema(
schema=schemas,
splitarea_opt=opts.SplitAreaOpts(
is_show=True, areastyle_opts=opts.AreaStyleOpts(opacity=1)
),
textstyle_opts=opts.TextStyleOpts(color="#263238"),
)
.add(
series_name="",
data=[datas],
linestyle_opts=opts.LineStyleOpts(color="#CD0000"),
)
.set_global_opts(
title_opts=opts.TitleOpts(
title='7-各项指标平均评分雷达图',
pos_top='1%',
pos_left="center",
title_textstyle_opts=opts.TextStyleOpts(color='#00838F',font_size=25),
),
)
)
return radar

从空间评分、驾驶感受、油耗评分、外观评分、内饰评分、性价比评分、配置评分等几个维度的雷达图来看,整体评分都在4.0以上,还是比较高的。
3.8 优评词云

3.9 差评词云

从优评和差评词云分布来看,大多数用户比较关心以下几个方面的体验:外观、动力、空间、内饰、油耗、座椅