引言
在当今社会,薪资水平一直是人们关注的焦点。了解不同行业的薪资情况,有助于我们更好地规划职业生涯和做出职业选择。数据可视化作为一种直观、高效的信息传达方式,能够帮助我们轻松掌握薪资真相。本文将通过对各行各业时薪的数据可视化分析,揭示薪资的秘密。
一、数据来源与处理
1. 数据来源
本文所使用的数据来源于国家统计局、各大招聘网站以及行业报告等公开渠道。为确保数据的准确性,我们对原始数据进行筛选和整理,剔除异常值和重复数据。
2. 数据处理
为了便于分析,我们将数据按照行业类别进行分类,并对时薪进行统计和计算。以下是部分行业分类:
- 制造业
- 服务业
- 金融业
- 教育业
- 医疗卫生
- 信息技术
- 媒体传播
- 建筑业
- 交通运输
- 零售业
二、数据可视化展示
1. 行业时薪分布图
通过柱状图展示各行业时薪的分布情况,直观地反映出不同行业的薪资水平。
import matplotlib.pyplot as plt
# 模拟数据
industry = ['制造业', '服务业', '金融业', '教育业', '医疗卫生', '信息技术', '媒体传播', '建筑业', '交通运输', '零售业']
hourly_wage = [20, 15, 30, 25, 35, 40, 22, 18, 28, 17]
plt.figure(figsize=(10, 6))
plt.bar(industry, hourly_wage, color='skyblue')
plt.xlabel('行业')
plt.ylabel('时薪')
plt.title('行业时薪分布图')
plt.show()
2. 行业时薪对比图
通过折线图对比不同行业时薪的变化趋势,帮助我们了解行业薪资水平的动态变化。
import matplotlib.pyplot as plt
# 模拟数据
industry = ['制造业', '服务业', '金融业', '教育业', '医疗卫生', '信息技术', '媒体传播', '建筑业', '交通运输', '零售业']
hourly_wage = [20, 15, 30, 25, 35, 40, 22, 18, 28, 17]
year = [2018, 2019, 2020, 2021, 2022]
plt.figure(figsize=(10, 6))
for i in range(len(industry)):
plt.plot(year, hourly_wage[i], marker='o', label=industry[i])
plt.xlabel('年份')
plt.ylabel('时薪')
plt.title('行业时薪对比图')
plt.legend()
plt.show()
3. 地域时薪分布图
通过地图展示不同地区各行业的时薪水平,帮助我们了解地域差异对薪资的影响。
import matplotlib.pyplot as plt
import geopandas as gpd
# 加载地图数据
gdf = gpd.read_file('path/to/your/map_data.shp')
# 模拟数据
data = {
'province': ['北京', '上海', '广东', '浙江', '江苏'],
'hourly_wage': [30, 28, 26, 24, 22]
}
df = pd.DataFrame(data)
gdf = gdf.merge(df, on='province')
# 绘制地图
fig, ax = plt.subplots(1, 1, figsize=(10, 6))
gdf.plot(column='hourly_wage', ax=ax, legend=True, legend_kwds={'label': "时薪", 'orientation': "horizontal"})
plt.show()
三、结论
通过对各行各业时薪的数据可视化分析,我们可以得出以下结论:
- 金融业、信息技术等行业的时薪普遍较高,而服务业、零售业等行业的时薪相对较低。
- 随着时间的推移,部分行业的时薪呈现上升趋势,如医疗卫生、信息技术等。
- 地域差异对薪资水平有一定影响,一线城市和发达地区的薪资水平普遍高于其他地区。
了解各行业的薪资水平,有助于我们更好地规划职业生涯,提高自身竞争力。同时,数据可视化作为一种强大的工具,能够帮助我们更直观地了解薪资真相。
