【数据可视化】第三章——数据可视化综合实践
创始人
2024-02-15 19:43:26
0

Matplotlib作业数据.csv文件查看百度网盘:链接:https://pan.baidu.com/s/1oFB_KwhiJNlJAgXg7RaYuw?pwd=abcd
提取码:abcd

1.作业描述

作业:根据Matplotlib作业数据.csv做出4种不同类型的组合图像

要求:根据情况适当添加信息,如:标题,坐标轴信息,图例信息,特殊值标注等。

可参考制作内容包括并不限于:
评分最高的20部电影的投票人数分布(柱状图,条形图)
不同国家2012-2016年发行电影数量(折线图,簇状柱形图)
不同类型电影2012-2016年发行数量(簇状柱形图)
不同类型电影所占比值(饼图)
电影时长分布分析(直方图)
电影时长,豆瓣评分与投票人数的相关关系(气泡图)


2.参考代码:

import numpy as np
import matplotlib.pyplot as plt
import matplotlib
import pandas as pd
import seaborn as sbnmatplotlib.rcParams['font.family'] = 'SIMHEI'
matplotlib.rcParams['font.size'] = 18

提示:如果报错,请检查包是否下载完成,在python环境中输入:
pip install xxx

df = pd.read_csv(r"E:/Matplotlib作业数据.csv",encoding="gbk",index_col="名字").dropna()
# 评分最高的20部电影的投票人数分布(柱状图,条形图)
df1 = df.sort_values(by="评分",ascending=False)
df2 = df1.iloc[0:20,:]
# 不同国家2012-2016年发行电影数量
df3 = df["产地"].value_counts()
# 不同类型电影2012-2016年发行数量(簇状柱形图)
df4 = df["类型"].value_counts()
# 计算相关系数
df5 = df[["时长","评分","投票人数"]].corr()
plt.figure(figsize = (25,35),dpi = 150)plt.subplot2grid(shape=(3,3),loc=(0,0),colspan=3)
# 第一个图 评分最高的20部电影的投票人数分布(柱状图,条形图)
a = [s[:5] for s in df2.index] 
b = df2["投票人数"]
plt.barh(a, width =b,height = 0.5,color = 'orange',edgecolor = 'silver',linewidth = 3)
plt.yticks(a,fontsize = 12)
plt.grid(True)
plt.title('评分最高的20部电影的投票人数分布',fontweight="bold") #图标题
plt.ylabel('电影名称')
plt.xlabel('人数')plt.subplot2grid((3,3),(1,0),colspan=2)
# 第二个图 不同国家2012-2016年发行电影数量 折线图
a = df3.index
b = df3.to_list()
plt.plot(a,b,color = 'g', linestyle = '-.',linewidth = 3,marker = 'h', markerfacecolor = 'c', markersize = 15)
bm = np.argmax(b)
plt.text(a[bm],b[bm],'最大值', fontproperties = 'Kaiti', fontsize = 15)
plt.xticks(a,rotation = 45)
plt.title('不同国家2012-2016年发行电影数量',fontweight="bold") #图标题
plt.xlabel('国家')
plt.ylabel('电影数量')
plt.grid(True)plt.subplot2grid((3,3),(1,2),rowspan=2)
# 第三个图
# 不同电影时长分布
a = df["时长"]
d = 20
num_bins = np.ceil((np.ptp(a))/d).astype(np.int64)
b = np.arange(min(a),max(a)+d,d)
plt.hist(a,num_bins,range = (min(a),min(a)+d*num_bins),density = False,color="coral")
plt.xticks(b)
plt.grid()
plt.xlabel("分钟")
plt.ylabel("数量")
plt.title("不同电影时长分布",fontweight="bold")plt.subplot2grid((3,3),(2,0),colspan=1)
sbn.heatmap(df5,cmap='GnBu',annot=True,linewidths=0.3, linecolor='gray')
plt.title("相关关系热力图",fontweight="bold")plt.subplot2grid((3,3),(2,1),colspan=1)
# 第五个图
sizes = df4.to_list() #设置每部分大小
labels = df4.index
explode = [0.05,0,0,0,0,0,0,0,0,0,0] #设置每部分凹凸
# colors = ['c','g','b','m']
colors = matplotlib.cm.rainbow(np.arange(len(sizes))/len(sizes))
plt.pie(sizes,labels = labels,explode = explode,colors = colors,labeldistance = 1,autopct = '%.1f%%',counterclock = False,startangle = 170,shadow = False)plt.title('不同类型电影所占比值',fontweight="bold");#设置标题

最终效果如图:
在这里插入图片描述

相关内容

热门资讯

山东诸城偷排危废致4死案一名主... 山东潍坊诸城市舜王街道一厂房深夜偷排危废,产生硫化氢等大量有毒气体,导致4人死亡、3人重伤以及32人...
男子称在邯郸一超市购买的猪肉检... 近日,河北省邯郸市丛台区一消费者王先生反映,其在阳光超市龙湖店购买的猪肉,食用时感觉有异样。随后,他...
市场监管总局:今年首次以法律形... 市场监管总局副局长柳军23日在专题发布会上介绍,2025年,全国食品安全形势总体平稳。市场监管总局坚...
关于健全对刑事案件犯罪嫌疑人、... “两高一部”发布《关于健全对刑事案件犯罪嫌疑人、被告人身份审查工作机制的意见》 为准确、及时查明案件...
完善幼儿园收费政策 三部门发通... 中新网12月23日电 据国家发展和改革委员会网站消息,23日,国家发展改革委、教育部、财政部发布关于...
男子4年强奸继女六七十次,被判... 日前,河北省石家庄市栾城区人民法院在中国裁判文书网公开了一份刑事判决书,男子刘冬(化名)在4年间竟六...
合肥一烤肉店回应宠物狗上桌吃饭... 12月22日,安徽合肥一家烤肉店有宠物狗上桌吃饭,餐桌上的餐盘里放有食物,宠物狗在不断啃食生肉。 2...
中国人民银行关于实施一次性信用... 中国人民银行上海总部,各省、自治区、直辖市及计划单列市分行,征信中心;国家开发银行,各政策性银行、国...
徐杰20分萨林杰32+11 广... 【搜狐体育战报】北京时间12月23日CBA常规赛第5轮,客场作战的广东东阳光以93-85击败广州朗肽...
完善幼儿园收费政策,三部门发通... 今天(12月23日),国家发展改革委、教育部、财政部发布关于完善幼儿园收费政策的通知,全文如下: 各...