R绘图案例|基于分面的面积图
创始人
2024-03-16 14:03:33
0

简介

最近参加一个统计建模的比赛。模型建模后,需要展示不同模型的性能指标,数据如下所示:

其中,第 1 列是不同样本,共376条。第 2-4 列是随机森林得到的结果,第 5-7 列是XGBoost的结果。一共使用了三种评价指标(分类数据:准确率,召回率和 F1 得分)。

对于这样的数据,读者会使用这么的方式进行可视化?欢迎文末留言交流~

小编当时想到的是,使用面积图展示,最终图形如下:

结论:从图中可以看出,两种集成算法对于 376 个叶类分类结果的评估指标都比较接近于 1,说明这两种方法整体效果比较满意。 但是对于 XGBoost 来说,小于 1 的部分更多,说明某些叶类分类效果差的情况更多。

注意:如果不是这个方向,可能看的不大懂。但是没关系,学会绘制,并将其用到自己的领域即可。在公众号后台回复[建模比赛案例图形]即可免费获取。

接下来,将展示整个绘制过程。

加载数据

library(readxl)   # 加载 Excel 数据集
library(ggplot2)  # 绘制图形
library(tidyverse) 
library(cowplot)  # 合并图形
library(viridis)  # 图形配色
library(showtext) # 解决中文字体显示问题
showtext_auto()

使用 readxl 包中的 read_excel() 加载 sheet=1 的数据集。并修改数据列名预览如下:

dat = read_excel("test.xlsx",sheet=1,na="NA")
colnames(dat) = c("Id",paste("X",1:6,sep=''))
head(dat)

使用 Tidyverse 包中的 pivot_longer() 将宽表转化为长表,具体教程可见:《R语言教程》。此时得到 ggplot2 所需的数据类型。

注意:小编这里将不同评价指标单独绘制,最后进行合并。

dat %>% select(c(Id,X1,X4)) %>% rename("随机森林"=X1, "XGBoost"=X4) %>% pivot_longer(cols = c("随机森林","XGBoost"),names_to = "method",names_transform = list(method = as.character),values_to = "Acc") -> dat1

绘制单个评价指标结果

先绘制准确率的图形,使用的几何对象为:geom_area(),并利用 facet_wrap() 对方法(method)进行分面。之后,对主题以进行修改。使用自定义的颜色修改配色。

cols <- c("#85BA8F", "#A3C8DC","#349839","#EA5D2D","#EABB77","#F09594")
p1 = ggplot(dat1) + geom_area(aes(Id,Acc),fill = cols[1]) + facet_wrap(vars(method),nrow = 2,strip.position = "top") +theme_bw() + ylab("精确率") + xlab("叶类") + #主题设置theme(panel.grid = element_blank()) 
p1

同理,绘制其他两种指标体系的结果。这里就不放出来了,完整代码见公众号,回复【建模比赛案例图形】即可免费获取,或者文末。

合并图形

最后使用 cowplot 包中的 plot_grid() 将三个指标图形进行合并

plot_grid(p1,p2,p3,ncol = 3)

完整代码

# install.packages("readxl")
library(readxl)
library(ggplot2)
library(tidyverse)
library(cowplot)
library(viridis)
library(showtext)
showtext_auto()### 绘制不同方法的区域图===========
dat = read_excel("test.xlsx",sheet=1,na="NA")
colnames(dat) = c("Id",paste("X",1:6,sep=''))
head(dat)dat %>% select(c(Id,X1,X4)) %>% rename("随机森林"=X1, "XGBoost"=X4) %>% pivot_longer(cols = c("随机森林","XGBoost"),names_to = "method",names_transform = list(method = as.character),values_to = "Acc") -> dat1
head(dat1)
cols <- c("#85BA8F", "#A3C8DC","#349839","#EA5D2D","#EABB77","#F09594")#==
p1 = ggplot(dat1) + geom_area(aes(Id,Acc),fill = cols[1]) + facet_wrap(vars(method),nrow = 2,strip.position = "top") +theme_bw() + ylab("精确率") + xlab("叶类") + #主题设置theme(panel.grid = element_blank()) 
p1#==
dat %>% select(c(Id,X2,X5)) %>% rename("随机森林"=X2, "XGBoost"=X5) %>% pivot_longer(cols = c("随机森林","XGBoost"),names_to = "method",names_transform = list(method = as.character),values_to = "Acc") -> dat2p2 = ggplot(dat2) + geom_area(aes(Id,Acc),fill = cols[2]) + facet_wrap(vars(method),nrow = 2,strip.position = "top") +theme_bw() + ylab("召回率") + xlab("叶类") + #主题设置theme(panel.grid = element_blank())
p2#==
dat %>% select(c(Id,X3,X6)) %>% rename("随机森林"=X3, "XGBoost"=X6) %>% pivot_longer(cols = c("随机森林","XGBoost"),names_to = "method",# names_transform = list(method = as.factor),values_to = "Acc") -> dat3p3 = ggplot(dat3) + geom_area(aes(Id,Acc),fill = cols[4]) + facet_wrap(vars(method),nrow = 2,strip.position = "top") +theme_bw() + ylab("F1得分") + xlab("叶类") + #主题设置theme(panel.grid = element_blank())
p3
#== 合并图形
plot_grid(p1,p2,p3,ncol = 3)

相关内容

热门资讯

关于海南育儿补贴制度实施热点问... 户籍刚迁入海南的婴幼儿是否能享受育儿补贴;如何快速了解补贴申领流程……12月25日,海南省新闻办公室...
宋朝的中介制度 走进《清明上河图》中汴河两岸喧嚷的市集,除了林立的店铺与往来的舟车,还有一种身影穿梭其间——他们并非...
《西安市地下水条例》《西安历史... 央广网西安12月26日消息(记者侯凯奇)12月25日,西安市人大常委会召开新闻发布会,正式公布《西安...
三部门发文完善幼儿园收费政策 ... 近年来,人民群众对适龄儿童“上得起”“上好园”的诉求越来越强烈,幼儿园收费政策需要与时俱进。近日,为...
下一阶段货币政策如何发力?央行... 中国网财经12月26日讯 近日中国人民银行货币政策委员会召开2025年第四季度例会,分析国内外经济金...
跨省盗杀家犬 涉嫌犯罪终落网 山西晚报·山河+讯(记者 辛戈)套牌的汽车、70余支已经装填或待用的毒针、50余颗用剧毒物质自制的药...
政策宣传面对面 就业服务进社区 本报讯(记者 史治国 通讯员 张冬梅)“实实在在的就业创业政策、周边最新的招聘信息,有需要的都看过来...
300元就能看光员工的微信聊天... 据每日经济新闻报道,一款面向公司用户、单套价格或不足300元的监控软件正在被公开售卖。 记者深入调查...
罕见!深交所凌晨发函,剑指向日... 向日葵(300111)又摊上事儿了!12月26日凌晨,深交所对向日葵下发关注函。 2025年9月2...
阅读中的风景与旅途中的阅读:《... 2025年12月,《全民阅读促进条例》(以下简称《条例》)正式颁布,定于2026年2月1日起施行。这...