设为首页收藏本站

JMP数据分析论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 1343|回复: 1

构建飓风仪表板,解读飓风背后的故事!

[复制链接]
发表于 2018-9-17 09:22:02 | 显示全部楼层 |阅读模式
今年9月,飓风频袭美国。先是号称佛州史上最强大的飓风“艾尔玛”袭击佛罗里达州。近日,另一飓风“佛罗伦斯”强势登陆美国南、北卡罗莱纳州。北卡罗莱纳州,也即是JMP的总部所在地。我们在希望美国人民做好安全防范措施的同时,也想看看如何借助于JMP软件的仪表板功能,进一步了解飓风背后的故事。

本文作者:Dan Schikore,JMP Principal Software Developer,原文发表在JMP全球用户论坛 https://community.jmp.com/t5/JMP ... shboards/ba-p/44467, 感兴趣的朋友也可以直接查看英文原文。

很多朋友都知道,JMP的样本数据库里包含一份NOAA(National Oceanic and Atmospheric Administration)提供的飓风跟踪数据。结合最近的暴风雨天气,我认为从数据源中提取最近几年的气候数据进行分析会很有意思。

IBTrACS(International Best Track Archive for Climate Stewardship )数据库包含了全世界近几年来的暴风雨跟踪数据。在这里,我们选用1851年至2016年间北大西洋盆地的数据进行分析。

在接下来的分析探索中,你或许会提出这样的问题:

  • 五级飓风与低级飓风在正常情况下是否具有相关性?
  • 历史记录中最猛烈的飓风是哪一次?
  • 每一次飓风的强度是如何随时间变化而变化的?
  • 从地理位置的角度,飓风是怎样形成的?


当涉及到基于数据的多种问题时,我们常常会使用JMP的多个平台和图形去解释问题。常常会出现这种情况:前一个图形所得出的结论会成为下一个问题所需要的变量信息。这种工作模式或流程借助JMP的仪表板整合多个平台输出以及使用过滤器引导探索,效果非常理想。

数据提取和准备

下载数据后的第一件事就是处理数据。原始数据包含了每6小时间隔内的暴风雨的经度、纬度和风速。根据辛普森飓风量级表(Saffir-Simpson scale)、热带风暴和热带低压的次级分类,我编写了一个脚本来循环行并添加飓风分类。

首先,我想看看暴风雨的能级。 根据NOAA的信息资料,我发现暴风雨能级由空气密度、阻力系数和风速决定。要想更精确地计算风力,除了可获得的信息汇总外,我们仍需要大量资料。所以,为了简化模型,我整合了风速来计算每一次观察状态时的能级和每次暴风雨的累积能量。

在NOAA的网站上我发现了一个有趣的信息:虽然来自暴风雨的能量很大,但通过形成云和雨释放的总能量可以高出400倍!

最终,我为每个飓风轨道创建了持续时间和累积持续时间列。这标准化了日期/时间信息,这样每次的暴风雨数据都可追溯且可以互相对比。


创建图表和图形

现在数据准备完毕,我要开始创建图形和图表探索数据了!

Class的分布很好地汇总了达到每个级别的暴风雨的观测总数。我本可以在这里使用这个汇总结果,但我想使用该分布来选择达到指定分类的暴风雨,我想通过其筛选与这些暴风雨相关的所有数据行。


需要注意的是,我定制化了标题,并且移除部分隐藏的表格以方便后续分析的需要。将多个报表组合在一起时,这通常很有用,因为它可以作为组合仪表板中使用报表的指南,并消除无关的细节。

接下来,我们一起看下如何通过计算出的风速能量来得出不同暴风雨的差异。

使用JMP图形生成器,根据暴风雨总能量的顺序绘制条形图。通过调整Y轴,展现前17个暴风雨信息,但是通过滚动坐标轴可以看到其余所有暴风雨的信息。能量最大的暴风雨信息在图形的底部,主要是便于后续的筛选信息。



根据这两个图形,我挑选出两个子集开展进一步的分析。对于选出的子集,我会重新进行绘图以突显出更多的细节信息。其中一个有趣的图形展现了暴风雨期间的累积能量。这个图展现出来暴风雨整个过程中的状况——暴风雨持续了多久,何时增强何时减弱。

下图显示,观测的暴风雨持续时间超过32天,并且在加速和减弱的速度方面有各种各样的特征。


最后一张气泡图从地理位置上显示了暴风雨随时间的位置和强度。在此情况下,我以气泡大小表示风速大小。我也可以使用能量指标来显示暴风雨的加强。不管那种情况,请注意,气泡大小并不是为了显示暴风雨的程度。气泡的颜色由飓风的类别决定,以加强对于飓风移动过程中风力的研究。



构建飓风仪表板

虽然以上的任一报告都可以用于数据分析,但我们通常结合多种报表输出以研究整个信息流程。在JMP中构建一个仪表板可将程序固化为可重复使用的模板。

在这个案例中,我想结合“分布”平台和“图形生成器”以形成一个最终的报告。

为了实现这个效果,需通过如下操作步骤。新建一个仪表板:打开菜单文件 > 新建> 仪表板 ,选择“分层过滤器+ 1 仪表板”。这个模板有三个预设的报告位置:一个主过滤器、一个次过滤器和一个最终报告。


下一步是将报告放到预设的位置上。你可以点击某一报告,再点击报告需要放置的位置;或者直接通过拖拽报告即可放置。

这个案例中有四个报告,但仪表板模板中只有三个放置报告的位置。所以,我把“分布”作为主过滤器,“图形生成器”为次过滤器,“气泡图”为最终报告,如下图所示。



最后,我把剩下的那个报告拖放到工作区并且选择一个下拉菜单。此外,拖放区域也可以设置成横向布局,纵向布局或选项卡式的布局。


以这个模板作为基础,你还可以通过拖动报告和选择下拉区域来创建多种形式的布局。在这个案例中,我将累积能量汇总的报告放在气泡图的上方 。

在仪表板生成器中,报告以缩略图的方式呈现。通过鼠标点击的交互式操作可轻松调整仪表板的布局。点击红色三角菜单中的预览模式可以检查仪表板的最终形式。预览模式也可以用于定制每个独立图形的独立尺寸。

最终,你可以将仪表板保存为以下两种格式:

  • jmpappsource – 打开此文件可以转到仪表板生成器并可进一步编辑;
  • jmpapp – 打开此文件可以运行仪表板。

你也可以点击“仪表板生成器”旁边红色三角菜单下的“保存脚本”——“至插件”。

当分享这个JMP插件给其他JMP用户后,打开插件,仪表板就将以主菜单项的形式呈现。千万不要小看这个步骤!对于那些需要频繁使用、具有相同形式的表格和JSL脚本的朋友来说,这个功能非常实用。

此外,你还可以将仪表板保存至数据表中,仍然是选择“仪表板生成器”旁边红色三角菜单下的“保存脚本”——“至数据表”就可以轻松搞定。

运行仪表板时,原始视图包含了所有飓风的轨迹。通过选择主过滤器中的第5类(Category 5),视图会相应地刷新显示与之匹配的飓风轨迹。在能量图中选择部分柱形图,数据过滤器将显示被选中的部分,这样可以突出累计能量曲线和气泡图的对比。

在下图中,我选择了第4类和第5类飓风(Category 4 and 5)。后续选中的Ivan_3 and Karl_3可以用于对比2004年同期形成的两次飓风。




在这个案例中,我用JMP脚本语言(JSL)对部分表格进行了初始处理。但图形布局和筛选都是通过用仪表板生成器以图形的形式生成的。

仪表板生成器是应用程序生成器的子集。所以对于那些爱好脚本的朋友来说,还可以自己创建一个类似的仪表板布局,切换到应用模式通过脚本增加更多高级特性。

最后,作者也附上了此次分析的数据表供大家参考。通过这样的分析,我们就能够观察到飓风的历史数据规律。


其中,飓风Irma保持了185mph 的最高风速长达37小时,并且在第5等级中持续了3天零3小时的时长,可见其威力巨大。飓风无情,防范至上,希望这次“佛罗伦斯”飓风对美国东海岸的影响不要太大。

其实在大多数的数据分析项目中,使用多个报告进行数据探索和分析是非常行之有效的。希望这个案例能够激发你的灵感并运用到其他案例分析中,将需要筛选的数据、需要分析及可视化展现的数据分析很好地结合起来。

关注JMP官方微信公众号,了解更多统计分析干货知识、JMP实用小技巧、JMP最新活动:


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

发表于 2018-9-22 18:18:55 | 显示全部楼层
数据似乎没有附上。。。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|JMP数据分析论坛 ( 沪ICP备13022603号-2 )  

GMT+8, 2024-3-29 23:26 , Processed in 0.391986 second(s), 17 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表