设为首页收藏本站

JMP数据分析论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 2244|回复: 10

用JMP文本分析器创作诗词,三步秒变诗词达人!

  [复制链接]
发表于 2017-4-27 14:12:17 | 显示全部楼层 |阅读模式
诗文传家远,书香满中华。近日,一档全新的诗词综艺节目《诗书中华》亮相东方卫视。这是继春节期间引爆大江南北、好评如潮的《中国诗词大会》之后,荧屏上又一次文化综艺节目的惊喜亮相。


同时,4月23日的世界读书日,你的朋友圈,是否分分钟为沦陷为:今天,你读书了吗?是不是有一种买两本唐诗宋词来充电的冲动?且慢,你知道中国的古诗词有多少吗?你能坚持背诵诗词多久?你理解诗词背后的奇闻趣事吗?行,就算你用尽洪荒之力做到了,那百人团里的哪个选手不是早已学富五车、才高八斗的?随便和其中某个人PK,你有几成胜算?


别误会,这不是泼冷水的,只是想提醒你:想成为诗词达人,并不是只有华山一条路的。现在,国家鼓励“万众创新”,继承祖国传统文化也可以如此呀。比如说,我们可以另辟蹊径地创作诗词,实现弯道超车!

创作诗词,是不是觉得仅仅是说笑?不,我们是认真的!三国时期的曹植七步就能成诗,在二十一世纪的今天,高科技都可以武装到牙齿了,我们还有什么理由不会写诗?时代不同了,现在三步就能成诗了!不相信?听我和你一一道来。

第一步 海纳百川
首先,要“聚日月之精华,集天地之灵气”,我们要去引经据典地收集楚辞、诗经、乐府民歌、唐诗、南北朝民歌、宋词、元曲,乃至毛泽东诗词等(明清小说暂不考虑)所有经典古诗词的电子版文档。好在现在已经是互联网时代了,搜索引擎无所不知、无所不能,所以,我们不必天天去泡图书馆,坐在电脑前敲敲打打键盘也可以完成这一壮举。


第二步 浪里淘沙
就像从海底开采出来的石油需要经过加工形成汽油,才能用于汽车行驶一样的道理,我们也要从茫茫无际的诗海词洋中提炼出最有价值的关键词,才能写诗。这个活叫“文本挖掘”,以前想都不敢想,但现在在个人计算机上就可以实现。下面这张表就是通过文本挖掘技术精挑细选出来的100个中国古诗词中出现频率最高的词汇。有了这个宝典,离诗词创作就只有一步之遥了!



第三步 点石成金
使用上面那个宝典的方法很简单,就跟密码的编码和解码一样。首先确定一组包含一到两位数的数组,接着根据其中的每个数找到对应的词,再把这些词连起来,一切就搞定了!

说干就干,我们先找来一个经典的数字——圆周率π= 3.14159265358979……,依次取它的前六个数(一到两位数):“3”、“14”、“15”、“92”、“65”、“35”,它们分别对应的是“东风”、“回首”、“明月”、“悠悠”、“一曲”、“故人”,把它们连起来一看,一句优美的古诗词诞生了:
东风回首明月,  
悠悠一曲故人。

没想到吧?圆周率中还蕴含着这样一个秘密!还不过瘾?那就再来一次。这回换个玩法,我们用计算机随机技术产生六个1~100之间的随机整数:“83”、“95”、“40”、“59”、“19”、“48”。

它们分别对应的是“流水”、“相逢”、“ 不知”、“ 芙蓉”、“ 为谁”、“ 寂寞”。连连看,结果是:
流水相逢不知,
芙蓉为谁寂寞。

是不是觉得另有一番味道?还想玩?自己动手吧,用你的手机号、身份证号都可以,保证可以让你分分钟创作出彰显个性标签的诗词来。

怎么样,你离诗词达人是不是只有三步之遥?回忆一下刚才的写诗过程,从技术上讲,你觉得难点在哪里?显然,练成第一步,必须要有郭靖的勤奋;练成第三步,只需要一点黄蓉的灵气就可以了;练成第二步,要求最高,需要两者兼而有之,而这就要靠文本挖掘来帮忙了。

文本挖掘真的很难吗?是,也不是。因为工欲善其事,必先利其器!只要找到了称手的工具,再难的事也不是个事!不妨先试试JMP软件13版新推出的“文本分析器(Text Explorer)”吧,一定会让你有新的收获!

免费下载JMP 30天试用版:https://www.jmp.com/zh_cn/software/try-jmp.html?utm_campaign=td&utm_source=jmpforum&utm_medium=social

或关注JMP官方微信公众号,了解更多




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

发表于 2017-4-27 15:51:06 | 显示全部楼层
JMP可以产生机器“诗人”了?
回复 支持 反对

使用道具 举报

发表于 2017-4-27 20:07:55 | 显示全部楼层
有点难度 要学习
回复 支持 反对

使用道具 举报

发表于 2017-4-28 07:26:54 | 显示全部楼层
有点意思,但这种功能实际应用领域主要是什么?
回复 支持 反对

使用道具 举报

 楼主| 发表于 2017-4-28 10:33:15 | 显示全部楼层
黄羊山客 发表于 2017-4-28 07:26
有点意思,但这种功能实际应用领域主要是什么?

应用领域可以有很多,如:客户满意度调查,产品返修记录分析,医院临床诊断汇总,等等。
回复 支持 反对

使用道具 举报

发表于 2017-4-28 14:40:10 | 显示全部楼层
能否举一个具体的例子说明用途?
回复 支持 反对

使用道具 举报

 楼主| 发表于 2017-4-28 16:12:14 | 显示全部楼层
黄羊山客 发表于 2017-4-28 14:40
能否举一个具体的例子说明用途?

这个我们可以内部讨论下,能否专门写一篇文章来做应用案例的专门介绍。谢谢提议!
回复 支持 反对

使用道具 举报

发表于 2017-4-28 16:42:02 | 显示全部楼层
谢谢楼主,非常期待看到这方面的例子。
回复 支持 反对

使用道具 举报

发表于 2017-5-1 16:55:16 | 显示全部楼层
这个帖子的原始数据有没有?  平时工作中都没有机会接触文本分析
特别是比较纠结 如何做到 第二步 让利淘沙的原始数据   
我想自己练习一下  
回复 支持 反对

使用道具 举报

 楼主| 发表于 2017-5-2 09:56:48 | 显示全部楼层
wangtian4625 发表于 2017-5-1 16:55
这个帖子的原始数据有没有?  平时工作中都没有机会接触文本分析
特别是比较纠结 如何做到 第二步 让利淘 ...

抱歉,原始数据因为涉及到其他公司的知识产权,所以无法公开分享。建议你可以模拟数据来测试练习。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|JMP数据分析论坛 ( 沪ICP备13022603号-2 )  

GMT+8, 2024-4-18 22:25 , Processed in 0.438629 second(s), 20 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表