设为首页收藏本站

JMP数据分析论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 1120|回复: 0
打印 上一主题 下一主题

大数据终极应用:看大数据如何成就美国总统《转》

[复制链接]
跳转到指定楼层
楼主
发表于 2015-1-20 20:46:15 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
通过大数据分析,奥巴马团队制定了相应的策略,并赢得了大量草根阶层选民的支持和捐赠,一项民调显示, 80% 的美国选民认为奥巴马比罗姆尼让他们感觉更加重视自己。结果是,奥巴马团队筹得的第一个 1 亿美金中, 98% 来自于小于 250 美金的小额捐款,而罗姆尼团队在筹得相同数额捐款的情况下,这一比例仅为 31%。          让这一切“微观智能”成为可能的,是数据。正如竞选总指挥吉姆·梅西纳(Jim Messina)所说,在整个竞选活中,没有数据做支撑的假设很少存在。奥巴马团队运用数据挖掘技术在美国政坛政坛上取得的胜利,告诉了我们一个不争的事实:今天,我们已然进入了一个“微竞争”的时代,在激烈的市场竞争中,谁能够深入的了解他的每一个用户的个性化需求,谁就能在竞争中击败对手,获取胜利。
          事实上,许多国际商业巨头早已悄悄的实践着“微竞争”:深入了解他们的每一个用户,并为他们提供个性化服务。他们在市场上获得巨大成功的原由,与今天出现在世界各大媒体的美国总统奥巴马获选同出一辙:数据挖掘。
          了解用户要什么,你才能知道如何让他们打开钱包
          为了筹到 10 亿美金的竞选款,奥巴马的数据挖掘团队在过去两年搜集、存储和分析了大量数据。今年春天晚些时候,他们注意到,影星乔治·克鲁尼(George Clooney)对美国西海岸 40 岁至 49 岁的女性具有非常大的吸引力:她们无疑是最有可能为了在好莱坞与克鲁尼和奥巴马共进晚餐而不惜自掏腰包的一个群体。克鲁尼在自家豪宅举办的筹款宴会上,为奥巴马筹集到数百万美元的竞选资金。
          之后,当奥巴马团队决定在东海岸物色一位对于这个女性群体具有相同号召力的影星时,数据团队发现莎拉·杰西卡·帕克 (Sarah Jessica Parker,《欲望都市》的女主角)的粉丝们也同样喜欢竞赛、小型宴会和名人,于是,一个与奥巴马共进晚餐的“竞争”便诞生了,那就是争夺在杰西卡·帕克的纽约 West Village 豪宅美餐的机会。“克鲁尼效应”被成功的复制到了东海岸。
          通过对粉丝们的信息分析,奥巴马团队成功的满足了她们与钟爱的明星共进晚餐的愿望,也成功的让她们争先的打开钱包。同样,聪明的商家通过用户的购买历史记录分析来建立模型,为他们量身预测未来的购物清单,进而设计促销活动和个性服务,让他们源源不断的为之买单。
          了解用户的行为,你可以花最少的钱办最大的事
          在整个的竞选中,奥巴马团队的广告费用花了不到 3 亿美金,而罗姆尼团队则花了近 4 亿美金却落败,这是因为奥巴马的数据团队对于广告购买的决策,是经过缜密的数据分析之后才制定的。一名官员表示:“我们可以通过复杂的建模来找到目标选民。例如,如果迈阿密戴德郡的 35 岁以下女性是我们的目标,那么这里有如何覆盖她们的方式。”因此,奥巴马竞选团队在一些非传统节目中购买了广告,例如 4 月 23 日的电视剧《混乱之子》、《行尸走肉》和《23 号公寓的坏女孩》。芝加哥总部称,在电视平台上,2012 年的广告购买效率较 2008 年提升了 14%。
          而在商业上,以数据分析为支撑的决策,也让商家获得了不少好处,Tesco 就是一个例子。作为全球利润第二大的零售商(仅次于沃尔玛),这家英国超级市场巨人从用户行为分析中获得了巨大的利益。从其会员卡的用户购买记录中,Tesco 可以了解一个用户是什么“类别”的客人,如速食者、单身、有上学孩子的家庭等等。这样的分类可以帮助 Tesco 设计个性化的服务,比如,通过邮件或信件寄给用户的促销可以变得十分个性化,店内的上架商品及促销也可以根据周围人群的喜好、消费的时段来更加有针对性,从而提高货品的流通。这样的做法为 Tesco 获得了丰厚的回报,仅在市场宣传一项,就能帮助 Tesco 每年节省 3.5 亿英镑的费用。
            与用户进行个性化互动,赢得更多青睐
           在本次竞选中,奥巴马团队的投票动员绝不是千篇一律的,对于不同的用户,他们动员的渠道及采取的互动方式都因人而异。今年 8 月,奥巴马决定在社交新闻网站 Reddit 上回答问题,当时多名总统高级助理并不清楚此事。一名官员表示:“我们为何将奥巴马放在 Reddit 上?因为我们发现很大一部分目标选民在 Reddit 上。”而在“摇摆州”的电话动员上,他们也发现,一个摇摆州志愿者打来的电话的效果要优于一个从非摇摆州(如加州)志愿者打来的电话。
          此外,奥巴马团队还首次利用 Facebook 进行大规模的投票动员,这模仿了现场组织者挨家挨户敲门的方式。在竞选活动的最后几周,下载某一款应用的用户收到了多条消息,其中包含他们在“摇摆州”好友的照片。他们被告知,可以通过点击按钮,呼吁这些目标选民采取行动,例如进行投票注册、更早地投票,以及参与到投票中。奥巴马竞选团队发现,大约 1/5 收到 Facebook 请求的选民做出了响应,这在很大程度上是因为请求来自他们熟悉的人。
          在零售业上,巨头沃尔玛也同样的重视与它的用户进行个性化互动。去年底,沃尔玛在 Facebook 上发布了一个名叫 ShoppyCat 的应用,这个应用的功能是帮助用户解除为朋友挑选生日礼物的烦恼。当用户将 ShoppyCat 加入她 / 他的 Facebook 中时,应用程序将访问这个用户所有朋友的信息,如用户信息、行为、状态、Likes、关系圈等等,通过对这些信息的分析挖掘,为每一个朋友的生日都推荐相应的礼物。
          今天,许多企业的领导者或许都已经或多或少的看到了数据挖掘能够带来的价值;然而,在实践的应用当中,却只有极少数的企业朝向“数据掘金”工程迈开步伐。的确,数据挖掘技术给人们带来了一定的挑战,甚至有一些神秘:那些复杂的算法和代码实现,确实不像那些重视用户体验的 Apps 一样无需学习成本。而在实践过程中,90% 的数据挖掘技术和数学模型都并不神秘,甚至在很大程度上,都需要大量重复性的工作;但是,只有当这些技术和模型与每一个具体的业务实践相结合时,才能发挥它们的智慧。
          因此,任何数据挖掘工作的执行,都需要做好三方面的准备:
          首先,收集和整理数据是一个枯燥冗长的过程。奥巴马数据团队在竞选前两年就开始收集大量的信息,而他们做的第一件事情就是将民主党所有各自独立零散的选民数据库汇总在一起。同样,当企业的数据分散在各地的服务器、各种文件、各种数据库中时,将这些数据进行有效的集中存储和格式清理是根基;
       
          其次,做到“精准”是一个与业务定制的过程,没有“一键安装式”的灵丹妙药。机器学习是数据挖掘中常用的方法,它的基本原理是让计算机从历史数据中“学习”其中的规律,并利用该规律对未来数据进行预测,这个过程也就是建模和预测的过程。因此,当用户数据因业务而异时,每一组数据中都会有自己独特的数据模型,这也就是与实际业务相定制的过程。比如,奥巴马的数据团队就会对每一个群体的选民都进行建模,进而预测他们的捐款行为方式(通过网络捐款,还是会汇款)。

          另外,模型需要根据实际情况进行动态调整。用户因环境、喜好或其他因素常常会导致其行为规律发生一定的变化,使得其产生的数据也随之变化,这些变化将会影响模型的精准性,因而,我们需要随时动态的去调整模型。在奥巴马竞选的案例中,我们看到,在关键的“摇摆州”俄亥俄州,数据分析团队获得了约 2.9 万人的投票倾向数据。这是一个包含 1% 选民的巨大样本,使他们可以准确了解每一类人群和每一个地区选民在任何时刻的态度。当第一次电视辩论结束后,选民的投票倾向发生改变。而数据分析团队可以立即知道什么样的选民改变了态度,什么样的选民仍坚持原来的投票选择。
               
分享到:  !connect_viewthread_share_to_qq!!connect_viewthread_share_to_qq! QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 支持支持 反对反对
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|JMP数据分析论坛 ( 沪ICP备13022603号-2 )  

GMT+8, 2024-5-6 14:25 , Processed in 0.363995 second(s), 16 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表