• 业务咨询、市场合作:61619362
  • 公司邮箱:support@datatom.com
联系我们  | English

2020美国大选谁能当选?大数据给出预测结果

作者:德小拓     来源:站内原创     2020/10/19 10:15:02    

11月3日,美国将举行第59届总统选举,距离投票日仅剩3周,目前,共和党候选人现任美国总统特朗普与民主党候选人前美国副总统拜登的较量,也完全进入了白热化。

 

美国大选作为举世瞩目的重大政治事件,牵动着亿万人的心。自现任美国总统特朗普上任以来,迅速地推翻了奥巴马政府的数项政策,同时,拉动与各国之间的贸易战,退出各类国际组织,要求盟国分担防务经费等...推行了一系列以维护美国利益为核心的举措。

 

虽然特朗普的一系列受到了许多争议,但对于大部分美国民众来说,特朗普也确实兑现了在2016年竞选美国总统时的绝大部分竞选承诺。

 


而在当地时间10月2日凌晨,特朗普在社交媒体上表示自己和其夫人新冠病毒检测结果呈阳性,将马上进入隔离和康复程序。

 

他于2号入住美国沃尔特里德国家军事医疗中心,而仅仅三天之后(10月5日),特朗普便乘坐直升飞机回到白宫,白宫医生肖恩·康利表示:“目前特朗普的身体状况很正常,达到了出院标准”。不仅如此,特朗普在接受媒体采访时,还表示自己已经8个小时没有服用药物了,计划在近期亲自参加选举宣传活动...不论是确诊和“神速”治愈,都引发了广泛的关注、讨论和质疑,也让大选结果变得更加扑朔迷离。

 

今天「爱分析的德小拓」再次上线,通过数据分析的手段,来预测美国大选的相关情况。

01 美国大选如何“选”?
在进行结果解读之前,先和大家简单说明「美国大选」的选举人制度、候选人相关背景以及对选举结果影响非常大的“摇摆州”的相关情况。



选举人制度
美国全部"选举人票"共538张,是参议员(100名)、众议员(435名)、华盛顿特区代表(3名)的总数。参议员按州分配,50州每州2名;众议员按人口产生,约50多万人选出一名。例如纽约州约有1600多万人口,就有31名众议员,再加上2名参议员,总共有33张选举人票。

此外,美国的总统选举不是直接选举,而是间接选举。美国总统选举首先是选民在各州投票,决定本州选举人票的归属,然后全美国由选举人团投票来选美国总统。

总统选举共有538张选举人票,分别分布在美国50个州和华盛顿特区,哪位候选人获得超过270票即宣告获胜。除了缅因州和内布拉斯加州外,获得票数较多的一位候选人获得该州全部选举人票,其余48个州决定选举人票归属的规则是“赢者通吃”。

赢者通吃”的意思就是,选民先把票投给各州的“选举人”,“选举人”再按选民的意志,投票给候选人。加利福利亚人口4000万,有选举人票55张,蒙大拿州人口80多万,有选举人3张,所以美国总统选举有一个特点,就是越是在人口少的州、经济不繁荣的州赢了越划得来,因为相对的选举人票就越多。

此次美国大选的候选人特朗普和拜登,他们也分别代表着共和党以及民主党两个党派,大选也是两个党派之间的battle。


民主党&共和党候选人背景

民主党于1791年建党,曾名为共和党和民主共和党,该党大部分时间在野,1933-1953年,民主党人罗斯福和杜鲁门先后任总统,此后民主党连续执政20年,包括肯尼迪、约翰逊、卡特、奥巴马;共和党成立于1854年,1861年林肯就任总统,这是共和党首次执政,此后至1933年的70多年中,除16年外均为共和党执政。两党在经济、就业、国防、外交等方面的观点都存在较大差异。




摇摆州

“摇摆州”(swing state)在美国总统大选中起着重要作用。所谓“摇摆”,指的是竞选双方势均力敌,都无明显优势的州,在历届大选中经常会倒向不同的政党。“摇摆州”的选票往往决定着美国大选的最终结果,因此,“摇摆州”的选票一般是竞选双方争夺的重点。在2016年的美国总统竞选中,特朗普正是因为赢得了关键“摇摆州”(佛罗里达、宾州、北卡与俄亥俄州)的选票,才击败民主党对手希拉里·克林顿,成功当选美国总统。


02 预测模型思路

了解完美国大选的一些基本情况后,接下来是小拓此次预测模型的思路

 

主题思想

本次的预测模型,会整合截止到当前的全美国各种调研机构的调研结果(民意调查),针对收集到的民意调查结果,进行回归分析,从而得出各候选人获胜的概率,达到预测的目的。

 

模型主要步骤

1. 收集,分析和调整数据(民意调查);

2.将民意调查与基本面数据(指:经济状况,人口统计等因素)结合;

3.通过多次模拟,解决模型中的一些不确定性。

 

第一步:收集,分析和调整数据(民意调查)

这一步就是数据集成阶段,包括数据采集,数据清洗。

 

1.收集:收集民意调查的数据,以便计算民意调查的平均值;

2.分析:模型采用俩种不同的算法,在竞选初期,使用保守的加权平均法,而在最后的几周里,使用趋势线法(分析候选者的获胜曲线走向);

3.调整:调整共分为三种类型:可能登记并参与投票的选民的调整;参议院的效应调整;时间轴调整


 可能登记并参与投票的选民的调整:该调整主要针对前者与后者在预测方式上有所不同,所以来调整二者的投票更具有可比性;

 参议院的效应调整:检测民意调查始终倾向于一党或始终有更多或更少未确定的选民,据此进行调整;

 时间轴调整基于民意调查的新旧程度,调整旧的民意调查,以适应自它执行以来的总体竞争的变化。


第二步:将民意调查与基本原则相融合

注释:基本原则是指:人口普查数据与国家经济状况;民意调查与基本原则融合的权重占比规则,最开始双方占比基本持平,再离选举日的距离不断缩小时,民意调查的占比会越来越高,直到100%,而基本原则则会越来越低,直到为0。

 

因为本模型的预测严重依赖于民意检测,为解决这个问题需要将民意调查与基本面数据结合分析。
 

1

第一步结合:与人口普查数据融合

将每个州的平均投票与人口普查数据和过去的投票建模估算值相结合,得到的结果我们称之为“当前状况的增强快照”。

 

这里通过模型的核心指数“党派倾斜指数”,来创建每个州的投票估算值。

 

主要有三种方法:
 

● 刚性方法:指的是根据民意调查来推测全国范围内的竞选情况,然后把这些州的“党派倾斜指数”添加到自己的投票估算值上即可;

 人口回归方法:这个方法主要是使用一个州的党派倾斜指数加上一系列回归分析中其他变量如收入、教育、城市化等的一些组合来适应每个州的当前民意调查,然后取所有回归的加权平均值(其中R2较高的回归将得到更多的权重);

 区域回归法:指的是对一个州的“党派倾斜指数”进行回归预测。


权重大小系数:刚性方法>人口回归方法>区域回归法。

 

然后我们将以上三种方法得到的估计值结合起来,为每个州创建一个整体预测,最后再将这个整体预测与该州的民意调查平均值相结合创建得到该州的“当前状况的增强快照”。

 

最后将“每个州的增强快照”统计得到“全国快照”,这实质上就是我们对今天的全国民众投票的预测。
 

2

第二步结合:与现任的经济状况相融合

经济是衡量一个总统成功的重要指标,使用上一步得到的全国快照,与当前经济状况相结合,来生成当前选举日的预测。

 

第三步:通过多次模拟,解决模型中的一些不确定性

 

 

 

1. 国家偏移不确定性,指的是到选举日之前,全国整体预测的改变量即为国家偏移量。
 

● 国家偏移量公式:

C* Days*∛(un_index)

● 公式说明:

C:一个常量

Days:到大选截至日期还剩余的天数

Un_index:不确定指数,该指数是通过对多种指标进行同等权重的混合而成。

 

● 多种指标包括:

a. 犹豫不决的选民的数量

b. 基于美国两党在投票中的分歧衡量出的两极分化

c. 全国民意调查的总量

d. 全国民意调查平均值的波动性

e. 国家经济的动荡性

f. 大选期间,重要新闻的总量



2. 摇摆州的不确定性

在美国大选上,民主党和共和党都有自己的种族州,对于这些州的预测并不难,只有一些摇摆州的预测有些难度,这些摇摆州的对俩党的支持基本上属于一个临界点,两党的支持率相差不多,这些摇摆州的票数起着很重要的作用,对于民主党和共和党可以说是必争之地。

03 预测结果出炉,一方优势明显

 
从各州选取获胜概率图中我们可以较为清晰地看出,从整体情况来看,拜登(352)获得的选举人票数远超特朗普(186)


 

该“预测”平台,并不是会算出未来的某一天,两个人获胜的概率,而是根据美国各种调研机构的调研结果,进行结果修正,从而得出每个人的获胜概率。从预测投向曲线来看,从6月1日起到10月12日的调研数据结果来看,拜登的支持率稳定高于特朗普
 


这张图中,我们展示了全美50个州的支持率情况,从图中可以看出,靠近中线的8个州即为“摇摆州”,未来也将对美国大选起到决定性的作用,也将是未来三周的时间里,拜登和特朗普的主战场。
 

 佛罗里达州(FL),拥有29张选票,目前,拜登获得70.5%的支持率,特朗普获得29.5%的支持率;

 亚利桑那州(AZ),拥有11张选票,目前,拜登获得65.5%的支持率,特朗普获得35.5%的支持率;

 北卡罗来纳州(NC),拥有15张选票,目前,拜登获得62%的支持率,特朗普获得38%的支持率;

 俄亥俄州(OH),拥有18张选票,目前,拜登获得52.9%的支持率,特朗普获得47.1%的支持率;

 缅因州(ME),拥有4张选票,目前,拜登获得46.8%的支持率,特朗普获得53.2%的支持率;

 艾奥瓦州(IA),拥有7张选票,目前,拜登获得45.8%的支持率,特朗普获得54.2%的支持率;

 佐治亚州(GA),拥有16张选票,目前,拜登获得45.8%的支持率,特朗普获得54.2%的支持率;

 得克萨斯州(TX),拥有38张选票,目前,拜登获得29.6%的支持率,特朗普获得70.4%的支持率。

上述8个摇摆州中,「得克萨斯州、佛罗里达州、俄亥俄州、佐治亚州、北卡罗来纳州以及亚利桑那州」所具有的选举人票数较多,应当重点关注。

根据目前所获数据及信息,通过模型对美国大选结果进行模拟运算,在模拟的100次中,其中有87次是拜登、13次是特朗普,由此能够看出,目前的形势是更加偏向于拜登当选。

综合数据来看,到目前为止,今年的美国大选中,拜登占据了绝对的优势。

此次小拓展示所用产品是来自德拓信息自主研发的一站式数智决策平台PandaBI,能够快速搭建私有化的数据分析与可视化平台,完成多数据整合,建立统一数据口径,并提供灵活、易用、高效的可视化探索式分析能力,多场景的应用展示能力,同时,也要感谢交付体系数据分析团队小伙伴们~

点击下方链接,查看美国大选AI预测平台,PS:小拓每周都会更新哦~

http://58.240.115.226:4680/pandabi/#/release/c3d77b32ae214c33a2fa220c9d6705bd001