11月3日,美国将举行第59届总统选举,距离投票日仅剩3周,目前,共和党候选人现任美国总统特朗普与民主党候选人前美国副总统拜登的较量,也完全进入了白热化。
美国大选作为举世瞩目的重大政治事件,牵动着亿万人的心。自现任美国总统特朗普上任以来,迅速地推翻了奥巴马政府的数项政策,同时,拉动与各国之间的贸易战,退出各类国际组织,要求盟国分担防务经费等...推行了一系列以维护美国利益为核心的举措。
虽然特朗普的一系列受到了许多争议,但对于大部分美国民众来说,特朗普也确实兑现了在2016年竞选美国总统时的绝大部分竞选承诺。
而在当地时间10月2日凌晨,特朗普在社交媒体上表示自己和其夫人新冠病毒检测结果呈阳性,将马上进入隔离和康复程序。
他于2号入住美国沃尔特里德国家军事医疗中心,而仅仅三天之后(10月5日),特朗普便乘坐直升飞机回到白宫,白宫医生肖恩·康利表示:“目前特朗普的身体状况很正常,达到了出院标准”。不仅如此,特朗普在接受媒体采访时,还表示自己已经8个小时没有服用药物了,计划在近期亲自参加选举宣传活动...不论是确诊和“神速”治愈,都引发了广泛的关注、讨论和质疑,也让大选结果变得更加扑朔迷离。
今天「爱分析的德小拓」再次上线,通过数据分析的手段,来预测美国大选的相关情况。
01 美国大选如何“选”?
在进行结果解读之前,先和大家简单说明「美国大选」的选举人制度、候选人相关背景以及对选举结果影响非常大的“摇摆州”的相关情况。
了解完美国大选的一些基本情况后,接下来是小拓此次预测模型的思路。
主题思想
本次的预测模型,会整合截止到当前的全美国各种调研机构的调研结果(民意调查),针对收集到的民意调查结果,进行回归分析,从而得出各候选人获胜的概率,达到预测的目的。
模型主要步骤
1. 收集,分析和调整数据(民意调查);
2.将民意调查与基本面数据(指:经济状况,人口统计等因素)结合;
3.通过多次模拟,解决模型中的一些不确定性。
第一步:收集,分析和调整数据(民意调查)
这一步就是数据集成阶段,包括数据采集,数据清洗。
1.收集:收集民意调查的数据,以便计算民意调查的平均值;
2.分析:模型采用俩种不同的算法,在竞选初期,使用保守的加权平均法,而在最后的几周里,使用趋势线法(分析候选者的获胜曲线走向);
3.调整:调整共分为三种类型:可能登记并参与投票的选民的调整;参议院的效应调整;时间轴调整:
● 可能登记并参与投票的选民的调整:该调整主要针对前者与后者在预测方式上有所不同,所以来调整二者的投票更具有可比性;
● 参议院的效应调整:检测民意调查始终倾向于一党或始终有更多或更少未确定的选民,据此进行调整;
● 时间轴调整:基于民意调查的新旧程度,调整旧的民意调查,以适应自它执行以来的总体竞争的变化。
第二步:将民意调查与基本原则相融合
注释:基本原则是指:人口普查数据与国家经济状况;民意调查与基本原则融合的权重占比规则,最开始双方占比基本持平,再离选举日的距离不断缩小时,民意调查的占比会越来越高,直到100%,而基本原则则会越来越低,直到为0。
因为本模型的预测严重依赖于民意检测,为解决这个问题需要将民意调查与基本面数据结合分析。
第一步结合:与人口普查数据融合
将每个州的平均投票与人口普查数据和过去的投票建模估算值相结合,得到的结果我们称之为“当前状况的增强快照”。
这里通过模型的核心指数“党派倾斜指数”,来创建每个州的投票估算值。
主要有三种方法:
● 刚性方法:指的是根据民意调查来推测全国范围内的竞选情况,然后把这些州的“党派倾斜指数”添加到自己的投票估算值上即可;
● 人口回归方法:这个方法主要是使用一个州的党派倾斜指数加上一系列回归分析中其他变量如收入、教育、城市化等的一些组合来适应每个州的当前民意调查,然后取所有回归的加权平均值(其中R2较高的回归将得到更多的权重);
● 区域回归法:指的是对一个州的“党派倾斜指数”进行回归预测。
权重大小系数:刚性方法>人口回归方法>区域回归法。
然后我们将以上三种方法得到的估计值结合起来,为每个州创建一个整体预测,最后再将这个整体预测与该州的民意调查平均值相结合创建得到该州的“当前状况的增强快照”。
最后将“每个州的增强快照”统计得到“全国快照”,这实质上就是我们对今天的全国民众投票的预测。
第二步结合:与现任的经济状况相融合
经济是衡量一个总统成功的重要指标,使用上一步得到的全国快照,与当前经济状况相结合,来生成当前选举日的预测。
第三步:通过多次模拟,解决模型中的一些不确定性
1. 国家偏移不确定性,指的是到选举日之前,全国整体预测的改变量即为国家偏移量。
● 国家偏移量公式:
C* Days*∛(un_index)
● 公式说明:
C:一个常量
Days:到大选截至日期还剩余的天数
Un_index:不确定指数,该指数是通过对多种指标进行同等权重的混合而成。
● 多种指标包括:
a. 犹豫不决的选民的数量
b. 基于美国两党在投票中的分歧衡量出的两极分化
c. 全国民意调查的总量
d. 全国民意调查平均值的波动性
e. 国家经济的动荡性
f. 大选期间,重要新闻的总量
2. 摇摆州的不确定性
在美国大选上,民主党和共和党都有自己的种族州,对于这些州的预测并不难,只有一些摇摆州的预测有些难度,这些摇摆州的对俩党的支持基本上属于一个临界点,两党的支持率相差不多,这些摇摆州的票数起着很重要的作用,对于民主党和共和党可以说是必争之地。
03 预测结果出炉,一方优势明显
该“预测”平台,并不是会算出未来的某一天,两个人获胜的概率,而是根据美国各种调研机构的调研结果,进行结果修正,从而得出每个人的获胜概率。从预测投向曲线来看,从6月1日起到10月12日的调研数据结果来看,拜登的支持率稳定高于特朗普。
这张图中,我们展示了全美50个州的支持率情况,从图中可以看出,靠近中线的8个州即为“摇摆州”,未来也将对美国大选起到决定性的作用,也将是未来三周的时间里,拜登和特朗普的主战场。
● 佛罗里达州(FL),拥有29张选票,目前,拜登获得70.5%的支持率,特朗普获得29.5%的支持率;
● 亚利桑那州(AZ),拥有11张选票,目前,拜登获得65.5%的支持率,特朗普获得35.5%的支持率;
● 北卡罗来纳州(NC),拥有15张选票,目前,拜登获得62%的支持率,特朗普获得38%的支持率;
● 俄亥俄州(OH),拥有18张选票,目前,拜登获得52.9%的支持率,特朗普获得47.1%的支持率;
● 缅因州(ME),拥有4张选票,目前,拜登获得46.8%的支持率,特朗普获得53.2%的支持率;
● 艾奥瓦州(IA),拥有7张选票,目前,拜登获得45.8%的支持率,特朗普获得54.2%的支持率;
● 佐治亚州(GA),拥有16张选票,目前,拜登获得45.8%的支持率,特朗普获得54.2%的支持率;
● 得克萨斯州(TX),拥有38张选票,目前,拜登获得29.6%的支持率,特朗普获得70.4%的支持率。
上述8个摇摆州中,「得克萨斯州、佛罗里达州、俄亥俄州、佐治亚州、北卡罗来纳州以及亚利桑那州」所具有的选举人票数较多,应当重点关注。
根据目前所获数据及信息,通过模型对美国大选结果进行模拟运算,在模拟的100次中,其中有87次是拜登、13次是特朗普,由此能够看出,目前的形势是更加偏向于拜登当选。
综合数据来看,到目前为止,今年的美国大选中,拜登占据了绝对的优势。
此次小拓展示所用产品是来自德拓信息自主研发的一站式数智决策平台PandaBI,能够快速搭建私有化的数据分析与可视化平台,完成多数据整合,建立统一数据口径,并提供灵活、易用、高效的可视化探索式分析能力,多场景的应用展示能力,同时,也要感谢交付体系数据分析团队小伙伴们~
点击下方链接,查看美国大选AI预测平台,PS:小拓每周都会更新哦~
http://58.240.115.226:4680/pandabi/#/release/c3d77b32ae214c33a2fa220c9d6705bd001