何强,董志勇等在《统计研究》发表论文
利用互联网大数据预测季度gdp增速的方法研究
何强,董志勇
摘要:大数据为季度gdp走势预测创新研究带来重要突破口。本文利用百度等网站的互联网大数据,基于代表性高维数据机器学习(和深度学习)模型,对我国2011-2018年季度gdp增速深入进行预测分析。研究发现,对模型中的随机干扰因素作出一定分布的统计假设,有助于降低预测误差,任由模型通过大量数据机械地学习和完善并不总是有利于模型预测能力的提升;采用对解释变量集添加惩罚约束的方法,可以有效地处理互联网大数据维度较高的棘手问题;预测季度gdp增速的最优大数据解释变量集的稳定性较高。
关键词:互联网;大数据;季度gdp;高维;机器学习;