研究人员近日设计了一个对用户友好的界面,帮助非专家人士利用随时间收集的数据进行预测。目前使用时间序列数据进行预测通常需要几个数据处理步骤和使用复杂的机器学习算法,这些算法的学习曲线非常陡峭,非专业人士不容易掌握。
为了使这些强大的工具更加方便用户使用,麻省理工学院的研究人员开发了一个系统,在现有的时间序列数据库之上直接整合预测功能。他们的简化界面,他们称之为 tspDB(时间序列预测数据库),在幕后完成了所有复杂的建模,因此非专业人士只需几秒钟就能轻松生成预测结果。
麻省理工学院的研究人员创造了一个工具,使人们只需敲几下键盘就能利用多个时间序列数据做出高度准确的预测。他们的工具核心的强大算法可以将多个时间序列转化为张量,这是一个多维的数字阵列(如图)。
之所以 tspDB 可以成功,原因之一是它采用了一种新颖的时间序列预测算法。电气工程和计算机科学(EECS)研究生 Abdullah Alomar 解释说,他和他的合著者在最近的一篇研究论文中描述了这种算法。这种算法在对多变量时间序列数据进行预测时特别有效,这些数据有一个以上的时间依赖变量。例如,在一个天气数据库中,温度、露点和云量分别取决于其过去的数值。
高级作者 Devavrat Shah 说:“即使时间序列数据变得越来越复杂,这个算法也能有效地捕捉到外面的任何时间序列结构”。他是EECS的Andrew和Erna Viterbi教授,数据、系统和社会研究所以及信息和决策系统实验室的成员。