新闻稿

用于测量空间依赖性新颖方法使得小数据动作大

NYU坦登研究员发明了一种数学系统用于识别地理现象,使小数据集有效,因为在确定的空间依赖关系大数据之间的影响。

interconnected world map

毛里齐奥porfiri,学院教授,​​设计简化空间关系的新方法,通过数学技术的应用,使得“小数据”的行为大。该系统的承诺,使之更易于理解全球性和区域性事件之间的关系。

布鲁克林,纽约,周三,2020年10月21日 - 气候变化引起的人类迁徙的标识,covid-19,农业的发展趋势和社会经济问题的邻近地区传播取决于数据 - 更复杂的模型中,更数据需要理解这样的空间分布的现象。然而,可靠的数据往往是昂贵的,并且很难获得,或过于稀疏,以允许准确的预测。

毛里齐奥porfiri,机械和航空航天,生物医药,以及民间和城市工程研究所教授的一员 中心城市的科学进步 (牙尖)在im体育官网,设计出基于网络和信息理论,使“小数据”行为大通过的通常用于时间序列的数学技术,对空间处理所述应用的新颖的解决方案。

研究, ”信息理论方法研究在小数据集的空间依赖 特色在封面 皇家社会的程序:数学,物理和工程科学, 描述了如何,从在的位置的有限数量的属性的一个小样本,观察员可以使影响的鲁棒推论,包括内插到中间区域或甚至共享类似关键属性遥远区域。 

“大部分时间的数据集是穷人,” porfiri解释。 “因此,我们采取了一个非常基本的方法,运用信息理论探讨在时间意义的影响力是否可以扩展到空间,这使我们能够工作,一个非常小的数据集,25层50之间的意见,”他说。 “我们正在采取一个数据快照,并绘制连接 - 不是基于原因和影响,但对各个点之间的相互作用 - 看看是否有某种形式在系统底层,集体反应。” 

该方法,通过porfiri和定量方法,法律和现代语言,卡塔赫纳技术大学新闻系的合作者曼努埃尔·鲁伊斯马林发达,西班牙,涉及:

  • 合并给定的数据集到一个小的范围内可容许的符号,类似机器学习系统可以识别与有限的像素数据的面的方式:一个下巴,颧骨,前额等等 
  • 应用信息理论原理来创建一个测试,就是非参数(一个不承担任何底层模型位置之间的相互作用)的事件之间画协会,以发现是否在特定位置的不确定性,如果一个人对知识的减少不确定性在另一个位置。

porfiri解释说,由于非参数方法的posits没有用于在节点之间的影响底层结构,它赋予灵活性节点可以如何相关联,或者甚至如何邻居的概念被定义。 

“因为我们的抽象邻居的这个概念,我们可以在任何你喜欢的质量的背景下定义,例如,意识形态。思想上,加州可能是纽约的一个邻居,虽然他们不是地理上位于一处。他们可能有着相同的价值观“。

该小组的验证系统对两个案例:在孟加拉国人口的迁移,由于海平面上升和机动车死亡人数在美国,以得出一个统计原则的洞察重要的社会经济问题的机制。

“在第一种情况下,我们想看看是否位置之间迁移可以通过地理距离或特定地区的洪水的严重程度来预测 - 知识是否这些区接近的洪水将有助于水平的另一个地区或知识预测迁移的规模,”鲁伊斯说马林。

对于第二种情况,他们看着酒精相关汽车事故的空间分布,1980年,1994年,和2009年比较状态以高度的此类事故邻近各国和有关酒后驾车类似的立法思想状态。 

“我们发现国家接壤比国家分享有关饮酒和驾驶的法律意识形态之间更强有力的关系。” 

接下来,porfiri和鲁伊斯马林计划他们的方法扩展到时空过程,如在美国枪支暴力的分析- 一种 主要研究项目 或在大脑癫痫发作 - 最近由美国国家科学基金会的飞跃喜计划资助。他们的工作将有助于了解在何时何枪支暴力可能发生或发作可以启动。

该研究是由美国国家科学基金会和穆尔西亚地区和塞内卡基金会,科学和技术机构的卓越团体的支持。 

“信息理论方法研究在小样本中的空间依赖”可在线 royalsocietypublishing.org.


有关工程的im体育坦登学校

工程日期的NYU坦登学校1854年,成立日期为土木建筑和布鲁克林大学和理工学院的两个im体育医学院。一个2014年1月合并而成教育和研究的综合性学校工程和应用科学作为一个全球性大学的一部分,工程计划在im体育阿布扎比和关闭连接上海im体育。im体育坦登植根于创业,求知欲和创新解决方案的一个充满活力的传统,对人类的最紧迫的全球性挑战。在坦登研究主要集中在通讯/资讯,网络安全和数据科学/ AI /机器人系统和工具,以及社会的关键领域,他们的影响力,包括新兴媒体,健康,可持续发展,与城市生活之间的重要交叉点。我们认为多元化是不可或缺的精益求精,并创造了我们所有的学生,教师和工作人员的活力,包容和公平的环境。有关更多信息,请访问: engineering.nyu.edu.