地名解析

编辑
本词条由“匿名用户” 建档。

在地理信息系统中,地名解析是地名(即提及某个地点)与同一地点的明确空间足迹之间的关系过程。 历史上,移民定居者使用相同的地名来表示他们的新家,从而导致地名的参照含糊。有时,原始名称会被修改(例如在“约克”与“纽约”中)。在许多情况下,名称无需修改即可重复使用(英国英格兰的“波士顿”与美国马萨诸塞州的“波士顿”)。为了将文档中出现的一组地名或地名映射到其相应的纬度 / 经度坐标,多边形或任何其他空间...

地名解析

编辑

地理信息系统中,地名解析是地名(即提及某个地点)与同一地点的明确空间足迹之间的关系过程。

历史上,移民定居者使用相同的地名来表示他们的新家,从而导致地名的参照含糊。有时,原始名称会被修改(例如在“约克”与“纽约”中)。在许多情况下,名称无需修改即可重复使用英国英格兰的“波士顿”与美国马萨诸塞州的“波士顿”)。为了将文档中出现的一组地名或地名映射到其相应的纬度 / 经度坐标,多边形或任何其他空间足迹,必须进行消歧步骤。地名解析算法是执行从地名到空间足迹的映射的自动方法。

多数地名解析方法都在地名词典中使用地名和名称之间的映射关系。

地名解析

解决过程

编辑

定义的“同一位置的明确空间足迹” 实际上可以是明确的,或者“不是那么明确的”。解决过程可能存在不确定性的不同背景:

  • 当证据是地理的且没有不确定性时。例如,要获取照片所在的国家/地区名称,则该位置是GPS位置(错误10米),距离国家/地区边界1000公里。
  • 当证据是地理的,但具有相当大的不确定性。想象一下类似的情况,其中GPS误差为100米,而该地点距离国家边界约100米。
  • 当证据仅是文本时。想象一下,叙述者是一位游客,他从度假回来后讲述了自己的旅行的来信。在叙述中,xxx的证据是文字
  • 混合的证据来源:不止一个证据,没有一个确切的证据。

来自地理证据

地名解析有时是从名称到缩写的简单转换,特别是当缩写用作标准地址解析时。例如,将正式国名阿富汗到ISO国家代码AF

在注释媒体数据时,使用地图和地理证据(例如GPS)进行转换是获取地名或代表地名的地理编码的最常用方法。

来自文字证据

与通常存储在结构化数据库记录中的邮政地址的地理编码相反,通常将地名解析应用于大型非结构化文本文档集合,以将其中提到的位置与地图相关联。

使用空间足迹注释媒体(例如,图像、文本、视频)的过程称为地理标记。为了自动对文本文档进行地理标记,通常执行以下步骤:地名识别(即,找到对地理位置的文本引用)和地名解析(即,为每个地理参考选择适当的位置解释)。

地名识别可以认为是命名实体识别的一种特殊情况,其中目的是仅导出位置实体。然而,使用手工制定的规则或统计规则可以进一步改善命名实体识别的结果。

方法

编辑

地名解析方法大致可分为有监督和无监督的模式。监督方法通常将问题视为学习任务,其中模型首先提取上下文和非上下文特征,然后在标记的数据集上训练分类器。自适应模型是解决地名的主要模型之一。对于地名的每种解释,该模型都会根据地理邻近性以及与其他解释的同级关系得出上下文相关的特征。除了与上下文相关的功能外,该模型还受益于无上下文的功能,包括人口和受众位置。另一方面,无监督模型不保证带注释的数据。当带注释的语料库不够大时,它们优于监督模型,并且监督模型可能无法很好地泛化。

无监督模型倾向于更好地利用文档中提到的地名之间的相互作用。Context-Hierarchy Fusion模型估计文档的地理范围,并利用附近的地名之间的联系作为解析地名的证据。通过将问题映射到无冲突集覆盖问题,此模型实现了一致且鲁棒的解决方案。

此外,采用维基百科和知识库已显示出有效的地名解析。TopoCluster通过合并位置的Wikipedia页面来建模单词的地理意义,并使用文本中单词的空间意义消除地名的歧义。

地理解析

地理解析是一种特殊的地名解析过程,它将地点的自由文本描述(例如“贾拉拉巴德东北20英里”)转换为明确的地理标识符,例如以纬度 - 经度表示的地理坐标。一个人还可以对其他媒体形式的位置参考进行地理解析,例如,讲话者提到某个地点的音频内容。利用地理坐标,可以将要素映射并输入到地理信息系统中。从非结构化内容派生的地理坐标的两个主要用途是在地图上绘制内容的一部分,并使用地图作为过滤器来搜索内容。

地理解析不只是地理编码。地理编码可分析明确的结构化位置参考,例如邮政地址和格式严格的数字坐标。地理解析处理非结构化话语中的歧义,例如“ Al Hamra”,这是几个地方的名称,包括叙利亚和也门的城镇。

一个geoparser是一个软件或(网络服务,帮助这一进程。一些例子:

  • GEOLocate自动地理配准
  • BioGeomancer –半自动地理配准
  • GEOnet名称服务器 -美国和南极洲以外地区的免费GIS信息,由国家地理空间情报局(NGA)和美国地理名称委员会(US BGN)每月更新一次
  • 地名信息系统(GNIS) –免费提供的数据库,其中包含有关美国近200万个物理特征,地点和地标的信息
  • CLAVIN – CLAVIN(地图位置和邻近地区索引)是用于文档地理标记和地理解析的开源软件包,它采用基于上下文的地理实体解析。
  • Geoparser.io – Geoparser.io是一个Web服务,用于识别文本中提到的位置,消除歧义,然后返回GeoJSON以及有关文本中找到的位置的详细元数据。
  • Geocode.xyz – Geocode.xyz是一个Web服务,可识别文本中提到的地名和​​街道地址。
  • geoparsepy – geoparsepy是一个免费的Python地理解析库,支持使用OpenStreetMap数据库进行自由文本位置识别和消歧义。

内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/109928/

(2)
词条目录
  1. 地名解析
  2. 解决过程
  3. 来自地理证据
  4. 来自文字证据
  5. 方法
  6. 地理解析

轻触这里

关闭目录

目录