简介
编辑数据交换是获取在源模式下结构化的数据并将其转换为目标模式的过程,以便目标数据是源数据的准确表示。数据交换允许数据在不同的计算机程序之间共享。
它类似于数据集成的相关概念,只是在数据交换中实际重组了数据(可能丢失内容)。给定所有约束,可能无法转换实例。相反,可能有多种方法来转换实例(可能有无限多种),在这种情况下,必须确定并证明最佳的解决方案选择。
单域数据交换
编辑在某些域中,可能存在几十种不同的源和目标模式(专有数据格式)。通常为单个域开发交换或互换格式,然后编写必要的例程(映射)以(间接)将每个源模式转换/翻译为每个目标模式,方法是使用交换格式作为中间步骤。
与编写和调试将每个源模式直接转换为每个目标模式所需的数百个不同例程相比,这需要的工作要少得多。
这些变革性交换格式的示例包括:
- 地理空间数据的标准交换格式;
- 电子表格数据的数据交换格式;
- 电子表格、图表、演示文稿和文字处理文档的开放文档格式;
- 用于描述 GPS 数据的 GPS eXchange Format 或 Keyhole Markup Language;
- 用于集成电路布局的 GDSII。
数据交换语言
编辑数据交换(或交换)语言/格式是一种独立于领域的语言,可用于任何学科的数据。它们已经从标记和面向显示演变为进一步支持描述信息结构属性的元数据编码。
实践表明,某些类型的形式语言比其他形式语言更适合这项任务,因为它们的规范是由形式过程而不是特定的软件实现需求驱动的。例如,XML 是一种标记语言,旨在支持创建方言(特定领域子语言的定义)。但是,它不包含特定领域的字典或事实类型。有利于可靠数据交换的是标准词典分类法和工具库(如解析器、模式验证器和转换工具)的可用性。
用于数据交换的流行语言
以下是用于在多个域中进行数据交换的流行通用语言的部分列表。
命名法
- 模式——语言定义是否以计算机可解释的形式提供
- 灵活——语言是否能够在不修改模式的情况下扩展语义表达能力
- 语义验证——语言定义是否能够对语言表达的正确性进行语义验证
- Dictionary-Taxonomy – 语言是否包含具有继承性的概念的字典和分类法(子类型-超类型层次结构)
- 同义词和同音词——语言是否包含并支持在表达中使用同义词和同音词
- 方言——语言定义是否以多种自然语言或方言提供
- Web 或 ISO 标准 – 认可该语言为标准的组织
- 转换——语言是否包括对其他标准的翻译
- 轻量级 – 除完整版外,是否有轻量级版本可用
- 人类可读——语言中的表达是否是人类可读的
- 兼容性——使用该语言时可以使用或需要哪些其他工具
笔记:
- RDF 是一种模式灵活的语言。
- XML 架构包含非常有限的语法和词汇。
- 可作为扩展程序使用。
内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/249382/