什么是标记语言
编辑标记语言是指一种文本编码系统,由插入文本文件中的一组符号组成,以控制其结构、格式或其各部分之间的关系。标记经常被用来控制文件的显示或丰富其内容以促进自动处理。标记语言是一套规则,规定哪些标记信息可以包含在文档中,以及如何与文档内容相结合,以方便人类和计算机程序使用。这个想法和术语是从纸质手稿的标记(即编辑的修改指示)演变而来的,传统上是用红笔或蓝笔写在作者的手稿上。较早的标记语言,通常侧重于排版和演示,包括troff、TeX和LaTeX。Scribe和大多数现代的标记语言,例如XML,都标识了文档的组成部分(例如标题、段落和表格),并期望使用样式表等技术来进行格式化或其他处理。一些标记语言,如广泛使用的HTML,有预先定义的表现语义,意味着它们的规范规定了如何在特定媒体上表现结构化数据的某些方面。像DocBook、OpeneBook、JATS和其他许多语言一样,HTML是基于标记元语言SGML和XML的。也就是说,SGML和XML允许设计者指定特定的模式,这些模式决定了哪些元素、属性和其他特征是允许的,以及在什么地方。大多数标记语言的一个极其重要的特点是,它们允许将标记与文本和图片等文件内容混合在一起。例如,如果一个句子中的几个词需要强调,或被确定为专有名词、定义术语或其他特殊项目,标记可以被插入句子的字符之间。这在结构上与传统的数据库有很大的不同,在传统的数据库中,根据定义,不可能有数据在一条记录中但不在任何字段中。此外,人类可读文本的标记必须维持秩序:把一本书的每一段都变成一个段落记录是不够的,因为这些记录并不维持秩序。
标记语言的词源
编辑标记(markup)这个名词来自于传统的出版实践,称为标记手稿,即在纸张或印刷手稿的空白处和文本中,以传统的符号印刷厂指示的形式添加手写的注释。几个世纪以来,这项工作主要是由熟练的排字员完成的,他们被称为标记员或D标记员,他们在文本上做标记,指出每个部分应该使用什么字体、风格和尺寸,然后将手稿交给其他人用手工或机器进行排版。标记也通常由编辑、校对、出版商和图形设计师应用,实际上也由文件作者应用,他们都可能标记其他东西,如更正、修改等。
呈现性标记
编辑传统的文字处理系统所使用的那种标记:二进制代码嵌入到文档文本中,产生所见即所得的效果。这种标记通常对人类用户,甚至作者和编辑都是隐藏的。正确地说,这种系统在下面使用程序性和/或描述性标记,但将其转换为呈现给用户的类型的几何排列。
程序性标记
编辑标记被嵌入到文本中,为程序处理文本提供指令。知名的例子包括troff、TeX和Markdown。假设软件从头到尾按顺序处理文本,按照遇到的指令进行处理。
流行的程序性标记系统通常包括编程结构,特别是宏,允许通过一个简单的名字(也许还有几个参数)来调用复杂的指令集。
描述性标记
编辑标记是专门用来标记文档中的部分内容的,而不是标记它们应该如何被处理。提供许多此类标签的知名系统包括LaTeX、HTML和XML。其目的是将文档的结构与任何特定的处理或演绎方式脱钩。这样的标记通常被描述为语义。
内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/163972/