El lenguaje estandar de marca generalizada SGML y su aplicación en el campo jurídico

AutoreMarta Blaquier Ascaño
CaricaProfesora Titular de la Universidad de la Habana, Cuba
Pagine81-100

Page 81

@Introducion

Los documentos constituyen una parte importante de la comunicación humana en múltiples esferas de la vida social, La actuación del hombre en estas diversas esferas - juridica, educacional, comercial, entre otras - exige de la creación cooperada, trasmisión y procesamiento de documentos, siendo el flujo de documentos precondición para una buena parte de las actividades que en ellas se realizan. En la actividad juridica el flujo de documentos tiene una particular importancia, en la medida en que estos son - establecido formalmente - puntos de partida para el desencadenamiento de procesos y expresión de la conclusión de estos.

El empleo de las computadoras en esta comunicación documental y la proliferación de programas que ofrecen facilidades para la manipulación de documentos en un amplio espectro - desde la creación, como los procesadores de texto, hasta los sistemas hipermediales para la organización y consulta de complejas bases informativas como lo es por ejemplo, una enciclopedia - han planteado sus propias exigencias, entre ellas una redefinición del concepto de documento. Es comunmente aceptado en la -actualidad, y asi será usado en este articulo, que un documento es una colección de elementos de información dirigida a la percepción humana que puede ser intercambiado como unidad entre usuarios y/o sistemas [ISO92]. Una imagen, un texto convencional, un video, un segmento del habla humana, un libro, una ley, una sentencia son, igualmente, documentos.

Son situaciones frecuentes en la comunicación documental las siguientes:

- un documento creado por un autor forma parte de otro documento mayor, al cual debe ser integrado y que se crea en un tiempo y lugarPage 82 diferentes al del primero. Por ejemplo, un libro escrito por diversos autores o una revista contentiva de varios articulos;

- un documento puede ser usado con diversos propósitos, como pueden ser su edición o almacenamiento en una base de datos. Por ejemplo, el documento que describe un objeto artistico puede ser utilizado para un catálogo, una base de datos, una enciclopedia, o una revista especializada:

- un documento es usado con un propósito y trasmitido a un receptor que lo usa con proposito diverso y en un medio ambiente computacional también diverso.

El desenvolvimiento de la comunicación documental en toda su complejidad exige un alto grado de entendimiento entre el emisor (autor) y el receptor del documento, una comprensión común sobre la información que se intercambia, es decir, el receptor debe ser capaz de interpretar el significado de la información recibida, distinguir y, asi, ser capaz de usar la información procesable contenida en ella para realizar tareas y resolver problemas.

El grado de reusabilidad de la información recibida por un receptor o manipulada por un sistema será mucho mas alto si, primero, existe una clara compresión de cual es la estructura informativa del documento original y, segundo, si la información relevante al procesamiento asociada a esta estructura - un cierto tipo de meta información - resulta disponible tanto al emisor como al receptor.

La información procesable se representa computacionalmente mediante marcas. Una marca no es más que un código añadido al texto, Inicialmente se utilizaron códigos especificos para esta representación. La computadora al interpretar este código leva a cabo determinadas acciones como por ejemplo, una particular formatización del documento, la inclusión de nuevos segmentos de texto previamente estipulados o la inserción en una base de datos de información contenida en el documento que se procesa. Este tipo de marca es la usada por los procesadores de texto, El lenguaje de marca Richt Text Format (rtf), de Microsoft, de amplia utilización en la actualidad, es también un ejemplo de código especifico. rtf posee una gran expresividad tipográfica, pero una débil orientación a la estructuración y una 'sintaxis' de poco atractivo humano, lo cual hace dificil su legibilidad fuera de los programas que lo gestionan.

Posteriormente, a finales de ios años 60, se alcanza un mayor grado de abstracción en la representación de la información procesable al ser usados elementos descriptivos (tags) en lugar de códigos especificos. WilliamsPage 83 Tunnicliffe plantea en 1967 la necesidad, de separar el contenido informativo del documento de su formato.

Paralelamente, un diseñador de libros, Stanley Rice propone la idea de un catálogo universal de elementos de la 'estructura, editorial', iniciándose a continuación en el Comité de Composición de la Graphic Communications Association el proyecto que dará lugar al concepto de código genérico. Sobre la base de las ideas anteriores, y en el marco de un proyecto de. la IBM, Charles Goldfarb conjuntamente con Edward Mosher y Raymond Lorie desarrollan el Lenguaje de Marca Generalizada (Document Composition Facility Generalizad Markup Language: dcf gml). Este lenguaje introduce el concepto de marca generalizada y la definición formal de tipo de documento. Una marca generalizada es un código que describe la estructura de un documento identificando, sin ambigüedad, el texto marcado y el propósito del mismo. En una ley, por ejemplo, podrian marcarse como elementos los capitulos y dentro de estos los articulos que lo integran.

A continuación se ejemplifican los dos tipos de marca1.

MARCA ESPECIFICA (I) MARCA GENERALIZADA (II)
.PL66:
.MT6
.LH12:
.MB9
.UJ ON
^A^B CAPITULO III ^B
De la representación.
^BARTICULO 467. Nociones. ^B
La representación ...
:LEv.
:CUERPO.
:CAPITULO.
:ENCAB3. CAPITULO III
De la representación
:ARTICULO.
:ENCAB4. ARTICULO 467. Nociones.
:P. La representación ...

En (I) aparecen, conjuntamente con el texto de un documento juridico, los comandos punto de control de la impresión del Word Star, información procesable que constituyen directivas para la formatización del documento.

En (II) se presenta un ejemplo de marca generalizada en el cual aparece representada la estructura del mismo documento.

Como el código especifico es dependiente del programa que lo interpreta, un cambio de medio del documento exigirá la sustitución de esta codificación por otra, lo cual resulta una tarea engorrosa pues las marcas están diseminadas por todo el documento sin una nitida separación delPage 84 contenido informativo del mismo. La marca generalizada resuelve esta dificultad encapsulando la información procesable mediante recursos del lenguaje que pueden asociarse a los elementos de la estructura y un cambio de medio del documento exigirá solamente el cambio de unidades informativas bien delimitadas en el mismo.

En los años 70 se dan los primeros pasos para el desarrollo de un lenguaje estándar de marca. Dentro de la American National Standards Institute (ANSI) se crea el Computer Language for the Processing of Text Committee en, el cual se desarrolla un proyecto, dirigido por el propio Goldfarb, en colaboración con el gca GenCode Committee. En 1980 aparece la primera publicación de trabajo de lo que en 1985 viene aprobado como un estándar internacional, el Lenguaje Estandar de Marca Generalizada (Standard Generalized Markup Language: SGML, ISO 8879), también en 1985 se funda en el Reino Unido el Grupo Internacional de Usuarios del SGML presidido por Joan Smith2.

El SGML ha tenido posteriormente importantes aplicaciones, que se han convertido a su vez en estándares de aplicación, entre los mas importantes están:

- el Electronic Manuscript Project de la Association of American Publishers dirigido a la gestión editorial;

- el Compputer-Aided Acquisition and Logistic Support orientado a la gestión de información militar;

- Hy Time, orientada a los sitemas hipermediales;

- el Standard Musical Description Language (sdml) una aplicación de Hy time encaminada a la representación de la información musical.

En el campo juridico pueden señalarse como sus primeros usuarios la casa editora Kluwer en Holanda y la Her Magesty's Stationery Office del Reino Unido, en ambos casos la aplicación ha sido realizada para la edición de estatutos, y la Harvard Law Review de Estados Unidos, que ha elaborado un texto público3 para las citaciones legales.

El estandar SGML ha tenido los más diversos campos de aplicación: laPage 85 defensa, las telecomunicaciones, las lineas aéreas, las patentes, el mundo académico, las entidades gubernamentales, la actividad editorial. Ha sido auspiciada su aplicación por las más prestigiosas instituciones en las diversas esferas4. SGML ha sido usado con los más diversos propósitos, entre ellos, el intercambio electrónico de datos, la recuperación de información en bases de datos, la editoria electrónica, la distribución de documentos y la edición asistida por computadora5.

No obstante todo lo anteriormente expuesto existen diversos aspectos que han limitado la difusión y el uso del estándar como son; el grado de dificultad que presentan el contenido y la forma del mismo, lo reciente de su aparición y el hecho de ser un estándar indirecto, es decir, no describe un lenguaje de marca en particular. Un análisis más detallado de estas limitaciones puede encontrarse en [Nor93].

@Breve descripción del SGML

El SGML es un meta lenguaje sintáctico para la definición de sistemas de marcas generalizadas que permite establecer la estructura lógica de los documento y brinda facilidades para el encapsulamiento de la información procesable incrementando la portabilidad de los mismos. SGML es independiente de la máquina y de las aplicaciones y capaz de describir cualquier tipo de documento escrito en cualquier lenguaje.

La estructura lógica de un documento viene definida rigurosamente por una Definición de Tipo de Documento (dtd). El dtd describe cada componente de esta estructura y su interrelación con los otros elementos. El elemento de más alto nivel estructural en SGML es el documento. Un DTD es un modelo que define una clase de documentos especificando las posibles estructuras que un documento de la clase puede...

Per continuare a leggere

RICHIEDI UNA PROVA

VLEX uses login cookies to provide you with a better browsing experience. If you click on 'Accept' or continue browsing this site we consider that you accept our cookie policy. ACCEPT