Representación del conocimiento por medios informáticos: bases de datos y redes semánticas

AutoreErnesto García Camarero
Pagine201-216

Page 201

@1. Introducción.

Uno de los problemas esenciales de la informática es la representación de la información. En un principio se pensó que podía diferenciarse netamente entre información y conocimiento, aquélla como el soporte material para almacenar éste. La Teoría de la Comunicación de Shannon[l] se dedicó al estudio de la información en el sentido puramente ingenierñ del término; pero la dicotomía antes apuntada, útil desde el punto de vista metodológico y técnico, a veces se ha tomado con un sentido más ortológico, conduciendo al error de que cada uno de los términos de dicho binomio pudieran tener existencia independiente.

En particular en los sistemas informáticos se han distinguido siempre dos tipos de información; programas y datos [2]; pero el conocimiento que en ellos subyace se ha considerado implícito. El programa expresa un algoritmo, y a él se prestaba la máxima atención debido, en general, a su complejidad frente a la relativa sencillez de los datos sobre los que actuaba, cuya organización estaba establecida en el interior del programa. Guarido se presentó la situación de que un mismo conjunto de datos debía ser osado por varios programas distintos, aquéllos debían organizarse de tal manera que pudieran ser utilizados por los distintos programas y construirse estos teniendo en cuenta aquella organización.

Al principio, los criterios de organización de los datos se apoyaban en la forma de su almacenamiento físico y su localizados, de forma que los programas pudieran encontrar y recuperar los datos necesarios para su ejecución, y así aparecen los bancos de datos. Pero la supeditación de la organización de los datos a la estructura física de su almacenamiento puso de manifiesto que la estructuración de los datos no debía estar determinada por la estructura física de la memoria del ordenador, por sus formas de acceso ni por la naturaleza formal de los datos, sino teniendo muy en cuenta el contenido semántico de los mismos.

Se vio la necesidad de organizar los datos atendiendo a su significación, a laPage 202 semántica que relaciona los datos unos con otros; así surgieron las denominadas bases de datos [3]. Según el tipo de conexión entre ellos aparecieron distintas estructuras de datos y las bases de datos correspondientes se agruparon en tres grandes clases denominadas: bases jerárquicas (cuando su estructura es un árbol), en red (cuando la estructura en árbol se modifica permitiéndose relacionar algunos nodos de ramas distintas entre sí), o bases relaciónales (cuando se emplea el uso de relaciones y del cálculo relacional y preposicional). De esta forma fue quedando más patente el uso del aspecto semántico de los datos en su organización. Con eño se establecía que las bases de datos son, en realidad, un modelo de representación del conocimiento de un dominio específico.

De esta manera, observamos cómo a través de un camino con apariencia tan técnico como es el del desarrollo de las bases de datos, legamos a concomitancias y espacios comunes con lo esencial de los lenguajes naturales: la representación del conocimiento.

Diversas ciencias han buscado lenguajes, o formas distintas al lenguaje natural, para representar el conocimiento (o parte del conocimento) específico de las mismas; ejemplo de ello son el lenguaje de las matemáticas y en alguna medida de la formulación química, pero es esencialmente la lógica simbólica la que de forma más clara deja patente la existencia de otros lenguajes distintos al natural, para expresar con más precisión y de forma más adecuada cierta parcela del conocimiento humano.

En la actualidad, uno de los problemas esenciales de la informática es precisamente la búsqueda de modelos que nos faciliten la representación del conocimiento [4]. Las técnicas de la inteligencia artificial y en particular de los grtfos semánticos nos dan algunas herramientas para formular estos modelos.

Describiremos un sistema desarrollado por nosotros en el que utilizamos para la representación del conocimiento los grafos semánticos y al que denominamos SENECA (Semtntíc Networks fot Conceptual Ánalysis), Mediante este sistema se trata de la representación del conocimiento dado sobre un dominio particular del saber; para lo que se necesita determinar con precisión el dominio de conocimiento elegido, descomponerlo en sus partes y en los elementos considerados esenciales para su descripción e integrar estos elementos mediante las relaciones significativas que podamos establecer entre aquellas partes y elementos.

Según el dominio que se quiera representar, las relaciones que intervengan en la integración serán específicas, pero tomadas de un conjunto más general Es importante el cálculo o inducción de nuevas relaciones no establecidas a priori en la representación. Así, también es de interés el aspecto dinámico y variable de este tipo de representación en la definición de objetivos, conceptos y procedimientos.

Page 203

Terminaremos con algunas reflexiones sobre la aparición de un nuevo nivel de lenguaje que se está produciendo en la actualidad y que significará en salto cualitativo de tanta envergadura como lo fue la aparición del lenguaje escrito respecto del oral.

@2. Programas y datos.

El objetivo de la informática es el tratamiento o elaboración automática de información. De aquí surgen los dos elementos esenciales de esta actividad que suelen denominarse programas y datos.

Tratar o elaborar información es lo mismo que resolver un problema o una cuestión, ya que se trata, en definitiva, de obtener una información nueva a partir de una información conocida, es decir, resolver el problema de obtener la nueva información deseada a partir de la información conocida. Esta información puede considerarse como los «datos» de un problema, y la información buscada como el «resultado» de dicho problema. Se obtendrá en resultado si los datos definen con precisión el problema.

Las consideraciones anteriores nos levan a distinguir tres categorías, a saber: el espado de datos, el espado de programas, y el espado de resultados.

De hecho, esas tres categorías las podemos refundir en dos; por una parte, los datos (que engloban también a los resultados) que, por así decir, es información estática, y por otra parte, los programas, que es información dinámica en el sentido.de que hace actuar al ordenador, cuando son requeridos.

Así, un programa es una fundón entre el espacio de datos y el espacio de resultados, o bien un endomorfismo definido sobre los datos, Pero, además, debe ser una función calculable, es decir, que obtenga el resultado en un número finito de pasos. Por tanto, en programa es la expresión en un lenguaje dado (lenguaje de programación) del algoritmo mediante el que realzamos la función que resuelve el problema.

Como las primeras aplicaciones de los ordenadores fueron numéricas, esto significó que el espacio de datos coincidiera con el espacio de los números (espacio bien conocido) y que por tanto se concediera mayor atención a los programas, a los lenguajes de programación y a la construcción de algoritmos. Los datos eran incluidos de forma directa en cada programa, y por tanto la estructuración y organización de éstos era irrelevante, o estaba implícita.

La situación cambió cuando los datos fueron no-numéricos y cuando sobre un mismo espacio o conjunto de datos actuaban diversos programas. En este caso se presentaba como imperioso dar una estructura preestablecida y conocida a los datos y una organización a los mísmos, para facilitar se loca-Page 204lización y su uso por diversos programas ya construidos o por otros que pudieran construirse. Así nacieron los bancos de datos, organizados como colecciones de ficheros, compuestos éstos por cierto número de registros, es decir, por unidades homogéneas de información (o moléculas), compuestas de campos o partes elementales o mínimas con significado propio (o átomos).

Esta organización estaba originada por la que habitealmente se tiene en los ficheros manuales y por la naturaleza y forma de acceso del soporte informático donde se memorizaban (cintas magnéticas), pero pronto se observó que esta organización no debe estar supeditada a la naturaleza física de los ordenadores, sino que debe responder a la naturaleza de la propria información. Así surgieron las bases de dalos.

@3. Bases de datos.

La aparición de las bases de datos se debió al gran incremento en tamaño y en número de los bancos de datos. Por una parte era necesario integrar los dispersos bancos de datos en un solo sistema, y por otra, que esta integración se hiciera teniendo en cuenta fundamentalmente los aspectos semánticos de la información almacenada.

La integración de la información presenta numerosas ventajas, como: reducir la redundancia de los datos...

Per continuare a leggere

RICHIEDI UNA PROVA

VLEX uses login cookies to provide you with a better browsing experience. If you click on 'Accept' or continue browsing this site we consider that you accept our cookie policy. ACCEPT