Año 2 • No. 66 • junio 17 de 2002 Xalapa • Veracruz • México
Publicación Semanal


 Páginas Centrales

 
Información General

 
Date Vuelo

 Compromiso Social

 Arte Universitario

 Inter Nautas

 
Halcones al Vuelo

 Tus cartas

 Observatorio
de la ciencia


 
Contraportada


 Números Anteriores


 Créditos

 
¿Cómo buscar y navegar en Internet?
Interfase
Alejandro Rulfo Méndez
Existen algunas diferencias entre navegación y recuperación de información en la red; las características de cada proceso son diferentes. Unos trabajan por sistema de directorios y otros por recuperación de información, valga la redundancia; Yahoo es un sistema de directorios y Altavista es un sistema de recuperación de información.
En los motores de búsqueda como Altavista, se busca indexar la totalidad de Internet con base en situar en sus índices todos y cada uno de los términos
representativos contenidos en todos
y cada uno de los documentos publicados en Internet. Es decir, cada documento se presenta como un conjunto de palabras o frases (términos de indización).
Un término usualmente utilizado es: Suposición. Y se define como lo que crees que hará el sistema, las herramientas o las utilerías, con relación a las demás partes del sistema. Por ejemplo, para un motor de búsqueda se supone que será capaz de extraer adecuadamente los términos que representan el contenido del documento. Por el lado del usuario se supone que los términos que utiliza estarán presentes en los documentos relevantes y no en los que no lo son.
Los motores de búsqueda son capaces de identificar cadenas de caracteres pero no conceptos, entonces cuando buscamos a través de un motor de búsqueda se filtra cierta vaguedad o imprecisión del lenguaje natural. Los motores de búsqueda no diferencian género, calidad de los documentos, sinonimias, etcétera. Hay ocasiones en que las cadenas de caracteres que forman parte del documento, van a para al índice y se convierten en puntos de acceso para el documento; en otros casos se realiza cierta selección y solamente las palabras que superan cierta capacidad de discriminación, forman parte del índice.
En ambos casos el funcionamiento esencial es lo mismo: los recursos se representan por asignación de un conjunto (a veces muy amplio) de términos de indización ( indexación), cada uno de los cuales ha sido obtenido mediante análisis del documento (básicamente estadístico)
Es sabido que ningún motor de búsqueda indexa más del 16 por ciento de las páginas de la www. Los seis buscadores más populares (como lo hemos visto en Interfases anteriores) apenas cubren en conjunto el 60 por ciento de la web. Existen aproximadamente dos mil millones de páginas en Internet, (dato del año 2000) pero a medida que esta cifra asciende, la cobertura desciende. El asunto es que la web crece demasiado aprisa y los directorios no pueden incorporar el impresionante marasmo de información. Para que nos quede más claro, imaginemos una gran ola marina (un tsunami) que avanza a más de mil kilómetros por hora y va acortando la distancia entre ella y nosotros. Al principio la veremos grande y rápida, pero a medida en que se acerca podremos apreciar su fuerza y tamaño de mejor manera, hasta el punto en que comprendamos la magnitud de la fuerza del tsunami. Así es la información en Internet: crece de manera brutal.
Como el crecimiento es impresionante, se deberán desarrollar motores de búsqueda guiados por inteligencia artificial que resuelvan el problema de censar toda la red.
Parte del Aprendizaje actual se centrará en cómo localizar información, como parte de las habilidades necesarias para ingresar a cualquier centro de estudio.
Nos leemos en el siguiente Interfase. La dirección arulfo@uv.mx está disponible para comentarios y sugerencias.