|
|
¿Cómo buscar y navegar
en Internet?
Interfase
Alejandro Rulfo Méndez
|
|
Existen
algunas diferencias entre navegación y recuperación
de información en la red; las características de cada
proceso son diferentes. Unos trabajan por sistema de directorios y
otros por recuperación de información, valga la redundancia;
Yahoo es un sistema de directorios y Altavista es un sistema de recuperación
de información.
En los motores de búsqueda como Altavista, se busca indexar
la totalidad de Internet con base en situar en sus índices
todos y cada uno de los términos
representativos contenidos en todos |
y
cada uno de los documentos publicados en Internet. Es decir, cada
documento se presenta como un conjunto de palabras o frases (términos
de indización).
Un término usualmente utilizado es: Suposición. Y se
define como lo que crees que hará el sistema, las herramientas
o las utilerías, con relación a las demás partes
del sistema. Por ejemplo, para un motor de búsqueda se supone
que será capaz de extraer adecuadamente los términos
que representan el contenido del documento. Por el lado del usuario
se supone que los términos que utiliza estarán presentes
en los documentos relevantes y no en los que no lo son.
Los motores de búsqueda son capaces de identificar cadenas
de caracteres pero no conceptos, entonces cuando buscamos a través
de un motor de búsqueda se filtra cierta vaguedad o imprecisión
del lenguaje natural. Los motores de búsqueda no diferencian
género, calidad de los documentos, sinonimias, etcétera.
Hay ocasiones en que las cadenas de caracteres que forman parte del
documento, van a para al índice y se convierten en puntos de
acceso para el documento; en otros casos se realiza cierta selección
y solamente las palabras que superan cierta capacidad de discriminación,
forman parte del índice.
En ambos casos el funcionamiento esencial es lo mismo: los recursos
se representan por asignación de un conjunto (a veces muy amplio)
de términos de indización ( indexación), cada
uno de los cuales ha sido obtenido mediante análisis del documento
(básicamente estadístico)
Es sabido que ningún motor de búsqueda indexa más
del 16 por ciento de las páginas de la www. Los seis buscadores
más populares (como lo hemos visto en Interfases anteriores)
apenas cubren en conjunto el 60 por ciento de la web. Existen aproximadamente
dos mil millones de páginas en Internet, (dato del año
2000) pero a medida que esta cifra asciende, la cobertura desciende.
El asunto es que la web crece demasiado aprisa y los directorios no
pueden incorporar el impresionante marasmo de información.
Para que nos quede más claro, imaginemos una gran ola marina
(un tsunami) que avanza a más de mil kilómetros por
hora y va acortando la distancia entre ella y nosotros. Al principio
la veremos grande y rápida, pero a medida en que se acerca
podremos apreciar su fuerza y tamaño de mejor manera, hasta
el punto en que comprendamos la magnitud de la fuerza del tsunami.
Así es la información en Internet: crece de manera brutal.
Como el crecimiento es impresionante, se deberán desarrollar
motores de búsqueda guiados por inteligencia artificial que
resuelvan el problema de censar toda la red.
Parte del Aprendizaje actual se centrará en cómo localizar
información, como parte de las habilidades necesarias para
ingresar a cualquier centro de estudio.
Nos leemos en el siguiente Interfase. La dirección arulfo@uv.mx
está disponible para comentarios y sugerencias. |
|
|
|
|