Web Superficial y Web Profunda
Los buscadores tradicionales sólo ofrecen acceso a una
pequeña parte de lo que existe online, lo que se ha comenzado a llamar la Web
superficial o visible.
La Web Superficial
o visible
La Web Superficial
comprende todos aquellos sitios cuya información puede ser indexada por los
robots de los buscadores convencionales. Las características principales de los
sitios de la Web visible son:
Ø Su información no está contenida en bases de datos
Ø Su información no está contenida en bases de datos
Ø
Es de libre acceso
Ø
No se requiere la realización de un proceso de
registro para acceder a la información.
Ø
Mayoritariamente está formada por páginas Web
estáticas, es decir páginas o archivos
Ø
Con una URL fija y accesibles desde otro enlace.
La Web Profunda o invisible
Es el término utilizado para
describir toda la información disponible en Internet que no se recupera
interrogando a los buscadores convencionales. Generalmente es información
almacenada y accesible mediante bases de datos. Parte de la información es
"invisible" a los robots de los buscadores convencionales, y que se
construyen en el mismo instante (temporales) desapareciendo una vez cerrada la
consulta. Sherman y Price identifican cuatro tipos de contenidos invisibles en
la Web:
La Web opaca (the
opaque Web),
Ø No todas las páginas de un sitio son indizadas en los
buscadores.
Ø A diario se agregan y modifican muchas y la indización
no se realiza al ritmo que permita incluirlas a todas.
Ø Generalmente limitan el número de documentos que se
muestran (entre 200 y 1000).
Ø URL desconectadas
La Web privada (the
private Web)
Ø Las páginas están protegidas por contraseñas.
Ø Contienen un archivo “robots.txt” para evitar ser
indizadas.
Ø Contienen un campo “noindex” para evitar que el
buscador pueda indizar la parte correspondiente al cuerpo de la página.
La Web propietaria
(the proprietary Web)
incluye aquellas páginas en las
que es necesario registrarse para tener acceso al contenido, ya sea de forma
gratuita o arancelada.
La Web realmente
invisible (the truly invisible Web)
Se compone de páginas que no
pueden ser indizadas
A continuacion un video de youtube que habla del o más oculto de internet, la Deep Web.
The WWW Virtual Library
el catálogo más antiguo en la
web y fue iniciado por Tim Berners-Lee, el creador de la web.
Infoplease
Es una Web de consulta con más
de 57.000 artículos de la prestigiosa enciclopedia Columbia
DeepWebTec
Ofrece cinco motores de
búsqueda para temas específicos. Los motores de búsqueda abarcan la ciencia,
medicina y negocios
TechXtra

0 comentarios:
Publicar un comentario