En la internet superficial las arañas de los buscadores van recorriendo
las páginas web, almacenando información que contienen y buscando enlaces a
otros sitios web para seguir actualizando sus bases de datos. Con el tiempo
acaban recorriendo todas las páginas de Internet que tienen enlaces desde
otras. Pero por distintos motivos (enlaces generados por JavaScript y Flash,
páginas protegidas con contraseña, fichero de exclusión de robots, etc.)
algunas páginas no pueden ser alcanzadas por las arañas de los buscadores.
Estas páginas forman la Internet Profunda.
Internet superficial
Se conoce como Internet superficial a la
porción de Internet que es indexada por las arañas de los motores de búsqueda.
La parte que no es indexada se conoce como Internet profunda.
En enero de 2005, según un estudio reciente que
investigó distintos motores de búsqueda (Google, MSN, Yahoo y Ask Jeeves) se
determinó que había 11.500 millones de páginas web en los índices de los
buscadores.
En junio de 2008 los índices contenían más de
63.000 millones de páginas Web.
Internet profunda
Se le conoce informalmente como Internet profunda o
Internet invisible (en inglés: Deepweb, Invisible Web, Deep Web, Dark Web o
Hidden Web) a una porción presumiblemente muy grande de la Internet que es
difícil de rastrear o ha sido hecha casi imposible de rastrear y
deliberadamente, como lo es el caso del Proyecto Tor, caso en el cuál ha sido
hecha de ésta manera vía usando métodos poco convencionales, cómo con la
proxyficación con muchos proxys, el no utilizar direcciones de Internet, sino
códigos y el utilizar el pseudodominio de nivel superior .onion, la cuál fue
creada por la Armada de los Estados Unidos como una prueba y ahora es
aprovechada por delincuentes cibernéticas.
Se le conoce así a todo el contenido de Internet
que no forma parte del Internet superficial, es decir, de las páginas indexadas
por las redes de los motores de búsqueda de la red. Esto se debe a las
limitaciones que tienen las redes para acceder a todos los sitios web por
distintos motivos. La mayor parte de la información encontrada en la Internet
Profunda está enterrada en sitios generados dinámicamente y para los motores de
búsqueda tradicionales es difícil hallarla. Fiscales y Agencias Gubernamentales
han calificado a la Internet Profunda como un refugio para la delincuencia
debido al contenido ilícito que se encuentra en ella.
Origen de la internet profunda
La principal causa de la existencia de la
Internet profunda es la imposibilidad de los motores de búsqueda (Google,
Yahoo, Bing, etc.) de encontrar o indexar gran parte de la información
existente en Internet. Si los buscadores tuvieran la capacidad para acceder a
toda la información entonces la magnitud de la "Internet profunda" se
reduciría casi en su totalidad. No obstante, aunque los motores de búsqueda
pudieran indexar la información de la Internet Profunda esto no significaría
que ésta dejará de existir, ya que siempre existirán las páginas privadas. Los
motores de búsqueda no pueden acceder a la información de estas páginas y sólo
determinados usuarios, aquellos con contraseña o códigos especiales, pueden
hacerlo.
Tamaño de la internet profunda
La internet profunda es un conjunto de sitios web y bases de datos que buscadores comunes no pueden encontrar ya que no están indexadas. El contenido que puede ser hallado dentro de la Internet profunda es muy amplio.
Se estima que la Internet Profunda es 500 veces
mayor7 que la Internet Superficial, siendo el 95% de esta información
públicamente accesible.
Bibliografía
https://es.wikipedia.org/wiki/Internet_superficial
https://es.wikipedia.org/wiki/Internet_profunda
https://es.wikipedia.org/wiki/Internet_profunda#/media/File:Deep_Web.svg
http://colombiadigital.net/images/stories/Noticias/xicebergredes98765.jpg.pagespeed.ic.u8sxJtLqzi.jpg
http://i1.mdzol.com/files/image/483/483127/52686e2a5fb57.jpg
http://www.kazemjahanbakhsh.com/figs/crawler.jpg
https://deepwebexplorer.files.wordpress.com/2014/04/dep.png
No hay comentarios:
Publicar un comentario