web+2.0


 * __Internet__: es un conjunto de redes interconectadas entre si**

Los servicios que nos prestan son: __ -**WWW:** __
 * Web1.0:** Las páginas de web1.0 no tiene RSS, lo cual impide la comunicación o compartir con otras páginas.


 * Web 2.0:** Con el nacimiento de las Web 2.0 aparece la RSS.


 * Web 3.0**


 * **WEB Superficial (Surface Web)**
 * **WEB Profunda (Deep Web)**


 * __Web superficial__**: Se conoce como www, tiene acceso público, la información debe ser evaluada y revisada. Las páginas son estáticas
 * __Web profunda:__** SE conoce como Web visible y se compone de:


 * 1) **__ Contenido dinámicas __** : Retornan en respuestas a una búsqueda o accedidas por una sola vía.
 * 2) **__ Contenidos no enlazados __ : ** paginas que no tienen vínculos entrantes desde otras páginas.


 * 1) **__ Contenido de acceso limitado __** : requieren registrarse o que limitan el acceso a sus paginas, prohibiendo que los buscadores los incluyan en sus bases de datos
 * 2) **__ Contenidos “scripted”: __** son accesibles a través de enlaces producidos por JavaScript y Flash y el adobe (__son aplicaciones__, al tenerlos las maquinas se vuelven dinámicas), las cuales requieren un tratamiento especial.
 * 3) **__ Contenido no textuales __** : archivos multimedia, en otros formatos o “usenet”.

Se clasifican en:

ü **__Opaca__**: se compone de todas aquellas paginas que son excluidas por:

-__ EXTENSION DE LA INDIZACION __: por economía, no todas las páginas de un sitio son indizadas en los buscadores.

-__FRECUENCIA DE LA INDIZACION__: los buscadores indexan de forma periódica y la www cambia diariamente.

-__NUMERO MAXIMO DE RESULTADOS VISIBLES:__ se limitan a los 200 y 1000 documentos, si bien el número de resultado es mayor.

-__URL`S DESCONECTADOS:__ los buscadores presentan los resultados de base a la cantidad de referencias o enlaces a los sitios, caso contrario la pagina no será indizada.

ü **__Privada:__** las paginas web son excluidas por alguna de estas causas: - Se encuentran protegidas por contraseñas - Contiene archivos “robots.txt” - Contienen un campo “noindex” para evitar que el buscador índice la parte correspondiente al cuerpo de la página.

ü **__Propietaria:__** Incluye aquellas paginas en las que es necesario registrarse para tener acceso al contenido, ya sea de forma gratuita o pagada. Se dice que al menos 95% de la web profunda contiene información al acceso público y gratuito.

ü **__Realmente invisible__**: las paginas no son indizadas por las siguientes razones -Incluyen formatos como PDF, Flash, etc. programas ejecutables y archivos comprimidos Se generan dinámicamente a partir de datos que introduce el usuario Almacenan información en bases de datos, que no puede ser extraída a menos que se realice una petición específica.

¿Cómo buscar en la web invisible? Los buscadores tradicionales adicionales para la búsqueda de llamada web profunda También existen buscadores especializados en ese segmento de la web, que no solo buscan en la web superficial, sino también en la web invisible.


 * __ FORMAN PARTE DE LA WEB PROFUNDA __**

-**Las bibliotecas**: digitales, catalogo de bibliotecas, bases de datos bibliográficos -**Bases de datos.** -**Revistas electrónicas y archivos de documentos.** -**Documentos en formato no indizables** (pdf; ppt; doc; mp3; avi; etc.) -**Catálogos de editoriales. Directorios de publicaciones periódicas.** -**Repositorios de artículos de revistas, tesis y literatura gris.** -**Directorios de bases de datos.** -**Guías de sitios.** Revistas electrónicas, obras de referencia: enciclopedia, diccionarios, etc. -**Foro, blogs, noticias.** -**Sitios de remates**. Páginas blancas/amarillas, directorios. -**Revistas electrónicas**: en las que es necesario un registro previo y las que solo se puede recuperar la información mediante búsquedas en su base de datos -**Organismos públicos de gobierno ONG, etc. ;** que en sus sitios web disponen de consultas a sus bases de datos.
 * -Archivos (**instituciones y organismos de gobierno)