sexta-feira, 9 de dezembro de 2016

Deep Web - introdução

O que é a deep Web?

   O termo "Deep Web" ou em português "web profunda", tornou-se um termo geral para se referir a todo um conjunto de sites e servidores de internet.

   A Deep Web se associa a 80% da internet, enquanto esses 20% se associa a SurfaceWeb que é a internet convencional a usamos o tempo todo.

   Originalmente, a "Deep Web" eram os sites "invisíveis" - páginas que, por qualquer motivo, não apareciam em mecanismos de busca, especialmente no Google. Eram páginas que, para serem encontradas, necessitavam do uso de diversos mecanismos de busca em conjunto, além de ferramentas adicionais e ferramentas de pesquisa individuais de cada site.

 O termo se popularizou com uma definição mais compacta para se referir aos sites que necessitam do uso de programas específicos para serem acessados. O mais popular entre eles é o Tor, mas existem outros softwares, como Freenet e I2P

   Porém, como esses sites precisavam de ferramentas especiais para ser acessados, eles não apareciam em mecanismos de pesquisa e, assim, as duas definições não eram incompatíveis. No entanto, com o passar do tempo, parte desses sites de acesso exclusivo via Tor foi disponibilizada (via "pontes de acesso") na web normal - que não necessita de software especial. Com isso, o conteúdo que antes era dessa web "inacessível" foi parar até mesmo no Google. Acessar esse conteúdo, portanto, é tão fácil quanto acessar qualquer outro site. 

   É muito difícil saber com certeza se o termo Deep Web está sendo usado para se referir a um canal de acesso via Tor ou a páginas e serviços de acesso realmente limitado e restrito, independentemente da tecnologia.

  Camadas da DeepWeb ?

   Isso foi um fato que veio se generalizando a muitos anos sobre "Deep Web", muitos Sites, Blogs, jornais de televisão e até mesmo canais no youtube pregam ou pregaram a ideia que a Deep Web é formada por camadas, mas NÃO!, a Deep Web não é formada por camadas, mais sim por redes baseadas em P2P. Essa ideia de camadas foi tirada do Tor que usa em seus sistemas camadas de criptografia para fornecer maior anonimato ao seu usuário.

Que tipo de conteúdo há na Deep Web?

   Como a "Deep Web" se refere a qualquer conteúdo fora dos mecanismos de pesquisa, a definição é bastante ampla. Existe muito conteúdo legítimo disponível na web e que nem sempre pode ser encontrado com uma pesquisa em mecanismos de pesquisa geral. Um exemplo disso são decisões judiciais, que muitas vezes exigem pesquisas diretas nos tribunais onde tramitaram.

   A Deep Web também pode consistir de sites com conteúdo pessoal, páginas cujos donos decidiram não incluir em mecanismos de pesquisa por qualquer motivo, páginas que nunca receberam links de outros sites (porque só foram compartilhadas por e-mail, por exemplo) e também espaços para a troca de conteúdo ilícito, como pirataria. Como esses sites muitas vezes fornecem arquivos grandes para download, não é sempre prático manter esse conteúdo na "Surface Web"(internet convencional), onde as velocidades costumam ser menores.

Por que alguns sites ficam fora dos mecanismos de busca?

   Os mecanismos de busca, como o Google, precisam, em primeiro lugar, encontrar um site. Isso normalmente ocorre com links. Quando uma página que o Google já conhece coloca um "link" para outra página, o Google segue esse link e passa a incluir essa página em sua busca (um processo chamado de "indexação").

   Porém, mesmo que haja um link para a página, ela pode ainda bloquear mecanismos de pesquisa. Isso pode ser feito via rede (bloqueando os endereços IP da rede dos mecanismos de pesquisa) ou utilizando mecanismos oferecidos pelos próprios sites de busca que permitem a um site indicar qual conteúdo pode ser indexado. Um site pode facilmente determinar que a indexação de suas páginas é proibida e, nesse caso, elas não aparecerão nos mecanismos de busca mais comuns, que honram essas configurações.

    Alguns conteúdos exigem buscas específicas. As decisões Judiciais, por exemplo, só podem ser encontradas por alguém que sabe um número de processo ou a OAB de um advogado para pesquisar nos sites dos tribunais. Os mecanismos de pesquisa não têm essas informações e não "sabem" preencher o formulário. Por isso, esse conteúdo tende a ficar fora do alcance.
 
   Certos conteúdos também não podem ser indexados por causa do formato em que estão armazenados. Um conteúdo pode existir na web como um arquivo de áudio ou vídeo que o mecanismo de busca não consegue transcrever para texto. Nesse caso, o conteúdo também não vai ser encontrado, a não ser que você saiba especificamente o nome do arquivo ou título do arquivo multimídia.

Agradeço a todos que leram meu artigo, espero que tenham gostado <3

Quer fazer parte do Blog ?

 Meu Blog está apenas em seu inicio, o blog tem seu foco a DeepWeb. Você que se interessar, já digo que você não precisa ter a minima experiencia em DeepWeb, oque for preciso eu ensinarei...
Me mande um email para mais informações:

Nenhum comentário:

Postar um comentário