TÉCNICAS DE BUSCA
RELEVÂNCIA E EFICIÊNCIA APLICADAS A PESQUISAS

É engraçado lembrar o saudoso tempo em que um grupinho de pessoas marcavam para ir juntos a Biblioteca mais próxima da cidade. Bons tempos aqueles ? sentia-se o cheiro de livro por todos os cantos.

Hoje, vivemos outra realidade. Não precisamos mais sair de casa para podermos consultar sobre determinado assunto, comprar um CD, um livro etc. Hoje temos a Internet, que, sem sombras de dúvida, realizou um grande boom na sociedade. O mundo está distante de nós por um click.

Porém, um inconveniente ainda permanece entre nós: a capacidade de realizar uma busca eficiente. Na verdade, a maioria das pessoas nunca ouviu falar sobre isso. Simplesmente, entram no site predileto de buscas, e digitam o que quer. Existe um "universo" de informações além disso!

Na recuperação da informação, a estratégia de busca pode ser definida como um conjunto de protocolos que torna possível o encontro entre a pergunta informada e sua respectiva informação armazenada em uma base de dados.
Preparar uma estratégia de busca, bem como selecionar adequadamente um banco ou uma base de dados a ser consultada para responder a uma pergunta específica, exige do usuário certos conhecimentos prévios (mecanismos de busca do banco de dados, lógica booleana e outros recursos oferecidos).

Atualmente, o usuário comum terá de adquirir conhecimentos básicos sobre os procedimentos de busca adequados a necessidades informacionais específicas.

Os quatro escolhidos
Para este trabalho acadêmico, foram escolhidos quatro buscadores conceituados de pesquisa: Google, Yahoo!, Ask.com e Lycos.

Todas as técnicas aqui apresentadas funcionam nos quatro buscadores selecionados para o estudo, exceto quando indicado.

Pesquisando em Títulos
Esta é considerada uma das técnicas básicas que conseguem trazer mais páginas relevantes nos resultados da pesquisa.
intitle: restringe a busca para os títulos da página Web. Esta palavra-chave retorna documentos que possuam uma palavra específica no título do documento.Para, por exemplo, encontrar documentos contendo a palavra Marte no texto, utilizaremos a sintaxe intitle:marte. Poderemos também especificar na busca quando não queremos que determinado site não apareça nos resultados, bastando utilizar a sintaxe marte -site:nase.gov.

allintitle: quando digitamos o prefixo intitle:, garantimos a recuperação de apenas uma palavra nos títulos das páginas. No caso do allintitle:, ele garante que todas as palavras digitadas estarão no título da página Web. Se quisermos que uma página Web possua o título de sistemas operacionais, utilizamos a sintaxe allintitle:"sistemas operacionais".
Obs: O uso do prefixo allintitle: funciona da mesma forma que se digitássemos o intitle: na frente de cada palavra pretendida.
Pesquisando em Textos

O prefixo intext: ajuda a procurar somente por textos no corpo da página, ou seja, elimina URLs, ignora títulos e links. Apesar do seu uso limitado, é muito importante para encontrar palavras-chave que poderiam ser muito comuns em URLs ou link de títulos.

Exemplo:
intext:html
intext:"br.yahoo.com"
Obs: podemos, da mesma forma, utilizar a sua variação: allintext:.

Pesquisa em URLs
Podemos restringir nossas pesquisas as URLs das páginas. Utilizando o prefixo inurl:, podemos encontrar sites que possuam uma palavra específica dentro da URL. Para encontrar, por exemplo, sites que contenham a palavra "Beatles" na URL, podemos digitar inurl:beatles.
Obs: podemos também utilizar a variação allinurl:, que também encontra palavras listadas em URLs.

Pesquisa por Âncora de Link
Uma âncora de link é o texto descritivo de um determinado link. O prefixo inanchor: pesquisa por texto nestas âncoras. Para pesquisarmos por âncoras contendo a palavra "Linux", utilizaremos a sintaxe inanchor:Linux.

Pesquisa por Sites
Utilizando a sintaxe site:, podemos limitar a pesquisa tanto por domínio de um site ou domínio de level elevado.

Exemplo:
site:edu
site:gov
site: ar
Obs: podemos utilizar alguns recursos, principalmente no Yahoo! e no Lycos, que ajudam ainda mais a refinar a pesquisa. O prefixo hostname: limita os resultados a um específico host em um site.

Pesquisa por Links
O prefixo link: retorna, como resultados, uma lista de páginas que realizam a ligação a uma URL específica. Este é um recurso interessante, pois permite-nos avaliar a popularidade de uma página específica, encontrando sites que inseriram o link da página em particular.

Exemplo:
link:www.mixculturainformacaoearte.com
Obs: O Yahoo! possui ainda o recurso linkdomain:. Ao invés de uma página específica, este prefixo procura por qualquer link de um domínio específico. Se estivéssemos procurando por páginas que possuam link com o "www.globo.com", por exemplo, poderíamos digitar linkdomain:globo.com.
Busca por Extensão

Caso queiramos procurar por um arquivo em um formato específico, utilizamos o operador filetype ou, simplesmente, ext:

Inclusão Digital filetype:pdf
Software Livre ext. ppt

Pesquisa por Sinônimos
Colocando, por exemplo, a palavra auto, juntamente com o caractere (~) na caixa de pesquisas, o Google recuperará páginas com o termo procurado e o seu sinônimo ? neste caso, carros, caminhões, automóveis etc.

Exemplo: ~auto

Principais Aspectos da Lógica de Boole

Lógica de Boole

Batizada em homenagem ao matemático britânico George Boole, este tipo de busca estabelece a possibilidade de busca de palavras em um texto, condicionando a exibição de resultados a valores lógicos.
Os operadores booleanos baseiam-se na álgebra de Boole e permitem efetuar operações de caráter lógico-matemático. Estes operadores são: AND (E), OR (OU) e NOT (NÃO). A utilização destes operadores pode tornar a busca da recuperação muito mais enfocada, produzindo resultados mais precisos.

OR

Ao utilizar o operador OR, amplia-se a busca, porque um número maior de documentos vai satisfazer este critério; qualquer um dos termos será suficiente para o documento recuperado. Quanto mais palavras entram conectadas por OR, mais documentos serão obtidos. Desta forma, concluímos que o operador OR desempenha uma função aditiva, tendo como resultado uma soma lógica. No Lycos, por exemplo, o operador OR poderá ser substituído pelo caractere ( | ). No Yahoo! e Ask.com o operador OR deverá ser digitado em caixa alta.

AND

Os volume de documentos recuperados pelo operador anterior, pode ser bastante excessivo. Assim, podemos estabelecer prioridades ou agrupar os termos em subconjuntos em diferentes aspectos. Quanto mais termos ou conceitos combinarmos em uma busca utilizando o operador AND, menos registros irá recuperar, ou seja, recuperamos apenas aqueles documentos que contenham ambos os termos informados. Concluímos desta forma, que o operador funciona de forma conjuntiva, culminando em um produto lógico.
Interessante notar alguns pontos:

No Google e Yahoo!, o AND já é automaticamente inserido na pesquisa a cada espaço entre as palavras que inserimos. Já no Lycos e no Ask.com, o AND é substituído pelo operador (+).

NOT

O operador NOT exclui determinados registros dos seus resultados de busca. Concluímos assim que o operador NOT possui ação substitutiva, ou seja, este operador produz uma diferença lógica.
No Yahoo e no Lycos, o NOT é substituído pelo operador (-).

NEAR

O NEAR é um dos recursos desenvolvidos para tornar a busca booleana ainda mais eficaz e precisa.
Quando utilizamos o AND, os termos no documento encontrado podem ocorrer em qualquer parte do mesmo. Porém, tratando-se de um documento grande, muitas palavras poderão gerar alguns inconvenientes que realmente não são objeto do documento.
Para ter certeza que os termos digitados para a pesquisa estarão próximos um do outro, podemos utilizar o operador NEAR, cuja tolerância varia muito entre os sistemas de busca.

Exemplo:
Cachorros near Gatos
Linux near Windows

Truncamento

O truncamento é, basicamente, a redução da extensão de uma palavra, cujo o resultado pode ou não coincidir com o propósito desejado.
Podemos definir o Truncamento em dois tipos distintos: aberto (é possível substituir alguns caracteres e recuperar documentos que trazem termos com a mesma semântica) e fechado (substitui-se um único caractere).

Exemplo do tipo aberto:
Music*

No caso acima, o truncamento localizado a direita, serão recuperados: Músico, Música, Musical, Musicista, Musicalidade etc. Caso o truncamento fosse localizado à esquerda, como em *metria, o sistema irá recuperar: Simetria, Audiometria, Trigonometria etc.

Exemplo do tipo fechado:
Planejamento (forma brasileira) e
Planeamento (forma portuguesa)

Para ter a certeza de recuperar todos os documentos que contem esse contexto na forma brasileira ou portuguesa, faz-se um truncamento fechado: plane?amento, normalmente, assinalando a lacuna por meio de um ponto de interrogação.

Principais Métodos Avançados de Pesquisa

Buscas Relacionadas

Em ambos os sites de busca aqui estudados, ao utilizarmos o operador related, a busca retornará páginas que são relacionadas ou semelhantes a que estamos pesquisando.

Exemplo:
related:google.com
related:football

Documentos Após Data Específica

O Ask.com oferece um recurso muito interessante. Caso pretendamos pesquisar por documentos publicados após a data específica que tenhamos digitado, utilizamos o prefixo afterdate:

Exemplo:
Judo afterdate:20100110

No exemplo acima, o Ask.com irá nos retornar todos os documentos publicados sobre judô após a data 10 de Janeiro de 2010.
Busca por Sinônimos
O Google disponibiliza um operador de sinônimos (~) para ajudar ainda mais em nossas buscas.

Exemplo:
~macaquear

O Google irá retornar documentos que possuam alguma ligação com a palavra digitada, como Chipanzé, Gorila, Macaco, etc.

Busca por Informação

Para termos uma pequena informação do site, ou seja, a sua definição, podemos utilizar o info, ou simplesmente, id. A pesquisa ficaria assim:
info:globo.com
id:globo.com

Busca Segura

O Google também preocupa-se com a qualidade dos resultados obtidos em uma busca. É muito comum, ao pesquisarmos sobre algum assunto, aparecer nos resultados conteúdos adultos. Isso pode ser extremamente prejudicial em tratando-se de crianças. Que tal ensinarmos algo para elas?
No Google, basta digitarmos o prefixo safesearch:, antes da palavra desejada.

Exemplo:
safesearch:romance
safesearch:namoro

Busca na Cache

A busca utilizando cache é aquela na qual procuramos por algum site que já tenha sido visitado por nós e o Google já indexou no seu banco de dados.

Exemplo:
cache:blogspot.com

Busca Curinga

A "busca curinga" é aquela onde substituímos determinadas palavras, letras ou até mesmo extensões pelo asterisco (*).
Se quisermos procurar por uma frase, mas não sabemos o sujeito desta, utilizamos este operador.

Exemplo:
"*fez curso de Java"
"*gritou com Madonna"

Busca por horário

Você já teve a curiosidade de saber quantas horas são em um determinado país? O Google te ajuda nessa. Basta, digitar uma pergunta, como no exemplo abaixo:

Exemplo:
What time is it in Argentina?
What time is it in Bangladesh?

Conversor de Unidades

O Google também pode converter unidades monetárias, métricas, bytes e muito mais.

Exemplo: 10 GB in bits

Conclusão

É através destas e de muitas outras técnicas que podemos aproveitar de forma eficiente os vários buscadores que temos disponíveis na Web. Afinal, pesquisar na Web é indispensável para todos nós! Aliando técnicas a estas pesquisas, a Internet torna-se ainda mais prazerosa, econômica e, além disso: torna-se uma fonte inesgotável de conteúdo, distantes de nós por apenas um click.