Eis as colunas já publicadas da série "Os Oráculos Digitais". Espero que
os acentos não causem problemas e que o conteúdo seja útil para você.
Veja no final deste texto como fazer sua inscrição na lista (gratuita)
Leitor Ajuda Leitor!
Sergio Charlab
----------------------------------------------------------------------
SÉRGIO CHARLAB (charlab@ax.apc.org) (http://www.charlab.com.br) é
Editor-Chefe de Seleções do Reader's Digest (http://www.selecoes.com.br),
colunista de "Ciberespaço" do Jornal do Brasil e autor dos livros
"Você e a Internet no Brasil" (http://www.charlab.com.br/ch2505.html)
e "O Seu Futuro Eletrônico".
----------------------------------------------------------------------
........................................................................
Os oráculos da Internet: Altavista (tutorial, parte 1)
Tantas são as informações existentes na Internet que seria quase
impossível encontrar o que se procura sem a ajuda dos mecanismos de
busca, espécies de oráculos digitais. Cada mecanismo de busca existente
na Internet pode ser comparado aos antigos oráculos, divindades que
respondiam a consultas e orientavam os crentes na Grécia, Egito e entre
os hebreus, fenícios e babilônios.
+++
Mas se os mecanismos de busca estão relacionados aos oráculos, então
para mim o Altavista (http://www.altavista.digital.com) é uma espécie de
Oráculo de Delfos (o mais popular de todos). Com menos de um ano de
vida, o Altavista, criação gerada casualmente na Digital Equipment
Corporation e oportunamente utilizada para fins de marketing, é
certamente poderoso. Colocou na sombra, desde o primeiro dia, todos os
seus competidores, anunciando uma capacidade fenomenal de acompanhamento
do World Wide Web. Hoje, assegura ter um banco de dados com 30 milhões
de páginas -- menos do que as 54 milhões alegadas pelo HotBot
(http://www.hotbot.com) ou as 51 milhões alegadas pelo Lycos
(http://www.lycos.com) -- de mais de 275 mil servidores, além de 4
milhões de artigos Usenet retirados de 14 mil newsgroups. Recebe quase
200 acessos por segundo! Apesar do que diz o Lycos, o Altavista parece
ser maior, mais rápido e mais versátil do que qualquer outro mecanismo
de busca.
Outros surgiram depois dele, mas não creio que se possa, em qualquer
lista de usuário, prescindir do Altavista pelo menos entre os três mais
do ranking de mecanismos de busca.
O uso do Altavista é tão simples ou tão complexo quanto o desejo do usuá
rio. Quanto mais genérica for sua busca, ainda que o Altavista se
preocupe em apresentar os resultados em um "ranking" de incidências,
menor a chance de você encontrar algo útil nas primeiras citações e
referências apresentadas. Portanto, é preciso aprender a ser específico.
E, felizmente, o Altavista permite refinar a busca até um nível que
poucos imaginam. Minha expectativa é de que este texto sirva para você
conhecer e aprender a usar estes refinamentos no dia-a-dia de suas
navegações na rede. Outros mecanismos de busca, do conhecido "Yahoo!" ao
brasileiríssimo "Yaih?" serão vistos nas próximas semanas desta série
tutorial, "Os oráculos da Internet". Avise aos seus amigos para que não
percam e escreva para mim no endereço (charlab@charlab.com.br) dando sua
opinião sobre os tutoriais.
+++
Na tela principal de acesso do Altavista vê-se em destaque um
fino e longo retângulo com fundo branco. É ali o local para que o usuá
rio insira sua "pergunta" ao oráculo digital. Basta uma única palavra
seguida de "enter" ou de um clique no botão à direita, o retângulo em
fundo cinza com a palavra "submit". O Altavista, movido por poderosos e
rápidos servidores, vasculhará seu enorme banco de dados em busca de
citações da palavra. Em questão de segundos, uma lista das dez primeiras
citações será apresentada como resposta. A ordenação obedece um ranking
de incidência da palavra-chave, do maior número para o menor.
Antes de iniciar sua busca, porém, você pode ainda tomar duas decisões.
Se vai fazer um "Search the Web" ou um "Search Usenet" e se deseja os
resultados apresentados em "Standard", "Compact" ou "Detailed" forma. A
"Detailed" (detalhada) é igual a "Standard". A "Compact", naturalmente,
é mais resumida. Na busca em newsgroups Usenet ocorre o oposto: a
"Standard" é igual a "Compact". Para configurar isso basta clicar nas op
ções que aparecem imediatamente acima do retângulo em que você insere
suas palavras-chaves. Faça várias experiências para fixar as
circustâncias em que cada configuração lhe trará o melhor proveito.
+++
Em vez de uma só palavra, o usuário pode experimentar duas ou mais
delas. Se quiser ter certeza de que duas ou mais palavras apareceram tal
qual digitado na busca, certifique-se de que usou sinal de aspas antes e
depois do grupo de palavras. Exemplo: "Jornal do Brasil", traz como
resultado (no momento em que escrevo) 2000 referências, sendo que a
primeira é logo a que se procura, com a home-page do JB. Sem as aspas, o
Altavista vai procurar pela incidência, separadamente ou não, das
palavras "Jornal", "do" e "Brasil": Jornal:10879; Brasil:107493; do:
10609250.
Em vez de aspas, se preferir, você pode usar ponto e vírgula separando
as palavras (Jornal;do;Brasil). Não se preocupe em usar maiúsculas ou
minúsculas, porque neste exemplo o Altavista não faz distinção e buscará
todas as palavras. Letras maiúsculas no meio de uma palavra forçam o
Altavista a procurar uma palavra idêntica. Experimente buscar resultados
com a palavra "Brasil" e depois com "BrAsil" (com o "A" maiúsculo) e
você terá a medida da diferença.
É possível também indicar na busca palavras que se quer encontrar, mas
outras que não se quer. Esta é a solução para o grande número de
queixosos que vivem dizendo que não conseguem resultados úteis diante da
avalanche de citações obtidas pelo Altavista. Eis um exemplo:
+rio -"rio de janeiro". Ou seja, sinal de "+" entra; sinal de "-" fica
de fora. No exemplo, excluindo o Rio de Janeiro fica mais fácil procurar
citações da palavra "Rio". Existe um http://www.rio.com/ que nada tem a
ver com o Rio de Janeiro.
Muito útil é o asterisco na terminação de uma palavra, como em jorna*,
que serve para buscar citações de "jornal", "jornalismo", "jornalista" e
assim por diante. O asterisco é uma verdadeira mão na roda quando você
estiver em dúvida sobre a ortografia de uma palavra, porque pode também
ser usado no meio. Exemplo: exce*ao. Mas cuidado com as respostas,
porque se cair em Portugal, exceção ganha um "p" e vira "excepção"!
+++
E como é que funciona o algoritmo usado pelo Altavista para fazer o
ranking de respostas?
Dá maior peso se a palavra ou expressão buscada for encontrada entre as
primeiras a aparecerem no documento, especialmente nos títulos. A
distância entre as palavras também pesa favoravelmente caso seja pequena
(quando as palavras estão próximas). A quantidade, naturalmente, também
pesa muito. Conheço páginas em que os autores, procurando "enganar" as m
áquinas dos mecanismos de busca que utilizam estas regras para ponderaç
ões, escrevem, logo no alto, 200 vezes uma mesma palavra. Há toda uma
técnica para "fazer sucesso" em mecanismos de busca. Considerando que a
maioria dos navegantes hoje vai parar em alguma home-page a partior de
uma busca, recomendo aos designers de Web que passem a dar tanta atenção
à estas páginas de acesso via mecanismos Web quanto às próprias
home-pages. Muitos designers planejam dedicadamente o caminho de acesso
dos visitantes a partir da home-page e se supreendem de ver que a
maioria entra por alguma "porta dos fundos". Com paciência, é possível
descobrir como "enganar" as ponderações dos mecanismos de buscas para
que sua página seja sempre apresentada entre as primeiras quando alguém
utiliza determinadas palavras-chaves que lhe interessam.
+++
Mais poder de busca pode ser obtido utilizando uma série de palavras
especiais reconhecidas pelo Altavista para direcionar a procura. Eis
algumas das palavras: anchor, applet, host, image, link, text, title,
url. Em todos estes casos, a utilização é simples. Basta usar a palavra,
seguida de dois pontos ":" e da expressão que se deseja localizar.
Exemplos:
* anchor:clique aqui -- localiza as aparições das palavras "clique aqui"
dentro de um hyperlink, como em Clique aqui.
* applet:count.class -- busca os Java applet class com este nome, e que
provavelmente indicam a existência de um contador em Java. Veja em
http://www.informatik.hu-berlin.de/~mhunger/.
* host:jb.com.br -- busca domínios.
* image:brasil.gif -- busca imagens pelo nome (e é ótima solução para
pesquisa escolar dos seus filhos...).
* link:http://www.jb.com.br/ -- busca referências a outras URLs e
permite que você avalie a popularidade de uma home-page.
* text:sexo -- busca páginas por uma palavra que apareça no texto
* title:charlab -- busca páginas por uma palavra que apareça no título
* url:charlab -- busca páginas com uma palavra que apareça na URL
Sérgio Charlab
charlab@ax.apc.org
http://www.jb.com.br/charlab.html
Os oráculos digitais: Altavista (tutorial, parte 2)
O Altavista, quando surgiu, também surpreendeu ao oferecer potentes
buscas na Usenet. Trata-se do local em que usuários trocam mensagens
sobre temas específicos, os chamados newsgroups. Existem mais de 20 mil
newsgroups. O Altavista mantém um extraordinário arquivo de todas as
palavras de 70% destes newsgroups. E você pode e deve usar este recurso,
bastando para isso que, ao iniciar a busca, não se esqueça de mover o
menu de opção, trocando "web" por "usenet".
Numa busca Usenet, é possível procurar pelos campos das mensagens que lá
circulam, como "from", "newsgroups", "summary", "keywords". Se assim é,
então o leitor mais atilado já percebeu que o Altavista pode ser usado
como o "servidor" Usenet que muitos de nós, aqui no Brasil, não dispõem.
Experimente, por exemplo, "newsgroups:soc.culture.brazil" e você lerá as
mensagens que foram postadas no newsgroup "soc.culture.brazil".
Em muitos casos, a busca na Usenet é muito oportuna. Ali se pode ler
opiniões sobre assuntos tão variados como uma doença, um software, um
esporte. E você, ao ler as mensagens, pode pegar o e-mail de alguém e
escrever, fazer uma pergunta, começar uma amizade, trocar um favor. Eu
escrevi a palavra "Varig" e encontrei 94 respostas. Ali já se discute em
primeira mão as novas cores desta companhia aérea. Aliás, ao lado da
Iberia e da Alitalia, a Varig é considerada uma das mais anacrônicas no
que diz respeito à pintura de seus aviões. Sabe-se de tudo lá na Usenet.
Mas a busca mais "terrível" é o "from:e-mail". Pense bem: tudo o que
você escreve está sendo gravado lá e poderá ser lido pelos outros, na
semana seguinte, ou cinco anos depois (no caso de outros arquivos
Usenet). Suas palavras podem voltar para assombrá-lo! Seja cauteloso!
Quem testar "from:charlab@ax.apc.org" não encontrará muita coisa, pois
eu tenho um e-mail secreto para estas coisas. Mas você pode também
adicionar a linha "X-no-archive: yes" às suas mensagens na Usenet. Isso
impedirá que o Altavista as catalogue.
***
Há uma dica interessante sobre o Altavista para quem tem home-page e
fica curioso sobre a forma com que este mecanismo de busca a cadastra.
Você pode cadastrá-la a partir do "link" "Add URL", lá embaixo, na pá
gina principal do Altavista, ou então do Submit It
(http://www.submit-it.com) ou ainda não fazer nada e esperar que, mais
cedo ou mais tarde sua página estará registrada no Altavista pelo
conteúdo das palavras que existirem lá. Mas você pode usar uma "tag"
especial para que a definição do Altavista siga o modelo que desejar.
Pode também definir as "keywords". Por exemplo:
Não ultrapasse os 1.024 caracteres. Desta forma, o Altavista não
precisará reproduzir as primeiras palavras de sua home-page, sejam elas
quais forem. Poderá usar a sua definição. Quero ver agora se você
descobre como fazer para aumentar suas chances de o Altavista
classificar seu site entre os primeiros que aparecem na relação de
respostas diante de uma palavra-chave que lhe interessa. Por exemplo:
"jornal brasil" (mesmo sem as aspas) chama logo uma página do JB.
Você conseguiria ser habilidoso o suficiente para criar uma página
fictícia com a palavra-chave "sexo" de modo que ela aparecesse em
primeiro, entre as mais de 10 mil da resposta, numa busca no Altavista?
Se conseguir, me avise, porque será notícia e você vai contar aqui como
fez.
Isso parece uma brincadeira, mas não é. Hoje, tão importante quanto o
esforço dos designers para fazer uma bela home-page que chame e conduza
o visitante pelo site, é manter as portas "dos fundos" preparadas para
receber acessos de quem chega via mecanismos de busca e não está nem aí
para sua página principal. Se estiver planejando um site, pense nisso.
***
Também é possível usar os operadores AND, OR, NEAR e NOT ("e", "ou",
"próximo" e "não") nas buscas no Altavista. AND, OR e NOT são mais ou
menos claras. O NEAR garante a você que as duas palavras ou frases de
sua busca não deverão estar mais de dez palavras afastadas. Não é tão fá
cil assim perceber as nuances destas possibilidades avançadas ou fazer a
melhor escolha na hora de preencher a busca. Mas se você testar, evitar
a simplicidade de colocar uma palavra só, verá que não há razão para
muitas queixas sobre a quantidade de respostas do Altavista. Seus
resultados serão rápidos e certeiros.
Quando você ficar afiadíssimo, será tal qual Delfos e seu famoso orá
culo. Diga a seus amigos que esta série do JB, que começou na semana
passada, continua na próxima terça em sua terceira parte. Até lá!
Sérgio Charlab
charlab@ax.apc.org
http://www.charlab.com.br
Os Oráculos Digitais: HotBot (Tutorial, parte 3)
O que é o que é? Azul piscina com verde abacate, enorme, e com um
buraquinho no meio para você, digamos, exercitar a interatividade?
É o HotBot (http://www.hotbot.com), que anuncia o maior arquivo de
páginas Web existente, com 54 milhões de URLs arquivadas. Quando surgiu,
em maio de 1996, vinha com uma assinatura de peso: a da revista Wired!
Era o ingresso da Wired no mercado de mecanismos de busca (search
engines), que então já movimentava mais de uma dezena de empresas, todas
disputando atenção dos usuários e o dinheiro de anunciantes e
investidores de Wall Street.
Funciona com tecnologia do Inktomi (http://www.inktomi.com) e passou um
sufoco danado nas primeiras semanas de lançamento, quando um monte de
gente correu para usá-lo e o HotBot não deu conta do recado. Mas se
refez e hoje, de um modo geral, não parece ser mais lento do que o
Altavista, para citar apenas a usual referência de rapidez.
* * *
O HotBot, como qualquer mecanismo de busca, é simples de usar. No
pequeno menu acima do espaço para você colocar suas palavras-chaves ou
expressões, pode-se escolher antes a busca por todas as palavras ("all
the words"); qualquer uma das palavras ("any of the worlds"); pela
expressão ("the phrase"); pela pessoa ("the person") ou pela URL ("the
URL").
"Tiririca" usada como palavra-chave (você escreve a palavra "Tiririca"
no retângulo longo e estreito, de fundo branco, e aperta sua tecla
"enter" ou clica com o mouse no botão à direita com a figura do alvo,
onde está escrito "search") traz 57 citações no Hotbot (contra apenas 31
no Altavista). "Tiririca Florentina" traz 11 citações. E assim vai:
quanto mais precisa for sua busca (em número de palavras utilizadas),
mas focado será seu resultado.
Ainda mais específico do que duas palavras é uma expressão de duas
palavras. Se você procura informações sobre o conjunto "Iron Maiden" não
deve escrever as palavras "iron" e "maiden", mas sim a expressão "Iron
Maiden". A resposta não levará em conta a quantidade de vezes que, por
exemplo, a palavra "iron" aparece, mas sim a quantidade de vezes que
estas duas palavras aparecem tal qual você as escreveu, lado a lado e
com um espaço entre elas. Isso significa uma queda de 15.672 citações
para 8.738. (Naturalmente, o Iron Maiden é muito popular, mas vamos ver
logo adiante o que fazer num caso destes, diante de tão numeroso
resultado de uma busca.) No HotBot, a terminologia disso é "phrase" em
vez de "all the worlds". Prefira usar sempre "phrase" quando for
possível. O Altavista, já vimos, é menos amistoso, pois em vez de
oferecer a opção em menu (como o HotBot, que ainda oferece a notação
de aspas) apenas aceita o posicionamento dos sinais de aspas.
* * *
Coisas interessantes por trás da tecnologia do HotBot são a
identificação do browser do usuário, de modo que a página apresentada
seja adequada à capacidade de exibição do browser em sua respectiva
versão, e a possibilidade de exibir propaganda valendo-se desta
informação e também das palavras utilizadas na busca. Mas há muitas
promessas ainda. Não é capaz, por exemplo, de fazer uma busca por
proximidade de palavras, tal qual o Altavista.
Mesmo assim, o HotBot é muito mais do que um mecanismo de busca cor de
abacate. Você pode fazer buscas por tipo de arquivo, local geográfico,
domínio ou Web site. As coisas começam a acontecer quando você resolve
deixar de ser igual à média das pessoas e arrisca clicar a palavra
"modify", à esquerda, na área sob fundo azul. Trata-se da possibilidade
de adicionar ou retirar itens de busca. Com o menu "must", "should" e
"must not" você define o que deve entrar ou não. "Jornal do Brasil" como
expressão de busca e "Charlab" usado sob a configuração "must not" trará
como respostas as páginas do "JB" sem referências ao meu nome. "Must" e
"should" fazem a mesma coisa e a sutil diferença entre os dois é que o
segundo dá ênfase à palavra usada, mas mostra todas as respostas; o
primeiro só mostra as respostas que contenham a palavra usada naquele
campo.
Lembra das 8.738 citações do Iron Maiden? Vamos reduzi-las! Digamos que
você queira ver apenas as páginas que sejam frequentemente atualizadas.
Nesse caso, pode ser uma boa idéia usar o "must" com uma palavra
adicional, como "Blaze", nome do novo vocalista do Iron Maiden. A
resposta passa a ser 425 citações. Uma vitória diante das 8.738 ou das
originais 15.672. Digamos que você nem queira ver coisas que falem do
passado da banda. Então, clique mais uma vez no sinal de mais "+" ao
lado do botão "modify" e use o "must not" com a palavra "bruce"
(vocalista anterior e que passou o maior período de anos com a banda).
Resultado: 160. E se você quiser saber quais são as páginas mais
completas, que respeitam o presente e o mais remoto passado? Use três
"must": "blaze", "bruce" e "di'anno" (este último, o primeiríssimo
vocalista da banda). O resultado é de apenas 38, mostrando que a memória
anda curta.
Naturalmente você não precisa conhecer a história do Iron Maiden para
aprender a utilizar o HotBot! É um exemplo. No seu campo de interesse,
você poderá agir de forma semelhante. Os melhores resultados de uma
busca virão sempre a partir de uma boa dose de reflexão ("elementar, meu
caro Watson!").
* * *
Mas se você realmente quiser deixar de ser igual à média das pessoas,
clique no botão "expert", logo embaixo do "modify". Vá brincando por
ali. Semana que vem você confere, na continuação da série, as
informações que eu preparei descrevendo estas novas opções. Mas quer uma
dica (para usuários do Windows 95 apenas)? Busque pela palavra
"powertoys" e use a condição "Media Type", "Extensions" e escreva "exe".
Eu instalei aqui e gostei. Mas se você o fizer, é por sua conta e risco.
* * *
Esta foi a terceira parte da série sobre os mecanismos de busca e
indexadores da Internet. Quem perdeu uma das partes anteriores pode
pedir o texto digital enviando mensagem para este endereço especial:
charlab@charlab.com.br. Histórias verdadeiras, instrutivas ou
pitorescas, sobre o uso de mecanismos de busca são bem-vindas e devem
ser enviadas para meu endereço usual, charlab@ax.apc.org. As melhores
serão publicadas, com o crédito do autor. Também estou reunindo piadas
relacionadas com a Internet. Serão publicadas, com crédito de quem as
enviou, em alguma data entre hoje e o dia primeiro de abril. Inclusive.
Sérgio Charlab
charlab@ax.apc.org
http://www.charlab.com.br
Os Oráculos Digitais: HotBot (Tutorial, parte 4)
O mecanismo de busca azul-piscina com verde-abacate, o HotBot
(http://www.hotbot.com) - que enche o peito de orgulho ao anunciar seu
arquivo (o maior!) de 54 milhões de páginas Web, e a disposição de
vasculhar totalmente o World Wide Web a cada sete dias, encontrando
novas páginas e atualizando as existentes - (ufa!) ainda é o nosso tema.
A modalidade "expert" (clique no botão "expert", logo embaixo do
"modify") confere enorme versatilidade ao HotBot e você deve aprender a
usar estes recursos para alcançar melhores resultados em suas buscas.
* * *
A primeira opção de detalhamento de busca é fazer alguma restrição de
data. Usei a palavra "restrição" porque é isso, afinal que queremos,
não? Recursos que ajudem a evitar que uma busca apresente como resposta
milhares de possibilidades (quem teria tempo de checar uma a uma?). O
que desejamos é uma resposta de poucas dezenas de itens, bem no alvo, e
arrumados segundo um ranking correto de importância para os objetivos da
nossa busca. (O ranking do HotBot é feito a partir de uma ponderação
entre várias coisas, como a frequência com que a palavra ou expressão
procurada aparece na página, no título - sempre conta muito! -, na tag
"meta" - esta é uma tag especial para os mecanismos de busca -, etc.)
Ao restringir a data, nos casos em que isso for conveniente, você
limitará as respostas do HotBot àquelas compreendidas no período da sua
escolha. A opção "whenever" clicada não limita nada. Qualquer data
serve. (E por data entenda-se o dia, mês e ano em que, pela primeira
vez, o HotBot encontra uma página que inclui em seu arquivo.) Por
exemplo, buscando referências com a palavra-chave "charlab" encontro
entre as dez primeiras respostas nove ligadas ao conjunto de páginas
chamado "Visita de Sérgio Charlab ao Recife" (quando lancei meu livro
lá, no dia 8) onde a data é 9 de fevereiro de 1996. (Quem quiser ver os
resultados de uma câmara digital Casio, de pouco menos de US$ 500, deve
ir até lá: http://www.truenet.com.br/studioweb/charlab/index.html. As
imagens foram feitas com a mesma câmara que, dias mais tarde, se
tornaria famosa ao reproduzir para o mundo imagens do Carnaval de
Olinda.)
Voltando ao HotBot, pode-se escolher uma data que sirva de referência
para uma busca "depois" ou "antes" dela ("after" e "before"). Colocando
"after" 1 de março de 1996 eu só encontro uma página dos meus amigos do
Recife (que traz uma data mais recente, provavelmente porque foi
atualizada), e o número de respostas à palavra "charlab" cai de 977 para
696.
Uma linha mais embaixo, se eu limitar para "within the last" (dentro dos
últimos) "1 month[s]" (1 mês) - não esqueça de clicar na bolinha à
esquerda da opção! -, fico sabendo o que é que o HotBot anda fazendo
recentemente em suas buscas pela Internet: 51 respostas com "charlab".
* * *
Descendo na nossa oferta de restrições de busca do HotBot, temos "media
type". Ali você pode selecionar o tipo de arquivo que deseja ver o
HotBot procurar nas suas buscas. Para dar uma idéia de como isso é
interessante, vamos ver um exemplo onde você acaba de descobrir a
tecnologia de shockwave, da Macromedia (recomendo a quem ainda não
instalou em seu browser; visite http://www.macromedia.com).
Naturalmente, fascinado com o shockwave, você agora quer procurar
páginas que tenham arquivos shockwave. Nada mais fácil! Em vez de
escrever "shockwave" como palavra-chave, você simplesmente clica no
quadradinho correspondente junto à área de "media type" do HotBot. Vai
resultar numa montanha de páginas com arquivos shockwave. Você pode
ainda escrever logo a extensão que está procurando (shockwave = cdr)
junto ao quadradinho "Extensions".
Usando o recurso "media type" você encontra facilmente páginas e
arquivos contendo Java, JavaScript, VRML (3D), acrobat, shockwave, e até
os "smileys" - aquelas carinhas que mostram as emoções de quem escreve
na Internet. :-) Como fazer, por exemplo, para saber quais páginas
ligadas ao Brasil têm algum recurso de shockwave? Escreva "brasil" como
palavra-chave e clique em "media type" shockwave.
Então imagine você ali, diante da sua home-page em construção e querendo
procurar uma imagem da bandeira do Brasil. O que fazer? HotBot! Mas não
faz sentido escrever "brasil" como palavra-chave e marcar em
"Extensions" escrevendo "gif". Melhor é usar apenas como palavra-chave
"brasil.gif". O resultado serão páginas que possuem uma imagem chamada
brasil.gif. Há boas chances de que você encontre, então, sua bandeira
nacional.
Não se preocupe em seguir caminhos errados algumas vezes. Mas não deixe
de recolher os ensinamentos resultantes dos erros. Assim você vai
apurando sua técnica.
* * *
Em "location", o próximo item de restrições do HotBot, você pode
selecionar suas buscas por domínio - seja por nome ou pela geografia.
Posso, assim, limitar minha busca ao servidor jb.com.br (ou qualquer
outro) para procurar apenas nele. Outro exemplo é quando escrevo
"ercília" e mando procurar somente em "uol.com.br", e assim encontro um
bate-papo com a simpática colunista da Folha de São Paulo. Ou posso
escolher como limitação geográfica "South America" (se quiser procurar
apenas no Brasil escreva ".br" no item "Cyberplace" ou visite os
mecanismos brasileiros, claro - e por falar nisso, já visitou
http://www.edirectory.com). Com o HotBot e estes recursos, posso saber
quantas vezes a palavra "charlab" aparece no Web só no Brasil (866), nos
EUA (89) e Europa (16) .
* * *
Finalmente, em "show" você pode controlar o número de referências que
deseja obter por vez como resposta do HotBot (às vezes é muito
aborrecido ir de 10 em 10, mas o carregamento de uma página com 100
referências pode ser muito lento).
O que o HotBot não faz (e neste sentido perde feio para o Altavista):
* Não faz busca por proximidade onde se obtém respostas que levam em
conta a distância entre duas palavras que usadas como chaves na busca.
* Não faz busca por "strings" parciais. Você não pode, por exemplo,
buscar a Torre Eiffel sem saber como se escreve "Eiffel". No Altavista,
você pode procurar por "Eif*l" e achar as referências da famosa torre,
além de aprender a ortografia correta.
Além disso, tem alguns bugs (defeitos) notáveis.
* * *
Esta foi a quarta parte da série sobre os mecanismos de busca e
indexadores da Internet. Se você está gostando, avise aos seus amigos da
Internet. Ainda vou escrever sobre vários mecanismos - inclusive os
brasileiros - e softwares de busca. Eu acredito que dominar o uso das
técnicas de busca nestes "oráculos digitais" é a melhor estratégia para
quem quiser sentir-se à vontade com a Internet.
Quem perdeu uma das partes anteriores pode pedir o texto digital
enviando mensagem para este endereço especial: charlab@charlab.com.br.
(Como sou eu mesmo quem responde, sem ajuda de ninguém - se bem que
estou treinando o Jacques, meu filho de cinco anos, para isso... -,
excepcionalmente você terá que aguardar 15 dias, pois estou longe do
computador. Mas em compensação vai receber estas quatro e ainda as duas
próximas partes da série, de modo que se você não assina ainda o JB
poderá dormir até mais tarde nas duas próximas terças-feiras.)
Sérgio Charlab
charlab@ax.apc.org
http://www.charlab.com.br
----------------------------------------------------------------------
SÉRGIO CHARLAB (charlab@ax.apc.org) (http://www.charlab.com.br) é
Editor-Chefe de Seleções do Reader's Digest (http://www.selecoes.com.br),
colunista de "Ciberespaço" do Jornal do Brasil e autor dos livros
"Você e a Internet no Brasil" (http://www.charlab.com.br/ch2505.html)
e "O Seu Futuro Eletrônico".
----------------------------------------------------------------------
Os Oráculos Digitais: Lycos (Tutorial, parte 5)
As eleições já se foram e ninguém votou nele. E o slogan até que era
bom: "If It's Out There, It's In Lycos" ("Se existe, está no Lycos").
Mas o Lycos tinha tudo para ser candidato. Como muitos políticos, o
Lycos tem várias faces. Quem acompanha sua existência (foi um dos
primeiros a aparecer neste competitivo setor dos "oráculos digitais") já
viu pelo menos meia dúzia de tentativas de remodelação da página que
está em http://www.lycos.com. Ora o Lycos se assemelha ao Altavista; ora
ao Yahoo!. E recentemente mais parece uma feira livre (para não se
perder, consulte o mapa do Lycos em http://www.lycos.com/sitemap.html).
Não se deixe enganar. O Lycos, um serviço gratuito desenvolvido na
Carnegie Mellon University, e hoje chamado de Lycos, Inc., uma companhia
aberta com ações negociadas em Bolsas de Valores (NASDAQ: LCOS), a
despeito de padecer de falta de personalidade, é bom e poderoso. (Se bem
que o valor de suas ações andava em US$ 12.25 embora tenha chegado ao
máximo de 29.25 nas últimas 52 semanas.)
* * *
Vamos ver o que há por lá:
* Um mecanismo de busca (claro, ora pois!), que vasculha respeitáveis 51
milhões de URLs, o que o coloca atrás apenas do HotBot e oferece
arquivos de páginas com texto, sons, software, gráficos e video no World
Wide Web. Não é pouco, e por isso mesmo é que o Lycos faz seu marketing
afirmando que 41% de seus usuários não usam nenhum outro mecanismo de
busca.
* "Sites by Subject" é um superíndice por assunto, à semelhança do
Yahoo! (que pretendo comentar numa das próximas colunas). Excelente para
buscas a partir de um tópico.
* "Point Review" é uma classificação do World Wide Web, via Point
Communications, uma empresa que foi adquirida pelo Lycos. A Point
Reviews faz críticas e dá nota às páginas e atividades no Web.
* "Top 5% Sites" são as páginas classificadas e recomendadas para
visita, por grandes temas. Excelente para quem não está em busca de
informação específica, mas apenas disposto a encontrar páginas
interessantes sobre assuntos pré-escolhidos.
* Top News com um serviço de "últimas notícias" que, na verdade, é feito
de referências às notícias de dezenas de fontes variadas e de ótima
qualidade dentro do World Wide Web, nas áreas "Internacional",
"Esportes", "Internet", "Negócios", "Tempo" e "Pessoas".
* "City guide" é um banco de dados de 7.500 Web sites a partir de 400
cidades norte-americanas que você escolhe clicando num mapa dos EUA.
Tudo organizado, com histórico das cidades e ordenação das referências
(uma boa idéia para brasileiros!)/
* "Peoplefind" permite a busca de norte-americanos que estejam listados
em catálogos telefônicos. Não encontrei nenhum "charlab", mas achei mais
de quatro dezenas de "charlap" por lá. É como se você tivesse à mão, de
uma só vez, todos os catálogos telefônicos dos EUA. Você recebe o nome,
endereço e telefone. Clicando no endereço, você pode localizá-lo num
mapa de ruas! E pode procurar endereços comerciais que fiquem a uma
distância determinada do endereço da pessoa. O Shlomo Charlap, por
exemplo, mora na 110 Ridge Ave; Passaic, NJ 07055-2419, e seu telefone é
201-473-6661. Vejo no mapa que a rua dele fica próxima de um tal de
Third Ward Park e também dos cemitérios King Solomon, Menorah e Crest
Haven. Sei que o Mcdonalds mais perto da casa dele fica a cinco milhas,
na 485 Broadway, já na cidade de Paterson, NJ, porque a cidade de
Passaic - sei também fazendo minhas pesquisas - não tem mais do que três
pequenos restaurantes de Fast Food (e eu nem me surpreenderia se um
deles fosse um fast-food de comida kosher...).
* "Road Maps" permite a você localizar ruas em mapas a partir de
domínios no World Wide Web. É bom para você saber de onde vem um e-mail.
Só funciona para os EUA, mas eu fui capaz de obter um mapa do endereço
da Association for Progressive Communications (que é a "apc" de
"charlab@ax.apc.org").
* "Pictures & Sounds" permite que você localize arquivos de som (wav,
snd, ra, au) e imagem (gif, jpeg e mov). Usei a palavra "samba" e
encontrei exemplos de samba em músicas e imagens.
* "Software" leva o visitante para uma página com helpers e plugins para
os browsers.
* * *
Fazer buscas no Lycos é simples. Escreva sua palavra-chave e escolha a
opção de busca em "The Web", "Sounds", "Pictures" e "By Subject". Os
resultados aparecem com notas, na verdade, pontos de um ranking que
procura julgar a importância de cada página para sua busca específica. O
Lycos considera o conteúdo dos títulos e uma seleção de 100 palavras e
das 20 primeiras linhas da página para classificá-la.
Clicando nas palavras "Custom Search", à direita de onde você preenche
com palavras-chaves, a busca ganha novas opções, onde o mais importante
é a escolha da combinação de todas as palavras de busca ("Match all
Terms) ou de pelo menos uma (Match any Terms). Você pode ainda
determinar o número de resultados da busca e seu detalhamento.
O Lycos tem contra si o fato de parar de funcionar em horas importantes,
provavelmente exausto diante de grande quantidade de conexões.
A favor, apresentou muito menos resultados diante da palavra-chave
"charlab", mas colocou em primeiro lugar minha própria home-page.
Contra: endereço antigo, mostrando que a última adição ao banco de dados
foi feita em julho.
* * *
Eis algumas das principais dicas para busca por palavra-chave no Lycos:
* O sinal de menos "-" serve como exclusão na busca. "Sérgio -Charlab"
vai procurar todo Sérgio que não seja o Charlab.
* Evite símbolos e números.
* Use um ponto após uma palavra-chave para que a busca seja exata.
"Jornal." vai buscar somente a palavra "jornal", e ignorar "jornalista",
"jornaleiro", etc.
* Use um sinal de cifrão para procurar uma palavra da qual você
desconhece uma ou mais letras ou que ampliar as possibilidades. "Bra$il"
(para valer a grafia brasileira com "s" e a estrangeira com "z " ou
"brasil$" para procurar também "brasileiro".
* * *
Esta foi a quinta parte da série sobre os mecanismos de busca e
indexadores da Internet. Se você está gostando, avise aos seus amigos da
Internet. Ainda vamos falar de vários mecanismos - inclusive os
brasileiros - e softwares de busca. Eu acredito que dominar o uso das
técnicas de busca nestes "oráculos digitais" é a melhor estratégia para
quem quiser sentir-se à vontade com a Internet.
Quem perdeu qualquer uma das partes anteriores pode pedir o texto
digital enviando mensagem para este endereço especial:
charlab@charlab.com.br.
Sérgio Charlab
charlab@ax.apc.org
http://www.charlab.com.br
Os Oráculos Digitais: Infoseek (Tutorial, parte 6)
Você não está cansado dos "Oráculos Digitais", está? Eles são a
quintessência da Internet. Sem eles, você e eu ficamos olhando para a
tela sem saber onde ir. Mas já que usei esta palavra algo incomum -
quintessência -, é hora de escrever sobre o Infoseek
(http://www.infoseek.com, também chamado de Infoseek Guide em
http://guide.infoseek.com), cujas várias atrações o tornam uma barraca
de feira semelhante a do Lycos. (Como? Você não leu a parte 5 da semana
passada que tratava do Lycos? Você também não leu a parte 4? Perdeu a
parte 2? "Sim, sim salabim." Envie e-mail para charlab@charlab.com.br e
peça o que você perdeu. Não faz sentido escrever uma dúzia de colunas
numeradas para você ficar aí se lamentando que perdeu algumas delas.
Portanto, peça já! Passei duas semanas longe do computador e meus
ouvidos anseiam pelo "relinchar" dos modems negociando uma conexão; meus
dedos precisam de ginástica entre as teclas; meu mouse precisa de botões
para clicar. Mas não exagere, porque tenho também filhos e mulher para
abraçar.)
* * *
"Welcome to the quintessential place for finding quick facts!" diz uma
frase em meio ao Infoseek. Ali você encontra um pouco de tudo. E quando
não há resposta no Infossek, é hora de parcerias. Clicando na gaivota de
papel, no alto, onde esta escrito "Fast Facts", você encontra os
parceiros do Infoseek.
* Em "E-mail addresses" você pode achar pessoas na Internet a partir do
nome completo ou apenas o sobrenome delas (neste caso, o parceiro é o
WhoWhere (http://www.whowhere.com)).
* Em "Stock Quotes" você vê o valor das ações NASDAQ a partir do símbolo
das companhias. Procurei em "search for it" por "Infoseek" e achei o
símbolo "SEEK". Chequei e vi que as ações estão em US$ 9, mas chegaram a
US$ 16.50 no período das últimas 52 semanas. (neste caso, o parceiro é o
Quote.Com (http://www.quote.com)).
* Em "Bank and Market Rates" existem uma série de taxas de investimentos
que se pode comparar por instituição (neste caso, o parceiro é o
BanxQuote (http://www.banx.com)).
* Em "Company Directory" você pode procurar informações sobre 45 mil
companhias públicas e privadas dos EUA (neste caso, o parceiro é a
CompanyLink (http://www.companylink.com)).
* E em "Street Maps", claro, você obtém mapas de ruas nos EUA (neste
caso, o parceiro é a Vicinity).
Não satisfeito, o Infoseek ainda faz referência a outras ferramentas
úteis (http://guide.infoseek.com/Reference), variando de dicionários a
tutoriais HTML, passando por tabelas de conversões de medidas.
Ao estilo Yahoo!, o Infoseek é também um classificador. Sua página
principal apresenta vários temas e pode-se, por exemplo, clicar em
"Arts", "Computers" ou "Science" para então mergulhar em novos níveis de
classificação.
Pode-se fazer buscas por palavra-chave (clique no menu junto à janelinha
de busca) no World Wide Web, Usenet, Notícias e até FAQs existentes no
World Wide Web. Experimente procurar por "Brazil" em "Timely News". Até
o anúncio da página se adapta à sua busca!
* * *
Mas quando se fala em Infoseek - e é bom destacar logo que hoje o
Infoseek é gratuito -, geralmente é preciso falar bem. Especialmente
agora com o lançamento do Infoseek Ultra (http://ultra.infoseek.com/),
anunciado com "o local" para se encontrar resultados que importam. Eles
estão tão orgulhosos da capacidade do Ultra que afirmam ser possível
encontrar, por exemplo, "Sérgio Charlab" mesmo que eu digite como
palavra-chave "SergioCharlab" - assim mesmo, junto, sem espaço. Com
coisas assim, o sistema de busca do Infoseek Ultra se mostra ainda mais
refinado e poderoso que o do Altavista.
Mas o conceito que importa é o de "relevância e precisão". Na comparação
com AltaVista, Lycos, Excite e HotBot, o Infoseek Ultra (segundo eles
mesmos, mas também pelos testes realizados por revistas especializadas)
é muito melhor ao oferecer em seus 30 primeiros resultados a melhor
"relevância e precisão". Faça o teste!
* * *
O Ultra se apresenta como o futuro das ferramentas de busca. É rápido
(responde a 1000 consultas simultâneas a partir de um banco de dados de
dezenas de milhões de documentos e uma Sun Enterprise Server 4000). É
grande (localizou 80 milhões de diferentes URLs e já catalogou 50
milhões delas). É correto (consegue manter fora de seu banco de dados
boa parte das URLs que estão nos demais mecanismos, mas que já não
funcionam). É atual (tem um mecanismo que vasculha o World Wide Web
segundo algoritmos que indicam quais as chances de algumas páginas serem
mais frequentemente atualizadas que outras).
* * *
Como de hábito, quando falo de um mecanismo interessante, vou deixar a
você a chance de experimentá-lo durante uma semana. Na próxima terça vou
escrever de forma prática as múltiplas possibilidades de busca do Ultra
e a linguagem utilizada para obter os melhores resultados. Também há uma
ou outra coisa a mais para se falar sobre o Infoseek.
Dominar o uso das técnicas de busca nestes "oráculos digitais" é a
melhor estratégia para quem quiser sentir-se à vontade com a Internet.
Esta foi a sexta parte da série sobre os mecanismos de busca e
indexadores da Internet. Histórias verdadeiras, instrutivas ou
pitorescas, sobre o uso de mecanismos de busca são bem-vindas e devem
ser enviadas para meu endereço usual, charlab@ax.apc.org.
Ainda vamos falar de vários mecanismos - inclusive os brasileiros - e
softwares de busca. Se você está gostando, avise aos seus amigos da
Internet que o encontro é aqui.
Sérgio Charlab
charlab@ax.apc.org
http://www.charlab.com.br
Os Oráculos Digitais: Infoseek (Tutorial, parte 7)
O Infoseek (http://www.infoseek.com), do qual já falamos um pouco na
parte 6, oráculo politicamente correto, customizável, permite que
selecionemos até o idioma da home-page. Pedir (e encontrar) texto em
português é exagero, por isso temos de nos contentar com o espanhol. Não
é mau. Clique em "ayuda" e verá que, para nós brasileiros, a leitura (e
a compreensão) em espanhol é apenas uma questão de velocidade e
paciência.
* * *
A linguagem de busca do Infoseek é semelhante a do AltaVista. Você pode
usar aqueles sinais de mais (+) e menos (-) para especificar palavras
que "devem" e não devem" aparecer nos resultados. Exemplo: fernando
+henrique; fernando -collor.
Para procurar uma frase você deve escrever as palavras entre aspas
(aquelas de duas marquinhas antes, duas depois). Não custa reforçar aqui
a diferença entre procurar uma "frase" de três palavras e as mesmas três
palavras sem ser numa frase. Digamos que, num dia de inspiração
nacionalista, você queira encontrar menções à frase da nossa bandeira,
"ordem e progresso". Pois então escreva no local de busca: "ordem e
progresso". Vai achar três respostas, todas na "mosca". Mas se o seu
amigo, que não está lendo esta série, fizer a busca e escrever apenas as
palavras sem usar as aspas, vai encontrar 304.120 resultados (!!),
porque neste caso a busca terá sido feita individualmente pelas
palavras, "ordem", "e" e "progresso". Você pode também usar um hífen
(tracinho) para caracterizar palavras que devem aparecer junto uma da
outra, como em Itamar-Franco.
Use colchetes para indicar palavras que não estejam mais distantes do
que 100 palavras entre uma e outra. [Netscape dicas] me deu 19
resultados, que são as ocorrências das palavras "Netscape" e "dicas" a
no máximo 100 palavras de distância entre uma e outra. Ou seja, boas
chances de que sejam, de fato, dicas sobre uso do Netscape. Sem os
colchetes, encontro 82.989 respostas, porque o Infoseek busca
ocorrências das duas palavras. Naturalmente, como o sistema de
classificação do Infoseek é de boa qualidade, na hora de apresentar as
respostas você encontrará uma classificação por scores que tendem a
colocar as mais importantes em primeiro lugar. O score vai de 0 a 100 e
é baseado nas palavras e frases que você usa na busca.
* * *
Mas vamos agora ao Infoseek Ultra (http://ultra.infoseek.com/),
anunciado como mais eficiente que o AltaVista, Lycos, Excite e HotBot.
Clique no botão "special" abaixo do logotipo do Infoseek Ultra e veja
quantas opções incomuns, mas interessantes, de busca. Você pode saber a
popularidade de um site (medida pelo número de páginas que a ele fazem
referências); avaliar quantas páginas de um site estão registradas no
Ultra; procurar um site por um pedaço de uma URL (coloquei para procurar
por ".br" e achei quase 50 mil URLs, a maioria, claro, brasileiras);
localizar um site pelo "título"; e ainda procurar imagens e "applets"
Java.
Para estas características, permanecem válidas as regras das aspas, mais
e menos, de modo que uma possível busca seria [url:+.br -com.br], o que
imediatamente mostra que temos 12.610 sites "com.br" na Internet
brasileira registrados no Infoseek. Um bocado, não? Da mesma forma, vi
que "gov.br" são apenas 1978. Se você fizer estas buscas, convém colocar
também uma restrição para ".br-online" para evitar os sites ligados a
http://www.br-online.de/, que fica na Alemanha e, até onde vai meu
alemão, não tem nada a ver com o Brasil.
Com buscas em "site:" você descobre tudo o que existe "debaixo" de uma
URL, até mesmos páginas perdidas, não-divulgadas (de testes), ou
baixarias que os administradores desconhecem.
Claro que alguém vai pensar em buscar [url:http] e vai encontrar os
quase 15 milhões de páginas arquivadas no Ultra.
* * *
O Infoseek Ultra tem uma série de características que tornam,
teoricamente, as buscas mais precisas. Quando usamos duas palavras que
iniciam por maiúsculas, como Sérgio Charlab, ele conclui que deve tratar
a busca como uma "frase", e portanto não é necessário colocar as aspas
tradicionais. Duas frases separadas por vírgula resultam numa excelente
busca. Lembre-se que uma frase é sempre melhor do que várias palavras, e
três palavras, por exemplo, são melhores do que duas. E não se esqueça
de colocar em maiúsculas aquilo que for em maiúsculas. É sempre a mesma
regra: pense um pouquinho antes de sair procurando.
Também é divertido avaliar as respostas que aparecem a partir de uma
busca "natural"; ou seja, quando você simplesmente escreve o que deseja
achar. Exemplo: "Pentium 166 multimídia" ou "mulher bonita no Brasil".
Boa sorte!
Aliás, procurando o e-mail do Bill Gates acabei me deparando com infame
piada que descrevia seu (o dele, claro!) objeto de desempenho como
"micro" e "soft".
* * *
Um leitor ficou preocupado com as dicas que eu dei aqui, numa das
semanas anteriores, sobre como fazer para que uma página seja catalogada
com destaque no AltaVista, de modo que surja entre as primeiras como
resposta após uma busca. A sensação que tenho é de que não há nada que
se deva esconder. Exatamente para evitar isso é que o Ultra, por
exemplo, tem um algoritmo original que é capaz de identificar quando
alguém "tenta enganá-lo". Se você faz uma home-page sem conteúdo, mas dá
a ela o título de "Sexo no Brasil", escreve uma meta tag dizendo que a
página é sobre sexo e ainda escreve 100 vezes a palavra sexo nas
primeiras linhas de texto da página, o AltaVista julgará que você é
autoridade na matéria, mas o Ultra, esperto, percebe que você quer
enganá-lo e não classifica sua página.
Na Internet, a lição que aprendo, é que inteligência se vence com
inteligência e trabalho, e não com segredos e censura.
* * *
Esta foi a sétima parte da série tutorial sobre os mecanismos de busca e
indexadores da Internet. Envie e-mail para charlab@charlab.com.br e peça
as partes deste tutorial que você perdeu. Ainda há muita coisa pela
frente e eu não faço idéia de quantas partes este tutorial terá. Mas sei
que na semana que vem falarei de alguns oráculos verdes e amarelos, em
português, brasileiríssimos, como o Bookmarks
(http://bookmarks.ibase.org.br) e o Argos (http://www.argos.com.br).
Apareça aqui. E chame os amigos. Dominar o uso das técnicas de busca
nestes "oráculos digitais" é a melhor estratégia para quem quiser
sentir-se à vontade com a Internet.
Sérgio Charlab
charlab@ax.apc.org
http://www.charlab.com.br
Os Oráculos Digitais: Bookmarks (Tutorial, parte 8)
O Bookmarks (http://bookmarks.apc.org/) já sai na frente de qualquer
outro oráculo digital conhecido, com pelo menos cinco endereços onde
você pode acessá-lo:
1. http://bookmarks.ax.apc.org/
2. http://bookmarks.apc.org/
3. http://bookmarks.ibase.br/
4. http://bookmarks.ibase.org.br/
5. http://bookmarks.alternex.com.br/
O mais curto é o que eu reproduzi entre parênteses, logo na primeira
linha. As múltiplas URLs não são demonstração de insegurança, estratégia
para facilitar o acesso e tampouco reflexo de desorganização. Exibem,
sim, um provedor que faz parte da história da própria Internet
brasileira, o Ibase, buscando uma nova identidade profissional, com a
marca AlterNex, e para isso exibindo criatividade e iniciativa.
Só mesmo estas duas coisas podem explicar o aparecimento do Bookmarks,
que indexa mais de 100 mil documentos no domínio .br e promete dominar a
atividade de oráculo digital em toda a América Latina.
* * *
Sei que alguns devem estar lamentando a suposta injustiça que cometo
hoje ao destacar o Bookmarks num universo brasileiro que há muito dispõe
de oráculos mais antigos, mais famosos e até mais charmosos, como é o
caso do Yaih? (http://www.ci.rnp.br/si/) ou do Cadê?
(http://www.cade.com.br). Mas só há um único outro oráculo brasileiro
que poderia "reclamar" espaço aqui, o Argos (http://www.argos.com.br).
Por quê? Argos e Bookmarks são os únicos oráculos brasileiros com
motorzinho de popa (se houver mais, que entre em contato comigo ou
cale-se para sempre). Ou seja, dispõem de um mecanismo ativo que sai
vasculhando a rede em busca de novas páginas. Os demais dependem da
adição manual de páginas pelos visitantes ou pelos idealizadores.
O Bookmarks é fácil de usar. Funciona com tecnologia Opentext. Você
escreve uma ou mais palavras na ranhura apropriada. Seleciona o modo
"esta frase" (apresenta resultados com todas as palavras na exata ordem
que estão escritas), "todas estas palavras" (leva em conta a existência
de todas as palavras, mas em qualquer posição), e "qualquer uma destas
palavras" (responde com páginas que tenham pelo menos uma das palavras
usadas na busca).
Busquei a palavra "argos" no Bookmarks e encontrei 243 respostas. Depois
fui ao próprio Argos comparar e encontrei oito respostas apenas, nenhuma
delas a do próprio site do Argos. "Charlab" gerou 95 respostas no Argos,
contra 264 no Bookmarks. E para não ter mais dúvidas despejei ali uma
busca por "Tiririca" e recebi 42 respostas no Bookmarks contra apenas
uma (!) do Argos.
Não posso estar muito errado ao concluir que se for apenas uma questão
de (ehr...) potência e tamanho, fique com o Bookmarks.
* * *
Ao responder a uma busca, o Bookmarks informa o número de documentos
encontrados e exibe os 10 primeiros. Em geral, responde muito
rapidamente. Aí permite que se escolha entre duas opções: "Selecione
documentos a ver" e "Busque documentos similares". Nos dois casos, a
primeira coisa a fazer é clicar nos quadradinhos que aparecem à esquerda
da URL de cada resposta, selecionando algumas. Aí o Bookmarks reage
segundo a opção, mostrando todos os que você selecionou ou realizando
uma nova busca a partir da sua escolha.
O Bookmarks também apresenta respostas usando "score", e ordenando por
relevância. Permite ainda que se veja, antes de acessar a página, os
locais em que houve coincidência de frases ou palavras com a sua busca,
e uma cópia da própria página. Note que, ao apresentar uma cópia da
página em seu banco de dados, o Bookmarks evita a irritante mensagem de
que não existe a página, frequente nos demais mecanismos. Por outro
lado, a cópia pode representar o último sopro de vida de uma página que
mudou ou que já não existe, o que tem seu lado bom e ruim.
Por ora, é o que há de mais distinto no Bookmarks, que de resto não
oferece outras opções de configuração ou variedade de sintaxes de busca.
* * *
Convencido de que o Bookmarks é superior ao Argos (para não falar no
fato de que o banco de dados do Argos parece não sofrer atualização há
algum tempo), resolvi fazer a grande pergunta: afinal, qual a vantagem
de um oráculo brasileiro que se restrinja geograficamente aos domínios
.br ou à América Latina, em comparação com os poderosos Altavista,
HotBot e Infoseek Ultra?
Não pretendo apresentar dados conclusivos aqui. E lembre-se que o
Bookmarks só atua em domínios brasileiros. Se um brasileiro em Helsinque
faz uma página sobre César Maia o endereço não aparecerá no Bookmarks,
mas possivelmente estará entre as respostas dos demais mecanismos.
Trata-se, portanto, de uma pesquisa de observação. Vamos ver o resultado
de algumas buscas, comparativamente, do Bookmarks (o primeiro número)
contra o Altavista (o segundo número). Leve em consideração que
quantidade de respostas nem sempre representa garantia de sucesso para
quem pesquisa.
* Tiririca: 42 x 28
* "Mamonas Assassinas": 128 x 200
* "Sergio Cabral": 27 x 52
* Manequinho: 2 x 5
Num enfoque mais qualitativo, veja o que acontece:
* "Descoberta do Brasil": 7 x 0
Mas aí é preciso considerar as peculiaridades de sintaxe de busca.
Refazendo a busca no Altavista com a sintaxe [+descoberta +Brasil]
recebo 37 respostas, das quais a quarta
(http://www.brasil.emb.nw.dc.us/bzhisto1.htm), num domínio estrangeiro e
que portanto não será apontada pelo Bookmarks, era o meu sonho de
trabalho escolar quando eu tinha oito anos...
* * *
Esta foi a oitava parte da série sobre os mecanismos de busca e
indexadores da Internet. Histórias verdadeiras, instrutivas ou
pitorescas, sobre o uso de mecanismos de busca são bem-vindas e devem
ser enviadas para meu endereço usual, charlab@ax.apc.org. O leitor Paulo
Cesar Bouhid (pcbouhid@nutecnet.com.br) foi mais longe e enviou uma dura
charada em homenagem a seu pai. Veja se consegue resolver. Receio que os
oráculos não sejam muito úteis desta vez...
"Era uma noite fria, em Teresópolis (RJ). O velho professor recostou-se
na poltrona, junto à lareira, abriu um livro e pôs-se a ler. Foi
interrompido pela visita de um dos filhos.
- Sabe, pai, em uma de minhas andanças pela Internet, tive a
oportunidade de encontrar duas pessoas fantásticas: o Hélio e a Sandra.
O que me deixou surpreso foi saber da diversidade de idades de pessoas
que, às vezes, cultivam os mesmos gostos.
- As idades são assim tão diferentes?
- Olhe, pai, quando Sandra tiver a idade do Hélio, eu terei cinco vezes
a idade que a Sandra tinha, quando Hélio tinha a idade que Sandra tem
agora. E mais: quando Hélio tiver a minha idade, eu terei oito vezes a
idade que a Sandra tinha, quando eu tinha a idade que Hélio tem agora.
Imperturbável, o velho Bouhid, professor de matemática acostumado aos
malabarismos com os números, tomou de um lápis e um pedaço de papel,
rabiscou algumas equações, e prontamente apresentou a resposta ao filho.
- Sabe, Paulo, para mim foi fácil porque eu conheço a sua idade. Mas
será que os outros, que não sabem disso, e de fato não precisam saber,
conseguiriam resolver o enigma ?
É isso. Se cada uma das pessoas citadas tem menos de 100 anos, quais as
idades de Paulo, Hélio e Sandra?"
Só há uma resposta, e se vier com explicação, para este meu endereço
(charlab@charlab.com.br), antes que outras cinco pessoas façam o mesmo,
você ganha a "medalha digital do mérito matemático" e a simpatia dos
Bouhid.
* * *
Ainda vamos falar de vários mecanismos - a toda hora surgem novos, como
o LookSmart (http://www.looksmart.com) - e softwares de busca. Se você
está gostando, avise aos seus amigos da Internet que o encontro é aqui.
E diga aos que perderam as partes iniciais deste tutorial que podem
enviar e-mail para charlab@charlab.com.br e pedir para completar a
série. Semana que vem, mais Brasil na série.
Sérgio Charlab
charlab@ax.apc.org
http://www.charlab.com.br
Os Oráculos Digitais: Excite (Tutorial, parte 9)
Temos nossas teorias secretas, especulações que vão e vêm nas nossas
cabeças. Seria bom que as pudéssemos anotar. Se deixamos os pensamentos
correrem com a missão de buscar respostas para o que falta nos
processos, produtos e serviços que experimentamos no dia-a-dia,
estaremos pertos de fazer, com grande probabilidade de acerto, nossas
próprias previsões de futuro.
* * *
Num nível muito pouco pretensioso, tive mais uma destas experiências de
Julio Verne a partir da dica de um leitor, que me sugeriu visitar
http://www.thedj.com/. Gostei de imediato. Se você tiver o Real Audio
Player (http://www.realaudio.com) instalado em seu browser, não deixe de
visitar este conjunto de "rádios digitais".
Escolhi a programação de "Classic Rock". Tocou Alice in Chains,
Metallica e Iron Maiden. A minha vontade é pegar os 1600 LPs e mais os
400 CDs que tenho, digitalizar tudo e passar a ouvir música usando uma
espécie de mecanismo de busca. Escreveria o nome da música que quero
ouvir e o "mecanismo" a localizaria e providenciaria a execução.
Escreveria o nome de um conjunto e o "mecanismo" listaria todos os
discos e músicas que tenho deste conjunto no meu arquivo, para que eu
selecionasse então as que desejo ouvir.
Pode ser que estes pensamentos tenham me ocorrido diante da iminência de
uma mudança de endereço, que me coloca de cabelo em pé. Isso porque não
será fácil transportar minha volumosa coleção de discos (e o que dizer
da possibilidade de a Telerj não ser rápida o suficientemente para
garantir minha mudança de telefones...). Sérgio Charlab? Mudou-se e
desconectou-se. Oh, não!
* * *
A mesma teoria Julio Verne deve ter sido responsável pelo surgimento do
Excite (http://www.excite.com/), antes conhecido como Architext. Em
setembro de 1993, seis alunos de graduação da Stanford University
acharam que alguma coisa poderia ser inventada para facilitar o processo
de busca e identificação de documentos no então nascente World Wide Web.
Felizmente para eles, tiveram a idéia e sabiam como executá-la. Hoje,
com sede em Mountain View, Califórnia, o Excite é mais um mecanismo do
tipo profissional, com empresa (Excite Inc.) de ações em bolsa (NASDAQ:
XCIT) e, agora, executivos angustiados com o sobe e desce do valor do
papel. O Excite anuncia até em TV nos EUA; curiosamente, para buscar
anunciantes para sua home-page, e não visitantes.
Se você usa o Netscape, visite o Excite, e procure pelo "Turbo Search!"
do Excite Direct, à esquerda na tela principal. Faça o download e
instale o pequeno software (500 Kb), que se acomoda harmoniosamente
junto aos "directory buttoms" do Netscape. Deste jeito, você vai poder
fazer buscas no Excite a qualquer momento, sem precisar visitar antes a
página deste excelente "oráculo".
Mas o Excite oferece muito aos visitantes. Eis o que existe além, óbvio,
do sistema de busca, descrito mais adiante:
* Excite Reviews, com descrição e classificação de mais de 60 mil sites,
inclusive brasileiros.
* O Excite adquiriu a city.net, ótimo diretório de cidades, que você
acessa clicando na figura central, ao alto da home-page do Excite.
* Em http://www.excite.com/navigate/home.html o leitor que opera
servidor Web (somente para SunOS 4.1.4, HP-UX 9.05, Solaris 2.4, IBM
AIX 3.2, SGI IRIX 5.3, BSDI 2.0 e Intel Windows NT - Linux e Macintosh
saem em 1997) pode instalar sem custo o "Excite searching".
* Exciteseeing Tours, onde você escolhe um tema e é apresentado a um
conjunto de informações dentro do Web relacionadas à sua escolha.
Funciona como orientação e prevê a inclusão de dicas dos próprios
usuários, que assim se beneficiam com as experiências dos outros. Já
existem mais de 200 "tours" disponíveis, com temas bem interessantes.
* O Excite Live! é um excelente sistema customizado de notícias de
centenas de fontes, que "aprende" continuamente a identificar as
notícias de maior interesse para o usuário. Não deixe de experimentar o
"News Tracker".
* Referências que vão desde mapas e dicionários até locais onde existem
softwares disponíveis.
* * *
A PC World (USA) de setembro deu ao Excite a melhor classificação diante
de comparações com AltaVista, Infoseek, HotBot, Lycos, Magellan, Open
Text, e WebCrawler. São cerca de 50 milhões de URLs (que o Excite diz
serem contadas de maneira diferente e mais rigorosa do que os 50 milhões
anunciados também por alguns dos demais mecanismos). Dos 50 milhões, o
Excite identifica o grupo de cerca de 5 milhões que mudam semanalmente,
e está sempre reclassificando-as. As outras são atualizadas em prazos de
algumas semanas.
A busca do Excite não só vai atrás de ocorrências das palavras-chaves
como, ainda, se aprofunda tentando oferecer idéias semelhantes. É a
chamada busca por conceito (Intelligent Concept Extraction - ICE). Este
é um processo dinâmico de aprendizado (quem disse que computadores não
aprendem?). A partir de um documento resultante da busca, o Excite pode
ser instruído a procurar outros semelhantes. Neste caso - note a
diferença -, não está procurando mais a partir de suas palavras-chaves,
mas a partir de uma resposta que você apreciou. Portanto, os resultados
têm chance de serem ainda mais precisos.
Testei o Excite com uma busca para "tirar mancha de gordura" e a
resposta veio em português,
http://www.sebes.com.br/empresas/supercou/dica.htm, a sétima das dez
primeiras exibidas na tela.
Embora o Excite não disponha de busca avançada, reaje diferentemente aos
nomes, desde que você coloque maiúsculas. Também é possível usar os
operadores boleanos AND, OR, e AND NOT. O AND serve para juntar palavras
que devem aparecer no resultado; o OR trabalha como opção, onde pelo
menos uma das palavras apareça; e o AND NOT aponta palavras que não
devem ser consideradas. Podem-se usar sinais de parênteses para agrupar
expressões boleanas mais complexas. Quem não se sente bem usando
boleanos pode substituí-los por sinais de mais (+) e menos (-), que
devem aparecer "grudados" às palavras. Quando se usa a busca com
operadores boleanos, a busca por conceito é desativada para que as
respostas possam obedecer às instruções boleanas.
* * *
Fiquei agradavelmente surpreso com a repercussão da charada criada por
Paulo Cesar Bouhid (pcbouhid@nutecnet.com.br) e publicada aqui na semana
passada. Várias dezenas de leitores se habilitaram a destrinchar o
problema. A resposta única é: Paulo tem 49 anos, Helio 34 e Sandra 23.
Quem quiser saber como se chega à solução pode enviar mensagem ao
próprio Paulo. Naturalmente, as idades devem ser números inteiros e como
"cada uma das pessoas citadas tem menos de 100 anos", inclusive,
portanto, o pai de Paulo, o filho não poderia ter 98 anos, o que elimina
uma segunda resposta de números inteiros.
Os cinco primeiros a acertarem a charada foram Luis Melo
(Luis_Melo@praxair.com), Hugo Kaulino Pereira (hugo@marlin.com.br), Inez
(pedroc@ax.apc.org), Iris Novello (iris@iis.com.br) e alguém que se
identificou apenas como (jcband@ibm.net).
E a charada, uma vez publicada, mexeu comigo, com os leitores e também
com os Bouhid. Veja o que me escreveu Paulo: "É desnecessário lhe dizer
o tamanho da emoção do meu pai ao ler a coluna, e também a ponta de
orgulho dos meus filhos por verem o nome da família num jornal e coluna
respeitáveis. Algumas pessoas me perguntam como cheguei até você, se o
conheço, como é que alguém publica alguma coisa de outra pessoa que nem
conhece. Elas ainda não foram atingidas pelo espírito de fraternidade
que envolve as pessoas que navegam na Internet."
O velho professor Bouhid, a propósito, tem 83 anos.
* * *
O médico e leitor Jorge Calasans Maia (cadri@ibm.net) tem uma história
interessante:
"Após ler seu artigo sobre o Lycos criei novas esperanças de achar
alguns amigos há muito tempo perdidos nos EUA. Assim, após clicar
"People Find" e digitar os três nomes que procurava, o Lycos respondeu
em menos de 10 segundos, apresentando os respectivos endereços e
telefones. A maior surpresa foi que, logo após, eu liguei e eles
atenderam. Emocionante! Foi surpreendente o poder do Lycos, visto que os
endereços que achei não foram de nenhuma metrópole e sim de cidades
pequenas (Lakewood e Boulder) próximas a Denver (Colorado). O Lycos me
deu todas as dicas e informações sobre as cidades. Mapas com localização
dos endereços nas ruas, atrativos, serviços, etc. Um espetáculo!"
* * *
Esta foi a nona parte da série sobre os mecanismos de busca e
indexadores da Internet. Faltou espaço para falar de outros sistemas
brasileiros, como era minha intenção. Farei isso, portanto, na terça que
vem, encerrando a série com um resumo para servir de guia prático de uso
dos "oráculos". Na verdade, estou em dúvida se sigo em frente por mais
umas três ou quatro semanas, pois ainda há assuntos importantes que não
abordei. Agradeceria receber mensagens indicando se devo ou não me
estender por mais algumas semanas com o tema dos "Oráculos Digitais".
Enquanto isso, histórias verdadeiras, instrutivas ou pitorescas, sobre o
uso de mecanismos de busca são bem-vindas e devem ser enviadas para meu
endereço usual, charlab@ax.apc.org. Dominar o uso das técnicas de busca
nestes "oráculos digitais" é a melhor estratégiapara quem quiser
sentir-se à vontade com a Internet. Se você está gostando da série,
avise aos seus amigos da Internet que o encontro é aqui. Quem perdeu
alguma parte deste tutorial pode pedir o que falta enviando e-mail para
charlab@charlab.com.br.
Sérgio Charlab
charlab@ax.apc.org
http://www.charlab.com.br
----------------------------------------------------------------------
SÉRGIO CHARLAB (charlab@ax.apc.org) (http://www.charlab.com.br) é
Editor-Chefe de Seleções do Reader's Digest (http://www.selecoes.com.br),
colunista de "Ciberespaço" do Jornal do Brasil e autor dos livros
"Você e a Internet no Brasil" (http://www.charlab.com.br/ch2505.html)
e "O Seu Futuro Eletrônico".
----------------------------------------------------------------------
Os Oráculos Digitais: NlightN (Tutorial, parte 10)
Se a série dos Oráculos Digitais fosse minha plataforma eleitoral, eu já
estaria eleito mesmo antes de sexta-feira. Não recebi uma única mensagem
em favor do encerramento da série agora, nesta parte 10. Os que
escreveram (foram dezenas de mensagens muito gentis e muito estimulantes
às quais eu agradeço aqui) querem ler mais sobre os oráculos. Que assim
seja.
Foi bom ter feito este plebiscito porque também ficou muito claro que,
ao final, é indispensável um bom quadro comparativo entre os vários
mecanismos de busca citados ao longo das última semanas em Ciberespaço.
Vou me esforçar para fazer isso de forma que, ao final da série, seja lá
quando for, tenhamos um material útil e de consulta rápida para
identificar os caminhos mais apropriados na hora de usar os oráculos.
Estou cada vez mais convencido de que dominar o uso das técnicas de
busca nestes Oráculos Digitais é a melhor estratégia para quem quiser
sentir-se à vontade com a Internet. Recebo muitas mensagens com
perguntas e dúvidas variadas, de software, hardware e o que mais se
puder imaginar. Sei que as respostas estão nos oráculos. E se puder
ajudar você a encontrá-las, é como se eu o ajudasse a pescar, em vez de
dar o peixe.
Se você está gostando da série, avise aos seus amigos da Internet que o
encontro é aqui, às terças. Aos que estão chegando ou aos que perderam
algumas das partes anteriores, lembro que basta enviar mensagem de
e-mail para charlab@charlab.com.br e pedir o que falta.
* * *
Creio que pouca gente aqui conhece ou já ouviu falar do NlightN
(http://www.nlightn.com e informações via info@nlightn.com). Eu o venho
usando há mais de um ano. É um oráculo interessantíssimo, mas preciso
antes deixar bem claro que é pago (vamos ver exatamente como) e que eu
não tenho qualquer relação com esta empresa. Ou seja, escrevo sobre o
NlightN porque gosto do serviço. Não estou pedindo a nenhum leitor que o
assine. Cada um deve avaliar por si a conveniência de usar os serviços
pagos do NlightN.
Embora o NlightN esteja apto a fazer busca no World
Wide Web (usa o Infoseek para isso), sua grande utilidade é a busca numa
vasta coleção de banco de dados. Podem ser pesquisados simultaneamente,
com a mesma simplicidade a que nos acostumamos a partir do uso de outros
oráculos. Não há nenhum custo para a busca. Mas quando você localiza um
artigo que o interessa, para obter o texto completo é preciso se
registrar, e obter crédito através do uso de cartão ou depósito em
conta. Pode-se fazer isso pela própria Internet. Você determina o valor
do crédito. Digamos que queira disponibilizar apenas US$ 5. Você é
cobrado por documento, em geral, 10 centavos de dólar por unidade. Seus
US$ 5 dão para comprar 50 documentos. Existe 1 bilhão de itens de
informação disponíveis nos bancos de dados do NlightN.
* * *
Muito bem, se você é bibliotecária (usei o gênero feminino pensando numa
amiga que conheci pela Internet e que trabalha na área), pode correr
para o NlightN. Mesmo que não seja bibliotecária, pode ir lá dar umas
tacadas. A partir do que eles chamam de Universal Index, usei Charlab
como palavra-chave de busca. Você pode usar combinações com os
operadores boleanos. Se você usa duas palavras, o NlightN considera um
and e procura pela ocorrência simultânea das duas. Também pode-se usar o
or ou o not e uma combinação complexa a partir do auxílio de parênteses.
Depois, pode escolher se vai realizar a busca em Databases, News,
Internet, Reference, ou Book Store.
Charlab resultou em 19 entradas nos bancos de dados do NlightN. Através
desta busca, minha irmã, pesquisadora, descobriu alguns trabalhos em que
fora citada e não tinha conhecimento. E eu encontrei alguns artigos que
escrevi há quase dez anos quando era colaborador de uma revista
especializada em café. Se você escreveu ou produziu algum tipo de
trabalho de pesquisa, tem boas chances de se encontrar no NlightN. As
bases de dados, internacionais, compostas de índices de periódicos,
abstratos, resenhas e documentos completos, abrangem fontes que vão
desde a famosa Library of Congress, passando por Film Literature Index e
Magazine Articles Summary, e tratam de temas tão diversificados quanto
ciência, negócios, saúde, humanidades, entretenimento e educação. Veja a
lista em http://www.nlightn.com/nlndemo/docs/dblist.htm.
Além disso, o NlightN, em suas outras modalidades de busca, ainda inclui
os arquivos de texto completo de serviços de notícias importantes como
Knight-Ridder, PR Newswire, Sports Wire, e Investment Wire, fora as
obras de referência, como o Webster. A mesma empresa responsável pelo
NlightN criou o excelente Net Locator (http://nln.com/). Uma vez lá, use
o AccuFind (você pode preferir ir direto para http://accufind.com) para
fazer buscas. Vale a visita. Ele busca tudo, sem restrições. E aceita
qualquer palavra, pedaço de palavra, número e o que mais lhe vier na
cabeça. Minha personalidade adolescente assumiu o controle e resolveu
procurar usando algumas das palavras que aqui chamamos de palavrões mas
que não são, necessariamente, longas. Foi divertido encontrar gente que
tem nossos palavrões como parte de seus nomes. Imagine se um dia você dá
de cara com a Sra. Lia Bu**** ou com o Dr. Paulo Ca****. Perdão,
perdão... Não pude resistir...
* * *
Esta foi a décima parte da série sobre os mecanismos de busca e
indexadores da Internet. Ahh..., a Internet. Eu que nunca me interessei
por horóscopos devo admitir que me deixei seduzir pela magia desta
previsão aqui, colhida sob encomenda depois que visitei casualmente
http://hotstuff.plugue.com.br/blocos/horoscop2.html.
"Querido Charlab, nosso encontro virtual estava escrito nas estrelas.
Sabia que você ia gostar de Horoscopulações. Gêmeos é regido por Vênus,
e você como bom geminiano ficou excitado com o duplo sentido das minhas
palavras. Ainda tenho outros mil artifícios para atraí-lo. Posso traçar
o seu mapa, entregar-lhe o mapa da mina ou ainda fazer-lhe previsões que
não estão no mapa. Se você preferir também podemos experimentar, só nós
dois, um método revolucionário de quiromancia. Não é leitura de mão.
Você tem que segurar meus seios. Na mão esquerda desvendarei seu
passado, na direita adivinharei seu futuro, mas se quiser um presente
inesquecível arranque selvagemente minha calcinha com ambas as mãos!
Mantenha o astral elevado. Sua, Vênus de Andrômeda."
Uma brincadeira, claro. B-r-i-n-c-a-d-e-i-r-a! Ouviu, Raquel! (Raquel é
minha mulher.) Aliás, esta Vênus de Andrômeda brinca de modo bem mais
sadio do que aquela maluca nos Estados Unidos que pediu, pela Internet,
para outro maluco assassiná-la. E o idiota ainda cumpriu o
pedido...
Sérgio Charlab
charlab@charlab.com.br.
Os Oráculos Digitais: Deja News (Tutorial, parte 11)
Acho que já disse aqui que estou de mudança. Para ir do computador à
cama, um dos caminhos principais onde ainda moro (passei anos tentando
colocar a geladeira neste trajeto), preciso driblar meia dúzia de caixas
de papelão entupidas de livros e cacarecos. Eu não sou uma pessoa
experiente com mudanças de residência. Até hoje só fiz uma. Por isso
mesmo, quando minha mulher pediu para eu começar a arrumar as coisas,
sentei-me diante do computador e comecei a apagar todos os arquivos e
diretórios imprestáveis. Não faz sentido ter o trabalho de levá-los para
nosso novo endereço. Senti-me orgulhoso por assim poder colaborar para
que nossa mudança seja feita com mais organização.
Fiquei tão empolgado com a faxina que tomei uma decisão que vinha
protelando: resolvi investigar minha correspondência eletrônica diária
não-solicitada. Durante dois dias, somei tudinho e calculei que mais de
35% dos e-mails que chegam aos meus..., deixe ver..., cinco endereços
(agora quatro, porque, diante do custo incompatível com os preços do
mercado, resolvi cancelar o charlab@embratel.net.br) são indesejados.
Listas que não pedi para entrar, releases (muitas vezes em duplicata)
que não dou conta de ler e uma enxurrada de correntes e propaganda capaz
de desesperar até gari da Comlurb acostumado a trabalhar no dia 1 de
janeiro na praia de Copacabana. Note que não são - jamais serão -
indesejáveis as mensagens espontâneas de amigos, leitores e gente que
quer me contar algo, trocar uma conversa ou fazer umas perguntas. Diante
do lixo, no entanto, minha correspondência desejada, muita vezes, fica
encoberta. E isso é mal.
Na verdade, se há algo que me preocupa em relação à Internet neste fim
de 1996 não é a velocidade da rede ou a briga dos browsers. Mas, sim, a
ameaça da correspondência eletrônica não-solicitada. Não creio que tenha
a força para liderar um movimento desta natureza, mas considero iniciada
minha batalha contra as correntes. O leitor está convidado a me
acompanhar, bastando para isso que não as passe adiante.
* * *
O que isso tudo tem a ver com o Deja News (http://www.dejanews.com)?
Pesquisa. Um dos endereços (falsos) mais ofensivos em termos de e-mails
não-solicitados é o Mailer@aol.com. Na verdade, o verdadeiro emissor
destas "baboseiras" se esconde atrás do domínio Interramp, mas quando
escrevo o e-mail "Mailer@aol.com" no mecanismo de busca do Deja News,
fico logo sabendo que milhares e milhares de usuários da Internet
adorariam dar um "boot" na cara deste artista. Ou se escrevo "good times
virus" logo fico sabendo que não passa de mais uma lenda da Internet. É
mentira, não existe.
O que o Deja News faz é ler tudo o que se escreve em 15 mil newsgroups
da Usenet. (E para atiçar logo alguns leitores, hoje o Deja News é
provavelmente a melhor solução para a maioria de nós brasileiros que não
conta com um servidor de news operativo em nossos respectivos
provedores.)
* * *
O que é Usenet? O Deja News gosta da definição de Harley Hahn, no
trabalho "A Student's Guide to UNIX": "Simplificando, a Usenet é o maior
serviço existente de informação". Abriga, em todo o mundo, mais de 20
mil diferentes tópicos. Em cada um deles, uma determinada comunidade de
usuários pergunta, responde e troca informação ou papo furado. Fala-se
de receitas da vovó, ao reverso da turbina do Fokker; de vídeos piratas
da Xuxa, até a reeleição de FHC. Acredite, fala-se de tudo, todos os
dias. Alguém disse certa vez que o conhecimento humano roda nos
newsgroups Usenet inteiramente a cada três dias. É um certo exagero, mas
a Usenet é capaz de resolver muita dúvida, fazer amigos e encontrar
gente como a gente em qualquer canto do planeta digital.
Os newsgroups não são ainda muito populares no Brasil. Primeiro porque,
em geral, o idioma é o inglês (embora existam newsgroups absolutamente
brasileiros). Depois porque a maioria dos usuários de Internet no Brasil
não dispõe de condições de acesso aos newsgroups. Mas é lá, na Usenet,
que se desenrolam os grandes papos da Internet. Note que é diferente do
conceito de IRC, onde o papo é na hora, em tempo real. Na Usenet, você
escreve e sua mensagem fica disponível para quem desejar lê-la, como se
fosse num grande quadro de aviso.
Que tal testar este conceito? O Deja News mantém uma coleção indexada de
tudo o que se posta na Usenet, desde março de 1995, o que significa 80
Gbytes de informação disponível para sua procura neste oráculo. São mais
de 50 milhões de artigos, o que não impede o Deja News de ser
extremamente rápido. E a meta é aumentar os arquivos de modo que algum
dia o Deja News se orgulhe de ter absolutamente tudo postado na Usenet
desde 1979, quando surgiram os newsgroups.
* * *
Usar o Deja News é fácil. Aprender toda a potencialidade do mecanismo de
busca deste oráculo requer, no entanto, mais dedicação. Para começar,
basta escrever uma ou mais palavras-chaves para a busca. Palavras
incompletas, usadas como radicais, também funcionam, como "jorna*", que
serve para localizar menções de "jornal", "jornalista", "jornaleiro",
etc.
Usando os chamados filtros, sua busca pode ser restrita a um subconjunto
do banco de dados, formado por determinado newsgroup, autor, data e
assunto. Pode-se também ler todo o fluxo de mensagens sobre um
determinado assunto. É nestas possibilidades que o Deja News se mostra
superior aos mecanismos de busca no Web, como o Altavista, Excite ou
Infoseek, entre outros, que também vasculham a Usenet. Só no Deja News
você pode, por exemplo, pedir um relatório completo sobre as postagens
de determinada pessoa nos últimos meses. São dados interessantes, mas
também absolutamente antiprivacidade. Empresas nos EUA vasculham o Deja
News antes de contratar candidatos a empregos. É o lado bom e mau da
tecnologia. Por isso mesmo é que existem os meios de você postar
mensagens na Usenet de forma anônima. Mas isso é outra conversa.
* * *
Por favor, teste o Deja News, porque vou voltar a falar dele assim que
me livrar das tarefas da mudança, o que espero seja na próxima terça,
claro. Esta foi a décima primeira parte da série sobre os mecanismos de
busca e indexadores da Internet. Apostas estão sendo aceitas para ver
quem adivinha em que parte a série chegará ao fim. Histórias
verdadeiras, instrutivas ou pitorescas, sobre o uso de mecanismos de
busca são bem-vindas e devem ser enviadas para meu endereço usual,
charlab@ax.apc.org. Os que chegaram agora podem pedir os textos
anteriores da série enviando mensagem para este outro endereço:
charlab@charlab.com.br
Sérgio Charlab
charlab@ax.apc.org
http://www.charlab.com.br
Os Oráculos Digitais: Deja News (Tutorial, parte 12)
Depois que o caminhão se foi com a mudança, notei que levaram minha
cadeira preferida, aquela que uso junto do computador. Assim,
resignados, ficamos nós três - eu, o computador e a linha telefônica -
no endereço antigo por mais alguns dias. Naturalmente não passei estes
dias inteiros lá com eles, porque, na mudança, levaram a imprescindível
geladeira. Dos três, eu era o único que resmungava, não só porque os
outros não têm fome e sede, mas também porque o caixote que arrumei, na
garagem, para sentar estava bastante desconfortável.
(Céus, que injustiça eu quase ia cometendo! Devo dizer que o aquário com
meus sete peixes também ficou - até hoje o Jacques, meu filho de cinco
anos, quer saber onde foi parar "aquele peixinho malhado", que era o
oitavo e foi comido impiedosamente por outro. As empresas de mudanças
podem até ter experiência para descer um piano de cauda pela janela, mas
ainda não se familiarizaram com aquários.)
* * *
Vou usar o Deja News (http://www.dejanews.com) para postar uma mensagem
em algum newsgroup que trate do tema, perguntando se é mesmo preciso
transportar a água do aquário ou se posso tornar a enchê-lo com água
nova e o anticloro. Deixe-me ver... Em inglês, temos aquarium. Escrevo
"aquarium" na segunda ranhura de busca da página principal do Deja News.
Ali, a busca é por newsgroup. O Deja News verifica em quais dos 15 mil
newsgroups disponíveis em arquivo a palavra chave foi citada. No meu
caso, a resposta, que vem classificada em percentuais segundo a
frequência das citações, foi: rec.aquaria (99%), alt.aquaria (47%),
sci.aquaria (26%), rec.aquaria.marketplace (24%) e outras cotadas com
menos de 20%.
Então decido que vou postar uma mensagem no rec.aquaria. Clico na figura
onde se lê "post" e descubro que o sonho de muitos usuários brasileiros
está ao alcance do clique do mouse, em
http://grunt.dejanews.com/post.xp. Você pode escrever e postar mensagens
na Usenet ainda que não disponha de acesso a um servidor, utilizando a
funcional interface Web do Deja News.
* * *
As principais regras são a da boa ética e educação; use seu próprio
e-mail, não poste cópias de uma mesma mensagem, não poste mensagens
inadequadas ao newsgroup e não poste besteiras, como as famosas
correntes. Se você se registrar com o Deja News (é de graça!), poderá
postar mensagens sempre que desejar diretamente desta interface. Caso
contrário, será pedida uma confirmação do seu e-mail, via mensagem de
correio eletrônico.
E para ler as respostas à sua mensagem? Visite
http://www.dejanews.com/forms/rn.html e preencha o quadro com os nomes
dos newsgroups que lhe interessam. Na ranhura em baixo do quadro maior,
você pode usar palavras chave para descobrir nomes de newsgroups. Uma
vez feita sua escolha de newsgroups, clique no botão "read news". Na
nova página, basta usar o quadro de escolha do nome do newsgroup e do
número de dias que você deseja ler. Para facilitar as coisas, você pode
escrever na primeira ranhura palavras que você deseja ver nas mensagens
e, na segunda ranhura, as que não deseja.
* * *
Embora seja um pouco entediante para quem vai lendo sem acompanhar com o
computador ligado no Deja News, vale a pena destacar algumas das
possibilidades de uso avançado deste mecanismo de busca.
* Como padrão, o sistema assume que a busca feita com mais de uma
palavra chave deve gerar resultados em que todas as palavras sejam
encontradas. Se não for este o desejo de quem faz a busca, é necessário
usar os outros (assumindo que o padrão é o "AND") operadores boleanos
"OR" e "NOT". Use parênteses para fazer combinações de boleanos.
Exemplo: "(Jacques OR Layla) AND Charlab"
* Asteriscos podem ser usados para cercar múltiplas palavras que iniciem
da mesma forma, como, por exemplo, "jornal*", que serviria também para
"jornalista", "jornaleiro", etc.
* Aspas podem ser usadas para busca das palavras na exata sequência,
como em "Jornal do Brasil".
* O símbolo do acento circunflexo pode ser usado para denotar uma busca
de proximidade, onde pode-se determinar a que distância máxima duas
palavras devem ser encontradas para servirem como resposta.
O Deja News também permite busca por contexto, como "author", "subject",
ou "newsgroup". O sinal usado é o de um til, seguido, sem espaço, das
letras "a", "s" ou "g", respectivamente para as três possibilidades de
busca. Exemplos: ~a charlab@ax.apc.org, ~s Photoshop 4.0 ou ~g warez.
Note que dentro dos campos de busca você pode usar a linguagem boleana
ou outros operadores, não havendo, por exemplo, necessidade de colocar
um e-mail completo na busca por autor.
Não posso deixar de mencionar o chamado "Query Filter", que lhe permite
definir campos de busca no modo avançado. Sei que não é todo mundo que
vai se interessar por tamanho minúcia para melhorar os resultados de
suas buscas. Mas está lá, disponível.
* * *
Ninguém tem dúvidas de que o Deja News, na categoria de oráculo Usenet,
é o maior. Mas já vimos que nele não é possível ler, por exemplo, as
mensagens binárias. Felizmente a Internet é democrática o suficiente na
oferta de opções para tudo. Tome nota de um dos, por assim dizer,
concorrentes do Deja News: http://www.reference.com/ O Reference.COM, em
fase beta ainda, faz busca em 16 mil newsgroups e ainda inclui centenas
de listas de discussão. Também permite leitura e postagem de news. E
lembre-se que o AltaVista, Excite e Infoseek, oráculos tradicionais,
também permitem a busca de mensagens Usenet.
* * *
Dominar o uso das técnicas de busca nestes "Oráculos Digitais" é a
melhor estratégia para quem quiser sentir-se à vontade com a Internet.
Esta foi a décima segunda parte da série sobre os mecanismos de busca e
indexadores da Internet. Os que chegaram agora à série podem pedir os
textos anteriores enviando mensagem para este outro endereço:
charlab@charlab.com.br. Se as respostas atrasarem é porque ainda estou
sentado no caixote na casa antiga, sem a geladeira. (Espero que não!)
Semana que vem, Yahoo!, o mais famoso "oráculo diretório" da Internet.
A propósito, descobri (dica obtida no newsgroup
rec.aquaria.freshwater.misc) que para mover aquários deve-se colocar os
peixes em sacos com água do próprio aquário. Quanto mais sacos e quanto
mais água, melhor. Transporta-se o aquário vazio e, depois de recolocar
os peixes e a água transportada em sacos, completa-se o nível com água
nova. Bem lógico, não? Aproveito e compro mais um para que o Jacques
fique feliz ao contar oito peixes novamente no aquário.
Sérgio Charlab
charlab@ax.apc.org
http://www.charlab.com.br
Os Oráculos Digitais: Yahoo! (Tutorial, parte 13)
O que têm em comum o Chevere! (http://www.chevere.com), Explora Mexico
(http://www.exploramexico.com/), Robohoo!
(http://www.geocities.com/CapeCanaveral/3355/index.html), YoPet!
(http://www.hisurf.com/yopet/), Adultinks (http://www.adultlinks.com/),
Cade? (http://www.cade.com.br), Fantastico!
(http://www.fantastico.com/), Jubii! (http://www.jubii.dk/), Naughty
Linx (http://www.naughty.com/), Ole! (http://www.ole.es/), Ozu
(http://www.ozu.com/), Seznam (http://www.seznam.cz/), Snoohoo!
(http://www.ifi.uio.no/~hermunda/Snooker/Snoohoo/), Uffda!
(http://www.mnonline.org/uffda/), Walla! (http://www.walla.co.il/),
Who's Hoo in South Africa (http://www.whoshoo.co.za/cgi-bin/index.pl),
Woohoo! (http://woohoo.pair.com/), Yahala! (http://www.yahala.com/),
Yahho (http://yahho.ita.tutkie.tut.ac.jp/yahho/), Yaih?
(http://www.ci.rnp.br/si/index.html), Yeehaw
(http://Yeehaw.Nashville.Net/), Yehaa! (http://www.yehaa.com/), YEOWSA!
(http://www.msjnet.edu/yeowsa/), YiPPiE! (ttp://www.dn.net/yippee/),
Yoohoo! (http://www.amorn.baremetal.com/yoohoo/), Yoohoo! Lesbians!
(http://www.sappho.com/yoohoo/) e o yOyee! Net (http://www.yoyee.com/)?
São todos "Yahoo! Inspired". Ou seja, inspirados no Yahoo!
(http://www.yahoo.com). E se é verdade que as coisas bem feitas são logo
copiadas, então o Yahoo! está no bom caminho. O Yahoo! surgiu em abril
de 1994 e era apenas um hobbie de David Filo e Jerry Yang, candidatos a
um doutorado em Engenharia Elétrica na Universidade de Stanford, na
Califórnia. O nome é um acrônimo para "Yet Another Hierarchical
Officious Oracle". Bem, a empresa hoje é a Yahoo! Inc. Tem ações em
bolsa e 340 anunciantes na carteira. Ainda está em fase de
amadurecimento, por isso perde dinheiro. Mas sua liderança entre os
mecanismos de busca, com oferta diária de 14 milhões de páginas para os
usuários, põe o Yahoo! numa situação bem especial.
* * *
Um dos pioneiros e certamente o mais popular mecanismo de busca da
Internet, o Yahoo!, um "oráculo diretório", baseia sua funcionalidade na
classificação do World Wide Web em categorias. São 14 as categorias
principais do Yahoo!: Artes e Humanidades, Economia e Negócios,
Computadores e Internet, Educação, Entretenimento, Governo, Saúde,
Notícias e Mídia, Recreação e Esportes, Referência, Regional, Ciência,
Ciências Sociais, e Sociedade e Cultura. Naturalmente, tudo isso
devidamente no idioma pátrio do Yahoo!, o inglês.
A partir de umas das 14 categorias, você, mesmo sem fazer qualquer busca
por palavra-chave, pode refinar a procura. Clique, por exemplo, em
"Society and Culture" e você verá dezenas de subcategorias, como
"Relationships". O número à direita indica quantos sites estão
catalogados, o que, no caso de "Relationships", chega a 202. Clique ali
e vai obter mais umas duas dezenas de (sub) subcategorias, como
"Romance", que aparece com 41 sites. Clique em "Romance" e você estará
diante de mais algumas (sub)(sub) subcategorias e vários sites com
endereço e breve descrição, como o "Cupid’s Love Notes", a partir do
qual você envia um galanteio digital para a pessoa que ama.
Naturalmente, se já ao acessar a página inicial do Yahoo! você resolver
fazer uma busca por palavra-chave usando para isso a palavra "cupid",
vai receber 26 respostas, das quais a última é exatamente o "Cupid’s
Love Notes" (http://www.northernlife.com/valentin/).
* * *
Como o Yahoo! é um oráculo de diretórios, através dele mesmo é fácil
pesquisar a popularidade dos sites de mecanismos de busca na Internet
(http://www.yahoo.com/Computers_and_Internet/Internet/World_Wide_Web/Sea
rching_the_Web/).
Segundo o Yahoo!, são 144 diretórios e 35 índices. Chegam a 103 o número
de páginas que reúnem vários mecanismos de busca em forma simplificada e
a 104 o número de mecanismos de busca propriamente ditos. Além dos já
mencionados "Yahoo! Inspired", entre os quais os brasileiros Yaih? E
Cadê?, existe ainda a categoria de "Yahoo! Parody" (paródia), e um
destes merece a sua visita: o Yancovic!
(http://www.contrib.andrew.cmu.edu/~sc5x/yankovic.html).
Mas voltando ao sistema de categorias do Yahoo!, você pode usar uma ou
mais palavras-chaves para achar o que procura. Clique em "options" e
haverá a chance de escolher o local de busca (no próprio Yahoo!, na
Usenet - via Deja News - e num catálogo de e-mails - via Four11); o uso
do boleano "AND" ou "NOT", para você combinar ou excluir palavras-chaves
na busca; a quantidade de resultados exibidos por tela; e o uso das
palavras completas ou não para localizar os resultados.
Sendo um "Oráculo Diretório", ao Yahoo! nunca coube destaque no trabalho
de vasculhar a imensidão de sites da rede. Seu banco de dados, embora
classificado por seres humanos (o que, felizmente, ainda traz algumas
boas vantagens) é modestíssimo perto dos arquivos dos demais mecanismos
de busca. Portanto, o Yahoo! só é bom para coisas mais genéricas, e não
para buscas de termos específicos. Ao apresentar resultados, primeiro
lista categorias, depois sites avulsos. "Rio de Janeiro", por exemplo, é
resultado da categoria "Regional" e subcategorias "Countries", "Brazil"
e "States". O Yahoo! exibe esta informação assim:
Regional:Countries:Brazil:States:Rio de Janeiro.
Mas nem tudo está perdido para buscas mais específicas. Fãs do Yahoo!
podem perfeitamente utilizá-lo como ponto de partida. Não só o Yahoo!
está desenvolvendo um novo mecanismo de busca (que você acessa a partir
da referência "Try Our New Search"), à direita, na página principal,
como toda busca apresenta, logo acima da lista de resultados, a chance
de procurar no "AltaVista Web Pages". Isso é resultado do acordo entre o
Yahoo! e o AltaVista. Se sua busca no Yahoo! não der qualquer resultado,
automaticamente você já receberá os resultados da busca no AltaVista. Se
não bastar, no final da lista de resultados, aparecem ainda as
referências para outros mecanismos ("Other Search Engines"), como o Alta
Vista , Image Surfer, WebCrawler, HotBot, Lycos, Infoseek, Excite e
DejaNews. Clicando num destes, você não precisa escrever as
palavras-chaves de sua busca; o Yahoo! automaticamente repassa as
palavras-chaves utilizadas para estes outros mecanismos. É rápido e
interessante.
* * *
Junto ao Excite e ao HotBot, o Yahoo! acaba de ser escolhido como
"Editor’s Choice" pela PC Magazine norte-americana. A revista fez uma
avaliação comparativa dos dez principais mecanismos de busca
(http://www.pcmag.com/iu/srchsite/_open.htm): AltaVista, Excite, HotBot,
Infoseek, Lycos, Magellan, Open Text, WebCrawler, WWW Worm e o Yahoo! Há
quem diga que vem acompanhando com atenção esta coluna (hehehe...). Mas
é
interessante notar como a reportagem destaca que "nenhum único mecanismo
de busca é capaz de dar conta de todas as tarefas". O Excite (parte 9
deste tutorial) levou o título de melhor para buscas genéricas,
apresentando alto percentual de respostas relevantes.O HotBot (parte 3
deste tutorial), ganhou destaque ao combinar seu enorme banco de dados
de texto completo das páginas Web com uma sofisticada interface de
busca. E o nosso Yahoo! de hoje ganhou como melhor diretório Web, com
classificação de alta qualidade dos sites de suas 14 categorias e
milhares de subcategorias.
* * *
Tem mais Yahoo! semana que vem. Até lá, procure instalar o "my yahoo!
news ticker" (para Windows 95! ou NT 4.0 apenas - usuários de Macintosh
e Windows 3.1 serão atendidos em breve, eles prometem - e para quem usa
qualquer versão do Netscape ou Explorer versão 3.0). É bem interessante
para quem quer ter notícias enquanto navega pela rede. Está em
http://my.yahoo.com/ticker.html.
Esta foi a décima terceira parte da série sobre os mecanismos de busca e
indexadores da Internet. Os 27 leitores que apostaram que a série
terminaria na décima segunda parte já não ganham mais. Apostas estão
sendo aceitas para ver quem adivinha em que parte a série chegará ao
fim. Histórias verdadeiras, instrutivas ou pitorescas, sobre o uso de
mecanismos de busca são bem-vindas e devem ser enviadas para meu
endereço usual, charlab@ax.apc.org. Os que chegaram agora podem pedir os
textos anteriores da série enviando mensagem para este outro endereço:
charlab@charlab.com.br
* * *
Não sou fã de festas e comemorações, mas quero registrar meu
agradecimento ao leitor de Ciberespaço, a primeira coluna sobre Internet
na imprensa brasileira e que agora completa dois anos.
Sérgio Charlab
charlab@ax.apc.org
http://www.charlab.com.br
Os Oráculos Digitais: Yahoo! (Tutorial, parte 14)
O Yahoo! (http://www.yahoo.com) é mais um dos oráculos que cresce
lateralmente na Internet. Para satisfazer os 15 milhões de conexões diá
rias que recebe de mais de 90 países, o Yahoo! cada vez oferece mais
serviços paralelos. Meu filho Jacques, de 5 anos, por exemplo, mal sabe
o que é o Yahoo!, mas confia plenamente no Yahooligans!
(http://www.yahooligans.com/), espécie de Yahoo! para crianças operado
pela mesma empresa do original. Lembre-se que, como o Yahoo!, o
Yahooligans é classificado por humanos e mantém um catálogo de sites de
qualidade. Pode deixar seu filho à vontade ali.
Como pai, minha queixa é apenas o idioma. Está tudo em inglês. Mas até
nisso o Yahoo! parece caminhar de lado em bom ritmo. Já existe um Yahoo!
France (http://www.yahoo.fr/), um Yahoo! Deutschland
(http://www.yahoo.de/) e um Yahoo! Japan (http://www.yahoo.co.jp/), fora
outros de lingua inglesa como os do Canadá e do Reino Unido. Alguém
precisa dizer aos executivos da Yahoo! Inc. que aqui temos 500 mil usuá
rios da Internet que falam português! Afinal, já há Yahoo! especial até
para algumas cidades americanas.
Por falar nisso, hoje é uma empresa chamada Softbank Corporation, de
origem japonesa, quem dá as cartas no Yahoo!, com quase cerca de 30% das
ações da empresa. Trata-se da mesma que adquiriu 100% da ZDNet, a mais
famosa editora de informática e que publica, entre outras, a PC
Magazine. E entre os "serviços paralelos"do Yahoo! está até a publicação
de uma revista, a "Yahoo! Internet Life".
Gosto de enfatizar o aspecto econômico e de business destas empresas
porque são elas, provavelmente, as que mais potencial de crescimento têm
para a próxima década. Assim como em 1980 Compaq e outras empresa
surgiam aproveitando o nicho novo dos computadores pessoais, agora são
as empresas de "oráculos" e outros serviços Internet que sonham em
aproveitar a nova onda de negócios.
* * *
Provavelmente a vedete destes "outros" Yahoo! é o My Yahoo!
(http://my.yahoo.com/). Ali você customiza (faz com que o Yahoo!
apresente informações especiais para você) tudo. Minha página, por
exemplo, traz sempre as notícias dos assuntos que eu quero ler e as cota
ções das Bolsas e das ações que me interessam. Infelizmente, nos
resultados de esportes, ainda não posso escolher dados sobre futebol
brasileiro, mas já é um avanço poder visualizar a temperatura do Rio,
São Paulo e Brasília. Não vou entediar você descrevendo os passos para
fazer um registro gratuito no My Yahoo! É simples e de graça. Investigue
o "Firefly", que a partir de algumas respostas de suas preferências
passará a dedicar-se a localizar sites só para seu deleite.
Pode ser que sistemas "inteligentes" e personalizáveis como o My Yahoo!
(já vimos outros similares nesta série dos "Oráculos") possam
representar concorrentes de classe para as empresas jornalísticas na
Internet. Explore o My Yahoo! Monte suas escolhas a partir dos botões de
"My Internet", "My News" e "My Contacts".
* * *
O Yahoo! dispõe ainda de um mecanismo de páginas amarelas, em parceria
com a Lookup USA para cidades americanas (só de brincadeira, escrevi
"Rio" e descobri que existem cinco cidades com o nome de "Rio" nos
EUA!). As páginas amarelas no estilo Yahoo! representam uma idéia e
tanto para empreendedores digitais brasileiros. As que vi aqui no Brasil
são ainda iniciantes (veja uma em
http://www.telelistas.com.br/welcome.htm).
Quem vai viajar para os EUA não deve deixar de consultar. E use o
sistema de mapas que está lá e lhe mostra o ponto exato de cada pequeno
comércio da cidade. (Pode deixar cair o queixo, porque é mesmo
impressionante!) Como usar? Escreva na ranhura de busca, por exemplo,
Orlando. Existem três cidades com este nome. Selecione a da Flórida
(FL). Você vai ficar diante de um subYahoo! só para o comércio/serviços
de Orlando. Como toco bateria, resolvi procurar uma loja do gênero.
Claro que há muitas lá e que eu conheço bem. Quando as encontrei, foi
porque abri o catálogo de páginas amarelas do hotel. Agora, posso chegar
a Orlando com todos os endereços e mapas de que necessito. Ao fazer a
procura, recebo o nome, endereço, distância e mapa da loja.
Bem, mas o que é que há comigo? Não chega a ser tão extraordinário
assim, pois até o Lycos oferece serviço similar
(http://www.vicinity.com/yt.hm?&FAM=lycos&CMD=FILL&SEC=ytstart).
* * *
Também são atrações do Yahoo! as notícias oferecidas em parceria com a
Reuters (http://www.yahoo.com/headlines/), cotações de ações
(http://quote.yahoo.com/), e resultados esportivos
(http://sports.yahoo.com/).
O mecanismo de busca do Yahoo!, simples, ganhou reforço com o
"http://search.main.yahoo.com/". Há ótimas opções, como a colocação dos
sinais [c], [s], [n] ou [e] na frente da palavra-chave (como em
"[e]music") para restringir a busca, respectivamente, às categorias do
próprio Yahoo!, Web sites, Usenet e os "Net Events", espécie de guia de
programação de TV, no caso, da Internet (veja direto em
http://events.yahoo.com/). As outras opções de busca são similares às do
AltaVista.
Não tenho muito mais espaço e certamente não vamos fazer uma outra parte
ainda sobre o Yahoo! Por isso, espie em
http://www.yahoo.com/docs/family/more.html para ver o conjunto das
ofertas de serviços do Yahoo!.
* * *
Esta foi a décima quarta parte da série que ameaça entrar 1997
apresentando os mecanismos de busca e indexadores da Internet. Os que
chegaram agora podem pedir os textos anteriores da série enviando
mensagem para este outro endereço: charlab@charlab.com.br. E eis aqui o
leitor Cleverson (clever@iq.ufrj.br), que faz pós-Graduação em Química
Orgânica na UFRJ, descrevendo suas experiências com o DejaNews.
"Andei fazendo algumas pesquisas no DejaNews e confesso que fiquei
impressionado. Realmente parece que lá [na Usenet] se conversa sobre
tudo o que se possa imaginar. Só fiquei decepcionado porque na minha á
rea de interesse (no caso, relativo ao meu trabalho) havia muitas
mensagens de cunho comercial. Mas consegui extrair um artigo
interessante com aproximadamente seis páginas de um pesquisador desta
minha área (era uma FAQ). Só por isso já valeu a pena."
Valeu a pena? Mas claro, seis páginas de FAQ (Frequently Asked
Questions) mastigadinha (são perguntas já acompanhadas das respostas - h
á um monte delas a partir de
http://www.cis.ohio-state.edu/hypertext/faq/usenet/).
"Por isso [segue Cleverson, agora levantando a bola da coluna e
aliviando a consciência do colunista pelo fato de estar entrando no
buraco sem fundo da série dos " Oráculos"], quero dar-lhe parabéns pela
sequência de artigos. Você esta nos apresentando alguns elementos dentro
da Internet que não são de conhecimento geral (eu mesmo só conhecia as
search engines mais populares como Alta Vista e Yahoo!). Continue
expandindo os nossos horizontes. Obrigado. Sobre a aposta [quantas
partes terá esta série?]. Acho que se o Yahoo! for o último, então
teremos mais uns quatro artigos. Mas pela amostra que a Internet nos dá,
talvez não tenha fim."
Será?
Sérgio Charlab
charlab@ax.apc.org
http://www.charlab.com.br
----------------------------------------------------------------------
SÉRGIO CHARLAB (charlab@ax.apc.org) (http://www.charlab.com.br) é
Editor-Chefe de Seleções do Reader's Digest (http://www.selecoes.com.br),
colunista de "Ciberespaço" do Jornal do Brasil e autor dos livros
"Você e a Internet no Brasil" (http://www.charlab.com.br/ch2505.html)
e "O Seu Futuro Eletrônico".
----------------------------------------------------------------------
Os Oráculos Digitais: WebCrawler (Tutorial, parte 15)
O WebCrawler (http://www.webcrawler.com) é veterano na área. Tem hoje
como slogan a frase "Search before you surf" (procure antes de navegar)
que é conselho que venho repetindo há 15 semanas. Virou "oráculo" ainda
em 1994, a partir de um trabalho de pesquisa de Brian Pinkerton, da
Universidade de Washington, que o transformou no primeiro mecanismo de
busca por texto completo de páginas Web. Pessoalmente, nunca fui grande
fã do WebCrawler. Por uma ou outra razão, havia sempre outro "oráculo"
que me parecia melhor, mais rápido ou mais atraente.
Pelo visto, minha indiferença diante do WebCrawler não o prejudicou.
Depois de amargar problemas como próprio sucesso, foi adquirido, em
1995, pela gigante America Online, que injetou os recursos necessários
para torná-lo competitivo em meio à avalanche de "oráculos" que surgiam
a cada mês. Pesquisa da PC-Meter (http://www.npd.com:80/c_pcmdef.htm),
em setembro, colocou o Web Crawler como o segundo site Web de maior
tráfego, com 29,2% do total, graças, claro, ao fato de ele fazer parte
da America Online. Na verdade, não faz mais, tecnicamente falando. O
Excite (que já foi visto aqui neste tutorial) adquiriu o WebCrawler mês
passado em meio a negócios e uma aliança estratégica com a América
Online, que detém cerca de 20% do controle do próprio Excite.
* * *
O WebCrawler vai me dar licença um instante para que eu volte a falar do
"milagre brasileiro". Está em http://www.openlink.com.br/art/ e chama-se
"Assistente Remoto de Tradução Openlink" - que vamos chamar aqui,
carinhosamente, de ARTO. Falei nele em Ciberespaço há alguns meses, mas
volto ao tema porque a demanda por este pequeno milagre é incessante. O
ARTO traduz, num click de mouse, frases de inglês para português. Só
funciona em Windows95 e com acesso através da rede Dial-Up. É preciso
estar conectado na Internet para usá-lo, mas o texto original em inglês
não precisa estar numa home-page; pode estar no seu editor de textos.
Compreendendo o funcionamento dos "Oráculos Digitais" e com o ARTO numa
janela flutuante, pronto para traduzir as frases em inglês que
eventualmente fazem com que você emperre em algum canto, você vira o
mestre da Internet. Veja como o ARTO se sai com a primeira frase do
relato sobre a história do WebCrawler.
* Original em inglês
(http://webcrawler.com/WebCrawler/Facts/WCStory.html): "The WebCrawler's
history is a story about how the rapid rise of the Internet transformed
a University of Washington research project into a successful commercial
product."
* Tradução do ARTO (sem correção): "A história do WebCrawler é um relato
sobre como o crescimento rápido do Internet transformou uma Universidade
de projeto de pesquisa de Washington num sucedido bem produto
comercial."
Que tal? Bem razoável, não?
* * *
Com uma interface simples, o WebCrawler é amistoso com o usuário. Como
sempre, você escolhe uma ou mais palavras-chaves, digitando-as na
ranhura e clicando no botão "search". Suas opções nesta busca são também
simples: pode-se optar pela procura por "titles" ou "sumaries" (prefira
o segundo, mais completo, embora o primeiro seja significativamente mais
rápido) e telas de resposta com 10, 25 ou 100 itens. A exemplo de outros
"oráculos", o WebCrawler hoje apresenta também uma seleção de 18
categorias de Web sites com sugestões de qualidade acompanhadas de uma
pequena resenha.
No alto da página, o logo do WebCrawler está sempre acompanhado de cinco
botões. O primeiro (search) é o da própria home-page. O botão "browse"
apresenta as 18 categorias de sites selecionados. O botão "special"
oferece meia dúzia de links interessantes e divertidos. O primeiro deles
é um link randômico, o WebRoulette, que apresenta 10 URLs quaisquer para
quem gosta de aventuras e, em vez de navegar, prefere ficar à deriva,
deixando-se levar pelos ventos e a maré. Outros links permitem a criação
de um botão que você pode colocar na sua própria página já com uma busca
programada; o acompanhamento, através de um dispositivo em Java, das
palavras-chaves que os usuários estão usando para pesquisas no
WebCrawler (não se preocupe, pois é impossível saber quem pesquisou o
quê); e dados estatísticos do Web pesquisado pelo WebCrawler (83% do Web
ainda está sob sistemas Unix!). Além disso, uma busca reversa no Web
permite saber o número de referências feitas a uma determinada página e
quais são os sites mais referenciados de toda a Internet:
1. Download Netscape Software (35,979)
2. Yahoo (33,758)
3. WebCrawler Searching (25,717)
4. Welcome to Netscape (20,884)
5. WebCounter Home Page (19,857)
6. The Blue Ribbon Campaign for Online Free Speech (16,395)
7. Starting Point (11,978)
8. Microsoft Corporation (10,342)
9. Lycos, Inc. Home Page (9,875)
10. Infoseek Guide (9,053)
11. Internet Audit Bureau (8,140)
12. Welcome to Pizza Hut (8,065)
13. Alta Vista: Main Page (6,161)
14. Point: It's What You're Searching For (5,977)
15. ESPNET SportsZone (5,192)
16. CNN Interactive (5,067)
17. Apple Computer (5,038)
18. Welcome To The White House (4,950)
19. Macmillan Computer Publishing (4,894)
20. IBM Corporation (4,847)
Voltando aos botões, "add URL" permite que você adicione sua URL ou
outras ao WebCrawler e o último botão é o de "help", que você agora já
pode destrinchar, em companhia do ARTO, mesmo que não seja "fera" no
inglês.
* * *
Interface simples no caso do WebCrawler é opção (que eu aplaudo) e não
"falta de opção". Ninguém precisa ser mestre em boleanos (se você não
sabe ainda o que são boleanos não deixe de pedir por e-mail as partes
deste tutorial que você perdeu). Para quem já sabe o que é, basta
experimentar as combinações de palavras-chaves com os boleanos "AND"
(default), "OR" ou "NOT". O "NEAR" pode ser usado para buscar duas
palavras que devam aparecer distantes por não mais de 25 palavras.
Exemplo da sintaxe: "tradução NEAR/25 openlink". Sem a especificação do
número, o WebCrawler vai procurar palavras que aparecem lado a lado, em
qualquer ordem. Se quiser procurar palavras adjacentes numa determinada
ordem use "ADJ". Use parênteses para organizar buscas mais complexas de
boleanos. Aspas podem ser usadas para caracterizar "frases" de busca,
sequência de duas ou mais palavras que são procuradas de forma idêntica
pelo WebCrawler.
Os resultados da sua busca nao melhoram com o uso desta sintaxe. O que
ocorre é um refinamento das respostas, reduzindo a quantidade e
facilitando a identificação das melhores. São boas opções, mas ainda
assim podem ser consideradas pobres diante de outros mecanismos de busca
vistos ao longo deste tutorial.
* * *
O WebCrawler utiliza os famosos "cookies" para guardar as suas
preferências de busca (http://webcrawler.com/cgi-bin/prefs.cgi).
"Cookies" poderia ser assunto para uma coluna inteira, mas por ora
parece ser sufuciente entender para que servem: fornecem alguma
informação sobre o visitante para o servidor da página visitada. No caso
do WebCrawler, os "cookies" garantirão que suas preferências de busca se
mantenham. Em outros sites, é usado para guardar sua senha e password de
acesso, caso do Universo Online (http://www.uol.com.br). Não é tão
assustador quanto parece, mas talvez você queira ler mais em
http://webcrawler.com/WebCrawler/Help/Cookies.html. Não se queixe de que
está tudo em inglês; use o ARTO!
* * *
Esta foi a décima quinta parte da série que apresenta os mecanismos de
busca e indexadores da Internet. No ranking de apostas sobre em que
parte a série chega ao seu final, está na frente a "parte 17", que
coincide com o último dia do ano. Os que chegaram agora ou perderam
partes anteriores podem pedir os textos da série enviando mensagem para
este meu outro endereço: charlab@charlab.com.br. Já escrevi sobre o
Altavista, Hotbot, Lycos, Infoseek, Bookmarks, Excite, NlightN e Yahoo!
Começo a receber cada vez mais e mais mensagens estimulantes sobre a
iniciativa da série, de gente que, como eu, compreendeu que dominar o
uso das técnicas de busca nestes "oráculos digitais" é a melhor
estratégia para quem quiser sentir-se à vontade com a Internet.
Sérgio Charlab
charlab@ax.apc.org
http://www.charlab.com.br
Os Oráculos Digitais:
MetaCrawler (Tutorial, parte 16)
Como tudo, cada oráculo digital terá sempre seu lado positivo e
negativo. Então, depois de 15 semanas acompanhando a série, você quer
saber como escolher o melhor para fazer sua busca? Embora eu já tenha me
programado para não encerrar a série sem antes fazer a melhor análise
comparativa que minha capacidade permitir, a escolha do melhor não é tão
importante assim. Você sempre pode usar mais de um orá culo. Pensando
nisso é que surgiu o MetaCrawler (http://www.metacrawler.com). Com este
metaoráculo, você faz sua busca simultaneamente nos seguintes oráculos:
Open Text, Lycos, WebCrawler, InfoSeek, Excite, Inktomi, Yahoo e Galaxy.
Note a importância da palavra simultaneamente; não se trata de uma mera
relação de vários orá culos, mas de um mecanismo que opera a busca nos
vários oráculos de uma só vez.
Brilhante idéia, não? Tão brilhante que o MetaCrawler tornou-se em pouco
tempo o melhor segredo dos grandes WebDetetives. Uma busca: resposta de
oito orá culos. Não tenho certeza se o projeto de Erik Selberg, Greg
Lauckhart e do professor Oren Etzioni foi o primeiro a usar o conceito
de meta na área. Mas eu venho usando o MetaCrawler há muito tempo, desde
que ele era relativamente lento e atendia no modesto endereço
http://metacrawler.cs.washington.edu/, da universidade de seus
criadores. Como a Internet é campo fértil para mentes criativas, já, já
aparecem os metametaoráculos. Sim, porque se existem metaoráculos que
fazem buscas em outros oráculos, haverá de surgir metametaoráculos que
farão busca em metaorá culos. E assim sucessivamente, claro...
* * *
A interface padrão do MetaCrawler é simplíssima, mas o que não falta é
tecnologia e possibilidades de refinamentos com Java, frames, cookies e
sabe-se lá mais o quê. Naturalmente, a utilidade de metaoráculos como o
MetaCrawler paga o peso de relativa lentidão (embora a criatividade
tenha contornado isso, oferecendo as primeiras respostas sem esperar
pelo final dos resultados).
Teoricamente não há risco de repetição de respostas, porque o
MetaCrawler elimina duplicidades. Também não se pode sair refinando
muito uma busca em metaoráculo, desde o início, com o uso de operadores
boleanos (ou booleanos, porque vêm da criação do matemático Boole). Mas
mesmo assim o MetaCrawler oferece a chance de uso de sinais de + e - e
também de configuração extra com alguns recursos interessantes
(descritos adiante). Além disso, permite busca por qualquer
palavra-chave, por todas as palavras-chaves ou por frase (todas as
palavras na ordem exata em que são pesquisadas).
Finalmente, recebe-se aquela super-resposta. Depois, muitas vezes, ainda
sobra o trabalho de refinar busca a busca, oráculo por oráculo. Mas são,
assim mesmo, muito convenientes. Deu para entender que o MetaCrawler,
portanto, não tem nenhum banco de dados interno, não?
* * *
O MetaCrawler permite algumas configurações muito úteis (embora exija do
seu browser a capacidade de receber cookies - se quiser saber mais sobre
cookies, escreva para charlab@ax.apc.org). Quem não tem browser com
cookies pode fazer um bookmark da página resultante da configuração e
acessar o MetaCrawler a partir deste bookmark. Vá até
http://www.metacrawler.com/configure.html e selecione as opções de
acordo com sua demanda. Extra Functionality mostra na tela padrão do
MetaCrawler algumas opções a mais. Você poderá escolher o número máximo
de respostas por oráculo procurado, o tempo máximo de espera e
(excelente esta que vem agora) limitar os resultados geograficamente.
Recomendo marcar.
Dynamic Status Displays permite aos browsers equipados com Java
acompanhar o processo de metabusca (sensacional!). Usuários do Explorer
3.0 devem fazer o upgrade para 3.01 se quiserem se divertir com este
aplicativo Java. Frame Support, quando habilitado, põe o aplicativo Java
mencionado acima num frame especial, melhorando o conjunto de interface.
E Link Targets, com as opções same windows, same frame e new window
permite escolher se, ao clicar num link de resposta, você abrirá uma
nova página na mesma janela, no mesmo frame ou em outra janela de
browser.
O MetaCrawler permite também que seja ordenada a lista de respostas de
uma busca por localidade, região ou tipo de organização. E apresenta os
resultados em um ranking cujos escores representam a média dos escores
dos oráculos pesquisados.
* * *
Esta foi a décima sexta parte da série que apresenta os mecanismos
debusca e indexadores da Internet. A expectativa dos leitores, em
votação estimulada pela própria coluna, é de que chegarei até a parte 17
ou 20. Sempre lembro aos que estão lendo pela primeira vez uma parte da
série que podem pedir os textos anteriores enviando mensagem para este
meu outro endereço fácil de guardar: charlab@charlab.com.br. Os leitores
regulares ficariam impressionados com a quantidade de gente que aparece
de repente e fica com vontade de saber o que aconteceu até aqui. E quem
acompanha a série mas perdeu uma ou outra parte não deve se intimidar:
peça o que lhe falta. Para mim, esta correspondência é estimulante.
Monitoro o ânimo de quem me lê, e esforço-me mais para justificar as
palavras carinhosas das mensagens dos leitores.
Maurício Pereira (mpereira@acd.ufrj.br) me fez perceber a ambigüidade do
meu comentário, semana passada, de que "83% do Web ainda está sob
sistemas Unix!". Diz ele: "De acordo com a exclamação ao final da
observação - e da palavra ainda - pressupõe-se que este ambiente não
mais deveria estar rodando sob Unix. Gostaria de saber por quê". Ora,
ainda, embora possa ser interpretado do jeito que o Maurício entendeu,
foi colocado ali com orgulho. Ou seja, quer com NT, Mac ou sei lá o quê,
o Unix está firmíssimo. Vê agora como o texto era dúbio? Interessante é
o fato de que o Maurício, admirador do Unix como eu, foi entender
exatamente pelo lado oposto.
Parece usuário de Mac. :-)
Sérgio Charlab
charlab@ax.apc.org
http://www.charlab.com.br
Os Oráculos Digitais: URLs (Tutorial, parte 17)
A primeira semana de 1997 já deu o tom do meu Ano Novo: estou
trabalhando duro, "carregando pedra", mas com um sorriso no rosto,
porque o faço com prazer e ao lado de gente que eu amo e bons amigos.
Não falo apenas do trabalho convencional (porque muitos diriam que estou
sempre cheio de vigor para trabalhar), mas do dia-a-dia.
Na véspera do Ano Novo, notei uma mancha estranha em alguns dos botões
do meu CD-Player. Liguei o aparelho e apertei o eject. A bandeja se
abriu e o CD do Sepultura (Roots) apareceu. Guardei-o na caixa com
cuidado e coloquei um CD do Dark Angel na bandeja. Apertei o play e
observei a bandeja se fechar. Depois de um movimento curto, no entanto,
fez um barulho seco e e parou, 80% para fora. Apertei o eject e o play
sucessivamente, mas não houve jeito de fechar-se. Empurrei então a
bandeja para dentro mas ela não entrou. Alguma coisa a estava travando.
Molhei a ponta do dedo na língua e esfreguei na mancha sobre os botões.
Tal como suspeitei, era chocolate.
- Layla! - gritei.
Desde que me mudei, o CD Player fica a meio metro de altura. Uma
imprudência, sem dúvida, num lar onde o videocassete, no lugar onde se
inserem as fitas, guarda pequenos bonecos plásticos chamados "Gogos",
com os quais meus filhos Jacques, de cinco anos, e Layla ,de dois,
brincam como se fossem bolas de gude deformadas.
* * *
Começar o ano sem uma musiquinha boa foi ruim. Pior foi apertar, no dia
1, o botão da Canon BJ da minha mulher e notar que a luzinha verde de
"on" não se acendeu. Apertei as tomadas e revisei os fios. Nada. Eu não
estava gostando daquilo. Dia 2, a confortável cadeira salmão que eu
comprei - de segunda mão, na Praça da República, por uma pechincha -
para usar com o computador desabou comigo em cima quando tentava ajustar
a melhor altura do assento. Soltei três parafusos da base, disposto a
consertá-la, mas havia um quarto parafuso que se entortou na queda e
travou, coisa que só descobri depois de uns 40 minutos rodando nele
todas as chaves de fenda que encontrei pela casa. Mau.
* * *
Quando o Jacques, dia 3, me acordou dizendo que o computador dele estava
"dando um probleminha" um arrepio percorreu meu corpo de alto a baixo.
Fui lá espiar e a coisa parecia negra. Literalmente, porque estava no
DOS e não havia jeito de entrar nas telas coloridas do Windows. Pedi ao
Jacques para contar, passo-a-passo, o que havia acontecido antes do
problema. Aparentemente a pergunta o deixou preocupado, porque ele se
apressou a descrever em detalhes algumas das fases do game "Full
Throttle" que vinha jogando.
- E aí? - perguntei.
- Aí eu fui um instantinho no banheiro e quando voltei a tela estava
assim, preta - disse ele.
Pudera. Não sei o que o "Full Throttle" tem a ver com isso, mas
aparentemente Jacques andou "explorando" novos limites no seu Pentium.
Com a ajuda do temível "drag and drop" do Windows95, arrastou todo o
diretório Windows (e subdiretórios) da máquina para um obscuro lugar
debaixo do diretório de um game chamado Heimdall. Pelo menos tinha
conserto, e era relativamente simples. Mas, na hora, esqueci do comando
"xcopy". Na "munheca", botei tudo no lugar. Funcionou. As coisas estavam
melhorando.
* * *
Mas o propósito disso tudo era justamente mostrar como é bom poder
trabalhar nestas coisinhas do dia-a-dia. Ser surpreendido por dias
diferentes dos outros ou por (para entrar logo no nosso assunto) "orá
culos" que surgem despretensiosamente ou não para alojar-se em nossas
"bookmarks". Eu os coleciono. Nesta que é a décima sétima parte da série
dos "Oráculos Digitais", vou levar a coisa em estilo "light", e farei o
mesmo até o Carnaval (menos texto e, esperançosamente, qualidade de
conteúdo sem maiores alterações). É uma boa oportunidade para você
completar sua coleção de partes desta série que apresenta os mecanismos
de busca e indexadores da Internet., bastando para isso enviar mensagem
para este outro meu endereço: charlab@charlab.com.br. As figuras e as
URLs mostram seis bons oráculos com objetivos bem diferentes. Use a
intuição e as informações sobre uso dos "oráculos" vistos aqui e você
terá boas chances de aproveitar as seis dicas desta semana. Escreva se
tiver problemas. Ei-las:
1 - http://www.looksmart.com
2 - http://www.hardseek.com/
3 - http://ftpsearch.ntnu.no/ftpsearch/
4 - http://euroseek.net/
5 - http://www.fpsol.com/gems/webgems.html
6 - http://www.servtech.com/public/mvail/home.html
Mas voltando às surpresas do dia-a-dia, seja em casa, com a família, com
os amigos, no trabalho, ou com os computadores e a Internet, como
acontece quando localizamos uma boa URL, um site interessante, cada um
de nós pode encontrar pelo menos uma área estimulante para fazer um dia
diferente do outro, e de cada um deles uma razão para estar feliz.
E vou seguindo neste tom, "carregando algumas pedras", mas não tenho do
que me queixar (até porque depois que sacudi meu CD Player caíram uns
pedaços de chocolate e ele voltou a funcionar - embora a Canon continue
parada). E este ano realizo, provavelmente, um de meus compromissos
pessoais assumido em 1987: ficar dez anos com o mesmo carro! Só perde
para meu relógio de pulso, um Casio 200 metros que comprei em 1983. Como
a bateria do relógio acabou anteontem, cheguei a imaginar o carro, um
dia, superando este recorde de estabilidade do relógio. Mas já ponho
isto em dúvida. Talvez eu estivesse pensando nestas coisas, ontem,
quando inesperadamente um sujeito parou o carro bem na minha frente.
Pisei no freio e senti meu carro parando mas..., não! Será que não vai
dar?... Pára!!! Crash! Foi-se meu farol esquerdo.
Sérgio Charlab
charlab@ax.apc.org
http://www.charlab.com.br
Os Oráculos Digitais: URLs (Tutorial, parte 18)
Nesta que é a décima oitava parte da série dos "Oráculos Digitais", e
até o Carnaval, "Ciberespaço" (a coluna) traz menos texto e, esperanç
osamente, conteúdo suficiente para você somar mais alguns endereços
importantes às suas "bookmarks" de "Oráculos Digitais". Como na semana
passada, apresento mais seis endereços úteis.
Antes, porém, deixe-me completar o trabalho da semana passada, com a
descrição (breve) das seis primeiras URLs:
LookSmart (http://www.looksmart.com) - Tecnologicamente, o LookSmart,
empresa do grupo Reader's Digest, é hoje o mais impressionante oráculo
do Web. Quem tem browser com Java não deve perder a oportunidade de
pedir o modo avançado, embora existam dois outros modos de acesso mais
simples. Sem Java. O LookSmart simula um browser e reúne, em menus que
se expandem, mais de 140 mil endereços listados por categoria e
selecionados entre o que existe de melhor no Web. Também faz conexão
direta com outros oráculos.
HardSeek (http://www.hardseek.com/) - Frequentemente procuramos pelo Web
os sites de empresas de hardware de cujos equipamentos somos proprietá
rios. Quem, por exemplo, é capaz de imaginar que o site da Diamond
(famosa marca de placas de vídeo populares no Brasil) é
http://www.diamondmm.com em vez de http://www.diamond.com? O HardSeek
esta aí para isso mesmo.
FTPSearch (http://ftpsearch.ntnu.no/ftpsearch/) - É o que o nome diz:um
oráculo que faz busca em sites FTP, onde ficam guardados arquivos na
Internet. Quem frequenta sabe que é um mecanismo valioso para encontrar
obscuros arquivos na rede, inclusive pirataria, mas você não pretende us
á-lo para isso, pretende? Não adianta procurar por descrição; tem que
tentar procurar pelo nome do arquivo.
EuroSeek (http://euroseek.net/) - Não seja apressado. O EuroSeek, como
se poderia esperar de um mecanismo de busca voltado para a Europa,
"fala" 24 idiomas, inclusive o português (lusitano, claro). Clique no
"português" e navegue à vontade.
WebGems (http://www.fpsol.com/gems/webgems.html) - Concebido para uso de
estudantes e pesquisadores, o WebGems tem um pouco de tudo, dicionários,
publicações, mapas, bancos de dados, arquivos, etc.
Digital Librarian (http://www.servtech.com/public/mvail/home.html) -
Quem não teve a oportunidade de encontrar uma daquelas excelentes
bibliotecárias que sabem de tudo e dão as dicas certas? Eu não quero
substituir minhas amigas bibliotecárias, mas uma delas fez um bom
trabalho de catalogação neste endereço.
Agora, vamos aos seis endereços desta semana. As figuras e as URLs
mostram mais seis bons oráculos com objetivos bem diferentes. Use a
intuição e as informações sobre uso dos "oráculos" vistos aqui e você
terá boas chances de aproveitar as seis dicas desta semana. Para
completar sua coleção de partes desta série que apresenta os mecanismos
de busca e indexadores da Internet, basta enviar mensagem para este
outro meu endereço: charlab@charlab.com.br.
Galaxy (http://galaxy.einet.net/) - Não há nada de muito diferente do
Galaxy, mas seria injusto não relacioná-lo num trabalho que pretende ser
abrangente no tema dos oráculos. Uso o Galaxy quando quero procurar
coisas no Gopher ou recursos de Telnet (para isso, clique em ädvanced
search").
Hotfiles (http://www.hotfiles.com/index.html) - Trata-se de um arquivo
de programas populares (shareware e freeware) mantido pela ZDNet (que
publica a PC Magazine). Excelente para achar coisa útil e bem
catalogada.
CD Search (http://blueridge.infomkt.ibm.com/knudsen/cdsearch.html) - Um
enorme arquivo de CD's, com mais de 11 mil títulos e 132 mil músicas.
Image Surfer (http://isurf.interpix.com/) - Este é indispensável.
Imagine você precisando de repente da imagem de um macaco, ou de uma
loura, ou do mapa do Brasil. Basta escrever neste oráculo o que você
quer procurar. Se for um arquivo de imagem, o Image Search acha.
WeatherNews (http://weather.yahoo.com/) - Está lá no Yahoo!, mas é um
serviço independente e de grande utilidade. Escreva qualquer uma das
principais cidades brasileiras e você fica sabendo a previsão do tempo
para os próximos cinco dias.
Liszt (http://www.liszt.com/) - Se você quer achar uma lista de
discussão sobre um assunto que lhe interessa, rume para este endereço.
Quase 70 mil listas estão no banco de dados do Liszt, atualizado
semanalmente. Para cada lista, as dicas de como anunciar.
Sérgio Charlab
charlab@ax.apc.org
http://www.charlab.com.br
Os Oráculos Digitais: URLs (Tutorial, parte 19)
Eis o resultado da última pesquisa da PC Meter
(http://www.npd.com:80/c_pcmdef.htm, citada na parte 15 deste tutorial)
da relação dos mais visitados sites no World Wide Web:
1. America Online (40.1%); 2. Yahoo! (38.5%); 3. Netscape (38.2%); 4.
WebCrawler (30.8%); 5. Microsoft (20.8); 6. Infoseek; 7. Excite.com; 8.
Lycos; 9. Microsoft Network (MSN); 10. Geocities; 11. Digital Equipment
Corporation (Alta Vista); 12. Prodigy; 13. CompuServe; 14. Global
Network Navigator Inc;15. Magellan (McKinley.com).
Dentre os 15 mais visitados sites do mundo, sete são oráculos.Nada
mau...
Estamos na décima nona parte da série dos "Oráculos Digitais". Até o
Carnaval, "Ciberespaço" (a coluna) traz menos texto, mais imagens e,
esperançosamente, conteúdo suficiente para você somar mais alguns endere
ços importantes às suas "bookmarks" de "Oráculos Digitais". Como na
semana passada, apresento mais seis endereços úteis. Para completar sua
coleção de partes desta série que apresenta os mecanismos de busca e
indexadores da Internet, basta enviar mensagem para este outro meu
endereço: charlab@charlab.com.br.
Planet Search (http://www.planetsearch.com/) - Um oráculo recém
surgido, simpático, poderoso, e com uma página excelente de referências
junto ao local de busca.
What-U-Seek (http://www.whatuseek.com/) - Simples de usar e fácil
de configurar a busca. Ainda é fraquinho de resultados, mas parece
promissor.
Snoopie (http://www.snoopie.com/) - Anuncia dispor de um arquivo
de 5 milhões de programas de FTP, o que já faz valer a visita.
OneKey (http://www.onekey.com/) - 25 mil sites selecionados por
seres humanos
Dr. Webster's (http://www.drwebster.com/search/search.htm) -
Dezenas de oraculos para voce escolher o mais conveniente.
Search.Com (http://www.search.com/) - O "meta" oráculo da C/NET.
Brinde especial: mais duas relações de oráculos.
UseIt (http://www.lookup.com/Homepages/73107/search.htm#USEIT) e The
"BIG" Page (http://www.beaucoup.com/engines.html).
* * *
Eu nunca havia notado a semelhança entre um mouse e um sabonete até que
a Layla, minha filha de dois anos, colocou o segundo, branco e cheiroso,
em cima do meu mousepad. Dos males o menor. Felizmente - talvez porque
estivesse preso pelo fio -, não levou o mouse para ensaboar-se.
Sérgio Charlab
charlab@ax.apc.org
http://www.charlab.com.br
Os Oráculos Digitais: URLs (Tutorial, parte 20)
Vigésima parte! Estamos em ritmo morno, de verâo, e até o Carnaval,
"Ciberespaço" (a coluna) traz menos texto, mais imagens e,
esperançosamente, conteúdo suficiente para você somar mais alguns
endereços importantes às suas bookmarks de Oráculos Digitais.
Eu tenho surpresas mais para adiante. Os oráculos não são apenas
endereços. Cada um de nós pode ter o próprio oráculo no computador. E
treiná-lo como se fosse um cachorrinho. Esta é a série dos Oráculos
Digitais. Como na semana passada, apresento mais seis endereços úteis.
Para completar sua coleção de partes desta série que apresenta os
mecanismos de busca e indexadores da Internet, basta enviar mensagem
para este outro meu endereço: charlab@charlab.com.br.
Internet Sleuth (http://www.isleuth.com/) - Trata-se de um meta-oráculo
(como o MetaCrawler, parte 16 deste tutorial) capaz de fazer buscas
simultâneas em 10 oráculos ou numa seleção destes, clicando nos itens
com a tecla control pressionada. Você pode ainda controlar o tempo
máximo de cada busca. Melhor ainda é o fato de que o Internet Sleuth
oferece uma respeitável coleção de outros diretórios e bancos de dados
para busca. Segundo eles, no total são 1800, em áreas como notícias,
negócios e finanças, esportes, Usenet e toda a relação de assuntos que
aparece num frame, à esquerda.
Smartest Man in the World (http://www.allrise.com/SEARCH/index.html) -
Uma grande brincadeira, felizmente, divertida. A proposta é fazer
qualquer busca na Internet a partir de respostas a no máximo três
perguntas. A primeira delas, veja só, é "Você está procurando por
fotografias de mulheres peladas ou alguma outra coisa?" Se você
responder "alguma outra coisa", fica diante de nova pergunta: "Você está
procurando um site para aprender sobre o mundo ou para esquecer o
mundo?" E vai por aí. Ah, se você responder que procura fotos de
mulheres peladas, a listagem de sites vem na hora. Nem precisa responder
às outras duas perguntas.
Search.onramp.net (http://search.onramp.net/) - Também um meta-oráculo
que se vende como o mais fácil de usar de toda a Internet. Você pode
selecionar os oráculos nos quais deseja fazer a busca simultânea. Fiz
ali uma busca pela palavra tchan e encontrei a página do Dr. Patrick
Tchan. Mas o mundo não é perfeito, ora. Não se deixe impressionar pela
simplicidade do Search.onramp.net; é bastante poderoso. Espie só,
clicando no botão de advanced query options. Você pode ponderar a
importância de cada oráculo no resultado geral, que aparece em ranking.
Savvy Search (http://guaraldi.cs.colostate.edu:2000/form) - Um dos mais
apreciados meta-oráculos (e também um dos mais antigos entre a nova leva
deles). Fica difícil arrumar argumento para voltar a um oráculo
tradicional depois de experimentar meta-oráculos como este. São mais de
20 oráculos a serem pesquisados. A pesquisa é feita por grupos.
Acessando direto em
http://guaraldi.cs.colostate.edu:2000/form?lang=portuguese você cai na
versão em português.
MetaSearch (http://www.metasearch.com/) - Ao estilo meta-oráculo, este
faz busca no World Wide Web, busca de software e ainda espia
dicionários. As buscas são feitas em dois passos. No primeiro o
Metasearch prepara a interface; no segundo você manda ver.
Starting Point (http://www.stpt.com/) - Como o nome diz, é mesmo um bom
ponto de partida para navegações. Reúne um oráculo e uma série de
diretórios numa interface simples e adequada. A busca também é feita em
dois passos.
Brinde especial: mais uma relação de oráculos: The Best Search Engines
(http://www.lookup.com/Homepages/73107/search.htm), com 72 oráculos
relacionados.
Sérgio Charlab
charlab@ax.apc.org
http://www.charlab.com.br
Os Oráculos Digitais: WebFerret (Tutorial, parte 21)
O Carnaval está demorando. Portanto, vamos trabalhar. E atenção que hoje
vai ser mais difícil. Você vai ter que fazer o download de um software
se quiser experimentar o WebFerret. E eu recomendo. Não se pode conhecer
os oráculos sem usufruir das possibilidades de acessá-los a partir de um
software que exista dentro do seu computador.
O WebFerret é um conceito diferente de metaoráculo. Não estou certo de
que existam claras vantagens no uso de um software de metabusca como o
WebFerret (há muitos outros nesta área) sobre um metaoráculo de
qualidade como, por exemplo, o MetaCrawler. Mas meu papel é passar
adiante o que experimento com sucesso.
* * *
Para quem está chegando agora, esta é a série dos "Oráculos Digitais".
Uma seriezinha comprida, que neste ponto está cinco vezes maior que uma
outra experiência seriada que fiz tendo o Netscape como tema. Estamos na
vigésima primeira parte, o que significa cerca de cinco meses em cima do
assunto "Oráculos Digitais". Sigo adiante até quando houver algo para
escrever em benefício de quem leia. Minha obsessão com os oráculos se
deve ao fato de que não há qualquer outro assunto referente à Internet
que não encontre como ponto de partida para pesquisa estes mecanismos de
busca.
Para completar sua coleção de partes desta série que apresenta os
mecanismos de busca e indexadores da Internet, basta enviar mensagem
para este outro meu endereço: charlab@charlab.com.br. Certifique-se de
que preencheu corretamente seu endereço de resposta. Não há como enviar
resposta se você não configurar adequadamente seu programa de e-mail.
Recebo mensagens de gente com e-mails como seunome@provedor.com.br. Pior
foi alguém cujo endereço de resposta aparecia como sendo "Rua Pinheiro
Machado, número tal e tal".
* * *
Pegue o WebFerret em http://www.webferret.com/webferret.htm ou
http://www.stroud.com/95agents.html#wferret ou ainda
http://www.windows95.com/apps/webmisc.html.
Quando eu falo pegar, refiro-me a clicar sobre a referência em
hypertexto com o nome do programa. Geralmente aparece sublinhada em
azul. Mas atenção, atenção: lamento, mas o WebFerret é só para
Windows95. Infelizmente, novos softwares já não surgem mais com
freqüência para Windows 3.1. Fico triste por nem sempre poder fazer de
Ciberespaço uma coluna pluralista.
A versão que tenho do WebFerret é a 0.88 beta 56 (0.0056). É gratuita e
seu tamanho é de 544k, o que significa menos de 10 minutos de tempo para
download na maioria dos casos. Após o download completo, localize o
arquivo no seu HD e dê um duplo clique nele. É auto-executável e vai
instalar-se automaticamente no seu computador. Siga os passos de
instalação, preenchendo com seu nome (nome da empresa), e-mail e país.
Sugiro que mantenha acionada a "cruzinha" em Add WebFerret to the
desktop para ganhar um ícone do software em local acessível. (Mesmo
assim, ele vai se instalar também debaixo do botão de start (iniciar),
find, World Wide Web pages). Quem não está em rede pode pular os campos
para proxy. Pronto!
* * *
Rode o WebFerret. A interface é simples. Escreva uma ou mais
palavras-chaves, opte por Match all keywords ou Match any keyword.
Aperte [enter] e a busca vai começar. Você verá os resultados
aparecendo, pouco a pouco, na janela de baixo, à medida que o WebFerret
vasculha uma série de oráculos (Altavista, Yahoo!, Excite, Lycos,
Magellan, Hotbot, InfoSeek, InfoSeek Ultra e WebCrawler) e outros
recursos, como o Veronica (do Gopher). É possível configurar a
quantidade máxima de respostas.
Para escolher quais oráculos você deseja ver pesquisados pelo WebFerret,
vá ao menu View, Options, Search Engines. Marque com um "x" os que
deseja. Novas versões do programa trazem sempre as novidades em matéria
de oráculos. E para usar os resultados não é preciso esperar pelo fim da
busca. Basta clicar sobre o item desejado e automaticamente o WebFerret
aciona seu browser que, então, carrega a página. Use também o botão
direito do mouse para mais possibilidades.
* * *
Quem gostar do WebFerret pode fazer uma visitinha à home page do
fabricante onde estão também disponíveis o EmailFerret, NewsFerret e
FileFerret (http://www.vironix.com/netferret/).
Sérgio Charlab
charlab@ax.apc.org
http://www.charlab.com.br
Os Oráculos Digitais: More Like This (Tutorial, parte 22)
Vou ao LookSmart (http://www.looksmart.com) avaliar outros softwares de
mecanismos de busca, tal como o WebFerret, visto aqui na semana passada.
Ali existem 14 deles listados: More Like This, Anysearch for Navigator,
Vironix NetFerret (o WebFerret), Explorer Add-Ons, Internet Agents,
NetSearch, TechSmith’s NewsMonger, Anarchie, WebCompass, CyberAge
Raider, Infoseek Quickseek, LIKSE, Speed Surfer, Teleport Pro. (Depois
que conhecer o More Like This, você pode querer ver mais alguns
softwares do gênero).
A maioria destes 14 já conhecia (gosto muito de experimentar novos
softwares - e isso já está me dando uma idéia interessante-), mas acesso
esta página para mostrar ao leitor que pratico o que prego: ao buscar
respostas, recorro aos oráculos. O LookSmart é um oráculo de categorias.
Quero encontrar, portanto, softwares locais de busca no World Wide Web.
Começo clicando em Computers & the Internet, depois Software Downloads,
em seguida, Internet, Surfing Tools & Software, Browsers & Plug-Ins e,
finalmente, Search Tools, onde acho o que procurava. Experimente! Exige
um mínimo de inglês para você identificar o assunto de cada categoria. O
LookSmart parece-me cada vez mais interessante, mas tenho uma relação
especial com ele, e posso estar sendo influenciado por isso.
* * *
O primeiro Search Tool relacionado lá é o More Like This
(www.morelikethis.com/download.html). Gostei deste software já na
primeira vez que o vi, em setembro passado. E destaco-o nesta que é a
vigésima segunda parte da série dos "Oráculos Digitais", especialmente
porque serve para usuários de Windows 95 e Windows 3.1. Esta seriezinha
comprida já tem data para terminar: vamos até a parte 25. É o que parece
ser suficiente para que eu acrescente o que ainda existe de importante
sobre o tema e me aventure a encerrá-la com uma análise comparativa,
resumo de comandos ou bateria de exemplos - e até os três, se concluir
que posso produzir um bom e útil texto com estes enfoques.
Tenho sido recompensado com mensagens muito carinhosas de gente que me
conta estar sendo a série útil. É meu único objetivo. Dão exemplos do
que acharam com os oráculos, pedem algumas colunas que perderam porque
viajaram ou porque o gato fez xixi em cima. Para completar sua coleção
de partes desta série que apresenta os mecanismos de busca e indexadores
da Internet, basta enviar mensagem para este meu outro endereço: charlab@charlab.com.br.
Mas já que, mais uma vez, vamos falar de um software cujo uso exige de
você a paciência de um longo download (são cerca de 2,5 Mb), que tal
antes dar uma passadinha em http://www.owt.com/headlightsw/ e pegar o
software que todo mundo aguardava: GetRight (pouco mais de 1,5Mb, só
para Windows 95 e NT)? Com este programinha, você pode esquecer os
apuros dos longos downloads interrompidos e que o obrigavam a recomeçar
desde o princípio. O GetRight "emenda" qualquer download interrompido,
seja porque você esbarrou na tecla enter e o cancelou , seja porque sua
ligação caiu ou a luz acabou. Antes dele minha opção era fazer download
com o CuteFTP, que oferece há tempos o mesmo recurso, mas não funciona
dentro do World Wide Web. Note que -- embora seja semelhante na prática
- existe uma diferença entre fazer um download via FTP ou via Web (a não
ser quando o endereço começa com ftp://).
* * *
Instale o More Like This. Esta cópia dá direito a 30 dias de uso
gratuito. Antes, porém, você deve deixar que o programa acesse a
home-page de registro provisório. Ele fará isso automaticamente. Coloque
seu nome e e-mail e copie o número do registro na janela apropriada do
More Like This. Pronto! Depois, dos 30 dias, para prosseguir, você deve
registrar o software (US$ 35). Não tenho nenhuma relação com a empresa
que o criou e vende. O meu não é registrado, ainda que tenha utilizado,
em ocasiões diferentes, o More Like This por mais de três meses.
O More Like This mantém uma pequena janela em formato de retângulo sobre
seu desktop. Clique no botão "show options", à direita, e verá como
configurar o software para acesso a Web ou Usenet, assim como o tipo e o
destino da busca (em qual oráculo). Escreva uma ou mais palavras para
busca e o More Like This entra em ação. Trata-se de um programa sem
mistérios. Seu browser (que deve estar acionado antes de você usar o
More Like This) carrega os resultados da busca desenhando as próprias
páginas dos oráculos.
Mas se é assim, qual seria, então, a vantagem do More Like This? A
interface! É mais simples selecionar o oráculo em que se deseja basear a
busca do que acionar a home-page a partir de um arquivo de bookmarks.
Com o More Like This, você carrega só a página de respostas. Sem ele,
você carrega a página principal de um oráculo e, aí sim, recebe a página
de respostas.
* * *
Outra vantagem, e óbvia, está no nome: More Like This (Mais como esse).
Após uma busca, supõe-se que você acabará navegando por algumas das
páginas apontadas como resultados. Estando numa delas, clique no botão
More Like Title e o software é capaz de procurar mais coisas com base no
título da página carregada. É como se ele tentasse refinar sua busca.
Faz isso também a partir de palavras que você guarde no clipboard. Eis
um exemplo: assim que escrevi a palavra "clipboard", dei um "Control +
C" selecionando a palavra e copiando-a no clipboard. Estou conectado,
com o browser ligado e a janelinha do More Like This no alto da tela.
Cliquei em "More Like Clipboard" e o software, que estava programado
para fazer busca no Dejanews com target Usenet, apresentou os resultados
da procura da palavra "clipboard" naquele oráculo Usenet. Mão na roda!
Explore as demais opções, testando o tipo de search (standard, concept,
wide angle e custom). Experimente as opções e os controles deslizantes
que aparecem quando você seleciona "custom".
Sérgio Charlab
charlab@ax.apc.org
http://www.charlab.com.br
Os Oráculos Digitais: Booleanos (Tutorial, parte 23)
Coisas estranhas acontecem por aqui e nem sei a quem culpar. Primeiro
foi a letra "c" do meu teclado que começou a falhar. (Ainda está
falhando, mas eu reviso o texto, para evitar que frases horríveis como
"ao busar respostas, reorro aos oráulos" sejam publicadas nesta coluna.)
Um dia depois, quando eu praticava com meu Thrustmaster Formula T2
(conjunto de volante e pedais que me permite dirigir simulações de
corrida no computador) o amplificador pifou. Devo explicar que quando
piloto carros de corrida no computador costumo ligar a Sound Blaster no
meu stereo, com caixas de 70 centímetros de altura. É uma emoção e
tanto, aquele sonzão do ronco da "máquina". Mas, como dizia, o
amplificador pifou. Todo mundo sabe que eu não tenho medo de encarar
equipamentos eletrônicos. Desaparafusei a carcaça com cuidado e vi que o
problema era um fusível de 3 amperes queimado. Custa 20 centavos, mas
era domingo. Eu teria pago umas dez pratas se alguém batesse na porta
vendendo um.
* * *
Devo estar envelhecendo, porque, para mim, o que há é uma conspiração. O
Communicator, a versão 4.0 do Netscape, às vezes carrega uma página mas
não faz funcionar nem um link, de modo que não posso clicar em nada.
Tenho que sair do programa e voltar a carregá-lo. Isso, e o novo e lento
sistema de bookmarks do 4.0 está me deixando impaciente. Tanto que
cheguei a examinar seriamente a opção de um tcheco louco que, na
contramão, acaba de desenvolver um browser para DOS (versão de HTML
3.2). Esta máquina aqui roda Windows95. Mas como, não raro quando dou um
boot, recebo um erro que me faz dar novo boot, caio em um loop até que,
como única saída, só me resta entrar na porção DOS do Windows95 -- a
"tela preta", como diz o Jacques, meu filho. Caso você se interesse,
visite http://www.naf.cz/arachne/english.htm (767 Kb). Roda até em XT
com 640 de memória e EGA de vídeo, se você dispensar as imagens do Web.
(Visite http://www.fdisk.com:80/doslynx/ se o assunto browser para DOS
seja do seu interesse.)
Se eu não dissesse a URL deste browser, ou a outra, que relaciona
experiências de criação de browsers para DOS, como você faria para
localizá-las? Oráculos, claro. Qual deles seria mais apropriado? Para
mim, qualquer um, desde que você identifique corretamente o que deseja
procurar e, assim, utilize a melhor combinação de palavras-chaves de
busca. Neste caso, penso que a melhor saída seja "browser" e "DOS", em
combinação. Vou ao Excite (http://www.excite.com/) e experimento: caio
de primeira na The FDISK.COM DOS Internet Pages, que é a página que
recomendei acima. Ainda no Excite, desta vez buscando na Usenet, o
primeiro item é sobre o "Archane www DOS browser!", cujo texto traz a
indicação da URL do browser da república Tcheca.
* * *
Você é capaz de encontrar o que deseja no Web? Que tal alguns exemplos?
Digamos que você ainda tenha dúvidas sobre o uso de operadores
booleanos, que vêm sendo mencionados nesta série desde que falei do
Altavista. Volto ao Excite (mas poderia ser no Altavista ou em qualquer
outro dos oráculos) e procuro por "operadores booleanos". A primeira
resposta já satisfaz. Vem do México, onde o idioma, nestas duas
palavras, não difere do nosso. Cinco respostas abaixo encontro uma
página do brasileiro Ibama (http://www.ibama.gov.br:80/help.htm ) que
trata do assunto com pertinência (prepare-se para uma aula de álgebra!):
"Os operadores (...) são conhecidos como lógicos [e] também como
"operadores booleanos", do nome George Boole, matemático inglês do
século XIX. Os fundamentos da lógica booleana aplicados à recuperação da
informação são válidos independentemente do sistema ou idioma de
trabalho. (...) Como em álgebra normal, você pode usar parênteses para
alterar a ordem da execução." É o saber à disposição dos usuários
Internet!
Os operadores boleanos são: AND, OR, e NOT. O AND serve para juntar
palavras que devem aparecer no resultado; o OR trabalha como opção, onde
pelo menos uma das palavras apareça; e o NOT aponta palavras que não
devem ser consideradas. O uso dos booleanos é recomendado quando você
tem como possíveis palavras-chaves duas palavras de uso comum quando
vistas separadas, como "fruta" e "laranja". Uma pesquisa sobre
"laranja", cujo objetivo fosse a fruta, poderia resultar em citações da
cor laranja. O melhor, portanto, é pesquisar por [fruta AND laranja].
Experimente, se quiser a receita de laranjas em calda. Da mesma forma,
acrescente "lima" para busca por laranja-lima: [fruta AND laranja AND
lima]. O resultado é a dieta da baiana Ingra Liberato, com direito a
laranja-lima! Suco de laranja-lima é recomendado para o período de
lactação também. Ah, este saber da Internet supera a famosa
"rádio-relógio".
Se a sua pesquisa tiver uma opção, acrescente o operador OR. Veja o
exemplo: [fruta AND laranja OR abacaxi]. A sabedoria surge logo nas
respostas. Tudo que é fruta, seja laranja ou abacaxi, está lá. Inclusive
o "magnífico" Easy Slicer. "A partir de agora descascar um abacaxi não é
mais sinônimo de problema (sic). Com Easy Slicer você leva poucos
segundos para descascar a fruta." Custa R$ 39 na shoptime
(http://www.shoptime.com.br:80/lojas/gourmet/1450.htm). E use o operador
NOT para exclusão, como neste exemplo, que usa o parênteses: [fruta AND
(laranja NOT lima) OR abacaxi].
Resumindo: o operador AND confina melhor uma busca e, deste modo,
melhora a qualidade das respostas, que deverão ser mais próximas daquilo
que você procura (fruta e laranja). Já o operador OR amplia seu espectro
de resultados, porque indica aceitação de duas condições na resposta
(laranja ou abacaxi). O operador NOT exclui coisas na sua busca,
limitando-a. É utilíssimo, mas deve ser usado com moderação para que
você não perca resultados úteis (laranja, mas não laranja-lima).
* * *
Diante de uma busca, primeiro você define o que deseja encontrar.
Escolhe um oráculo (ou um metaoráculo) e um local para a busca (Web?
Usenet? Se você acha que alguém pode ter feito uma home-page sobre o
tema que procura, ou citado o assunto em revista, jornal, etc, vá para o
Web; se acha que o assunto está no nível das conversas, escolha Usenet.)
De acordo com o assunto, resolva se vai pesquisar em português ou se vai
traduzir suas palavras-chaves mais óbvias para o inglês. Aí vem a hora
de executar a busca. Se for simples, escreva uma ou duas palavras, ou
uma frase. Pronto! Se for mais complexa, refine-a com operadores. Ao
receber os resultados, se forem ainda muito numerosos, pense nas
possibilidades para refinar mais sua busca, usando o operador NOT.
* * *
Para completar sua coleção de partes desta série que apresenta os
mecanismos de busca e indexadores da Internet, basta enviar mensagem
para este meu outro endereço: charlab@charlab.com.br. Anote mais quatro
oráculos que valem a visita: EcoSearch
(http://www.iconovex.com/ECHO/ECHOS.HTM); Cyber 411
(http://www.cyber411.com/); Forum One (http://www.forumone.com/); e
Inference Find (http://m5.inference.com/ifind/)
* * *
Acabei de trocar o fusível do meu amplificador. É fácil. Mas o novo, que
coloquei lá, durou um milionésimo de segundo e se foi com a luz de um
pequeno raio assim que apertei o botão "power".
Sérgio Charlab
charlab@ax.apc.org
http://www.charlab.com.br
Os Oráculos Digitais: Qual o melhor? (Tutorial, parte 24)
Eu não vou responder à pergunta do título, mas pretendo alimentar suas
idéias para que, a cada vez que realize uma busca, conheça bem suas
opções e avalie quais delas vai utilizar. Há três maneiras de anal;isar
oráculos comparativamente: segundo seus recursos de arquivo e
atualização, sua linguagem de busca e sua área de operação.
Danny Sullivan, da Calafia Consulting mantém em
http://calafia.com/webmasters/chart.htm uma atualizada comparação entre
os "search engines" no aspecto arquivo e atualização. Quem gosta dos
grandes números para tomar decisões deve se dirigir ao banco de dados de
66 milhões de URLs do Lycos (http://www.lycos.com). Hotbot
(http://www.hotbot.com), InfoSeek (http://www.infoseek.com) e Excite
(http://www.excite.com) seguem algo distantes dos calcanhares do Lycos,
com cerca de 50 milhões de URLs.
Mas, veja só, de todos estes oráculos citados, só o Lycos não mantém
arquivo de texto completo das páginas que registra em seu banco de
dados! A vantagem de oráculos com texto completo é óbvia: sua
palavra-chave de busca poderá ser encontrada em qualquer palavra de
qualquer página do banco de dados. No sistema do Lycos, apenas um resumo
do texto da página é arquivado.
O Lycos - e também o Excite e o Open Text (http://www.opentext.com) -
não reconhece "meta-tags", um recurso da linguagem HTML que ajuda os
oráculos a classificarem as páginas segundo as palavras-chaves e título
de interesse do autor da página. Mas, em compensação, o Lycos, que ficou
na berlinda, cataloga três níveis de cada home-page. Melhor que isso só
o AltaVista (http://www.altavista.com), Excite e o Hotbot. A vantagem?
Não só sua home-page estará disponível, como também todas as demais
páginas que estiverem no servidor até o número de níveis (três, para o
Lycos, e ilimitado para o HotBot). Naturalmente, o HotBot está liderando
nesta área.
* * *
Somente o Lycos e o AltaVista são capazes de oferecer um importante
recurso: a informação de quando a página foi checada pela última vez..
Fui ao Altavista e procurei por "charlab" e "97" (você já sabe que para
procurar por duas palavras no AltaVista devemos colocar o sinal de +
antecedendo-as). Assim descobri que, há poucos dias, mais exatamente dia
11 de fevereiro, ganhei menção na página do Mauricio Rocha, sobre
"Oncologia e Aquariofilia"
(http://www.geocities.com/CapeCanaveral/8557/). Uma informação similar,
algo menos relevante, é a data de quando a página foi arquivada no banco
de dados, o que pelo menos oferece pistas de quão atual é o oráculo.
Este segundo recurso é oferecido pelo AltaVista, HotBot e InfoSeek.
E qual seria o oráculo atualizado diariamente? O OpenText! Altavista e
InfoSeek anunciam atualizações em um a dois dias; HotBot e Excite,
semanais; Lycos, entre duas e quatro semanas.
* * *
A IslandWeb Ventures (http://www.lips.net/~islandav/search.htm) reuniu
mais informações sobre os oráculos para um quadro comparativo sobre suas
respectivas áreas de operação. Em resumo:
* A busca exige palavra-chave ou grandes temas? No segundo caso, busque
o Yahoo! (http://www.yahoo.com), Lycos, Excite, InfoSeek e Galaxy
(http://galaxy.einet.net/).
* Quais oráculos são do tipo "meta", submetendo sua busca a vários
mecanismos simultaneamente? MetaCrawler (http://www.metacrawler.com/) e
Savvy Search (http://guaraldi.cs.colostate.edu:2000/).
* Liste os que são capazes de procurar arquivos em FTP: Lycos e Galaxy.
* E os que vasculham mensagens da Usenet? Yahoo!, HotBot, AltaVista,
Dejanews (http://www.dejanews.com), Excite e InfoSeek.
* Para procurar por pessoas e seus respectivos endereços de correio
eletrônico: Yahoo!, Excite e InfoSeek.
* * *
E Terry A. Gray, em "How to Search the Web - A Guide To Search Tools",
apresenta outra interessante comparação, desta vez destacando aspectos
específicos da linguagem de busca de cada oráculo. Veja:
* Quais oráculos distinguem maiúsculas e minúsculas? AltaVista e
InfoSeek.
* Quais aceitam booleanos? AltaVista, Excite, WebCrawler, OpenText e
NlightN
* Quais fazem busca pela proximidade entre as palavras-chaves?
AltaVista, WebCrawler, OpenText e InfoSeek.
* Quais aceitam frases para a busca? AltaVista, WebCrawler, OpenText,
InfoSeek, e NlightN.
* * *
Vale a pena saber o que a crítica especializada pensa sobre os oráculos.
A C/NET (http://www.cnet.com/Content/Reviews/Compare/Search/ss2.html)
recomenda o meu favorito - Metacrawler
(http://metacrawler.cs.washington.edu:8080/index.html) - para quem sabe
o que procura. Em busca de orientação, o caminho deve ser o, Yahoo!,
claro. E ainda saiu uma menção honrosa para o AltaVista.
Eu não faria uma crítica muito diferente disto. Gosto imensamente destes
três oráculos, e ainda dou crédito ao Excite por sua página de notícias
personalizadas; ao Lycos por sua variedade de assuntos pesquisáveis
concentrados num único oráculo; ao NlightN por sua exclusiva utilização
de bancos de dados (pagos) científicos que não fazem parte do Word Wide
Web. Também destaco as ferramentas independentes, como o More like this.
* * *
Vou concluir este tutorial com um resumo de uso e indicações de exemplos
de busca. Se desejar fazer parte, basta que me envie um tema ou
palavras-chaves para busca, assim como a aprovação para que eu a cite no
texto, bem como identifique você com nome completo e e-mail.
Esta coluna de hoje é especialmente dedicada ao meu amigo André, cujo
ramal de telefone é o 24. Também a dedico ao Liberatti, competentíssimo
ilustrador aqui do JB, não por afinidade numerológica, mas porque me
honrou com seu traço na edição da semana passada, que eu pretendia
ilustrar com a teoria dos conjuntos, de álgebra. Facilitaria a
compreensão dos booleanos (tema da parte 23). Quem tiver interesse
(claro!) e for capaz de receber imagem formato jpeg, em "attached" numa
mensagem de e-mail pode pedir enviando mensagem para charlab@ax.apc.org.
Para receber as outras partes deste tutorial (que, aliás, acaba na parte
25!), escreva para charlab@charlab.com.br
Sérgio Charlab
charlab@ax.apc.org
http://www.charlab.com.br
Os Oráculos Digitais: Conclusão (Tutorial, parte 25)
Meu filho Jacques é quem está mais triste com o fim deste tutorial na parte 25. Seu álbum de figurinhas de basquetebol da NBA está incompleto. Ele quer que eu escreva tutoriais com os números das figurinhas que lhe faltam: 34, 63, 83, 98, 115, 139, 148, 159, 192, 198, 203, 205, 210, 211, 227, 240, 245, 260, 262, 263, 275, 277, 280 e 282.
-- Jacques -- eu disse --, não posso escrever um tutorial de 282 partes.
-- Por que não?
-- Ninguém aguentaria ler sobre o mesmo assunto durante 282 semanas, mais de cinco anos!
-- É cinco vezes aquele dia que soltam fogos?
-- Exatamente! Você ia dormir e acordar umas 2 mil vezes, mais ou menos o mesmo tempo que você viveu até hoje.
* * *
Eu me diverti com o estudo dos oráculos. Foi o mais próximo que cheguei até hoje do esoterismo. Confio aos oráculos minha vida e meus segredos. Escrevo nas ranhuras as palavras que me ajudam a encontrar o que procuro. E, assim, pouco a pouco, vou revelando muito de mim. E se algum oráculo guardar um arquivo completo de "log" das consultas que lhe fazem? Que será da nossa privacidade? Os oráculos saberão tudo sobre o mundo e saberão tudo sobre cada um de nós.
Não confunda meu discurso sobre privacidade eletrônica com o livro "A profecia celestina".
* * *
Eis aqui todas as URLs citadas nesta série:
http://www.altavista.digital.com
http://www.hotbot.com
http://www.lycos.com
http://www.rio.com/
http://www.tcs-info.com/index.htm
http://www.informatik.hu-berlin.de/~mhunger/
http://www.jb.com.br/
http://www.submit-it.com
http://www.inktomi.com
http://www.truenet.com.br/studioweb/charlab/index.html
http://www.macromedia.com
http://www.edirectory.com
http://www.lycos.com/sitemap.html
http://www.infoseek.com
http://guide.infoseek.com
http://www.whowhere.com
http://www.quote.com
http://www.banx.com
http://www.companylink.com
http://guide.infoseek.com/Reference
http://ultra.infoseek.com/
http://www.br-online.de/
http://bookmarks.ibase.org.br
http://www.argos.com.br
http://www.ci.rnp.br/si/
http://www.cade.com.br
http://www.argos.com.br
http://www.brasil.emb.nw.dc.us/bzhisto1.htm
http://www.looksmart.com
http://www.thedj.com/
http://www.realaudio.com
http://www.excite.com/
http://www.excite.com/navigate/home.html
http://www.sebes.com.br/empresas/supercou/dica.htm
http://www.nlightn.com
http://www.nlightn.com/nlndemo/docs/dblist.htm
http://nln.com/
http://accufind.com
http://hotstuff.plugue.com.br/blocos/horoscop2.html
http://www.dejanews.com
http://grunt.dejanews.com/post.xp
http://www.dejanews.com/forms/rn.html
http://www.reference.com/
http://www.chevere.com
http://www.exploramexico.com/
http://www.geocities.com/CapeCanaveral/3355/index.html
http://www.hisurf.com/yopet/
http://www.adultlinks.com/
http://www.cade.com.br
http://www.fantastico.com/
http://www.jubii.dk/Linx
http://www.naughty.com/
http://www.ole.es/
http://www.ozu.com/
http://www.seznam.cz/
http://www.ifi.uio.no/~hermunda/Snooker/Snoohoo/
http://www.mnonline.org/uffda/
http://www.walla.co.il/
http://www.whoshoo.co.za/cgi-bin/index.pl
http://woohoo.pair.com/
http://www.yahala.com/
http://yahho.ita.tutkie.tut.ac.jp/yahho/
http://www.ci.rnp.br/si/index.html
http://Yeehaw.Nashville.Net/
http://www.yehaa.com/
http://www.msjnet.edu/yeowsa/
http://www.dn.net/yippee/
http://www.amorn.baremetal.com/yoohoo/
http://www.sappho.com/yoohoo/
http://www.yoyee.com/
http://www.yahoo.com
http://www.northernlife.com/valentin/
http://www.yahoo.com/Computers_and_Internet/Internet/World_Wide_Web/Sea
rching_the_Web/
http://www.contrib.andrew.cmu.edu/~sc5x/yankovic.html
http://www.pcmag.com/iu/srchsite/_open.htm
http://my.yahoo.com/ticker.html
http://www.yahooligans.com/
http://www.yahoo.fr/
http://www.yahoo.de/
http://www.yahoo.co.jp/
http://my.yahoo.com/
http://www.telelistas.com.br/welcome.htm
http://www.vicinity.com/yt.hm?&FAM=lycos&CMD=FILL&SEC=ytstart
http://www.yahoo.com/headlines/
http://quote.yahoo.com/
http://sports.yahoo.com/
http://search.main.yahoo.com/
http://events.yahoo.com/
http://www.yahoo.com/docs/family/more.html
http://www.cis.ohio-state.edu/hypertext/faq/usenet/
http://www.webcrawler.com
http://www.npd.com:80/c_pcmdef.htm
http://www.openlink.com.br/art/
http://webcrawler.com/WebCrawler/Facts/WCStory.html
http://webcrawler.com/cgi-bin/prefs.cgi
http://www.uol.com.br
http://webcrawler.com/WebCrawler/Help/Cookies.html
http://www.metacrawler.com
http://metacrawler.cs.washington.edu/
http://www.metacrawler.com/configure.html
http://www.hardseek.com/
http://www.diamondmm.com
http://ftpsearch.ntnu.no/ftpsearch/
http://euroseek.net/
http://www.fpsol.com/gems/webgems.html
http://www.servtech.com/public/mvail/home.html
http://galaxy.einet.net/
http://www.hotfiles.com/index.html
http://blueridge.infomkt.ibm.com/knudsen/cdsearch.html
http://isurf.interpix.com/
http://weather.yahoo.com/
http://www.liszt.com/
http://www.npd.com:80/c_pcmdef.htm
http://www.planetsearch.com/
http://www.whatuseek.com/
http://www.snoopie.com/
http://www.onekey.com/
http://www.drwebster.com/search/search.htm
http://www.search.com/
http://www.lookup.com/Homepages/73107/search.htm#USEIT
http://www.beaucoup.com/engines.html
http://www.isleuth.com/
http://www.allrise.com/SEARCH/index.html
http://search.onramp.net/
http://guaraldi.cs.colostate.edu:2000/form
http://guaraldi.cs.colostate.edu:2000/form?lang=portuguese
http://www.stpt.com/
http://www.lookup.com/Homepages/73107/search.htm
http://www.webferret.com/webferret.htm
http://www.stroud.com/95agents.html#wferret
http://www.windows95.com/apps/webmisc.html
http://www.vironix.com/netferret/
http://www.morelikethis.com/download.html
http://www.owt.com/headlightsw/
http://www.naf.cz/arachne/english.htm
http://www.fdisk.com:80/doslynx/
http://www.ibama.gov.br:80/help.htm
http://www.shoptime.com.br:80/lojas/gourmet/1450.htm
http://www.iconovex.com/ECHO/ECHOS.HTM
http://www.cyber411.com/
http://www.forumone.com/
http://m5.inference.com/ifind/
http://calafia.com/webmasters/chart.htm
http://www.opentext.com
http://www.geocities.com/CapeCanaveral/8557/
http://www.lips.net/~islandav/search.htm
http://www.cnet.com/Content/Reviews/Compare/Search/ss2.html
http://metacrawler.cs.washington.edu:8080/index.html
* * *
Escrevi sobre o Altavista, Hotbot, Lycos, Infoseek, Bookmarks, Excite, NlightN, Deja News, Yahoo!,WebCrawler, MetaCrawler, vários outros endereços e ainda programas como o WebFerret e More Like This.
* * *
Para receber as outras partes deste tutorial escreva para charlab@charlab.com.br. Muito obrigado pela paciência e interesse. Isso e as mensagens (foram milhares nestes seis meses) que chegam todos os dias são a minha maior recompensa.
* **
Esta série é dedicada à Raquel, minha esposa, que vive me lembrando como é que se desliga o computador e se sobe pelas paredes.
Sérgio Charlab
charlab@ax.apc.org
http://www.charlab.com.br
----------------------------------------------------------------------
SÉRGIO CHARLAB (charlab@ax.apc.org) (http://www.charlab.com.br) é
Editor-Chefe de Seleções do Reader's Digest (http://www.selecoes.com.br),
colunista de "Ciberespaço" do Jornal do Brasil e autor dos livros
"Você e a Internet no Brasil" (http://www.charlab.com.br/ch2505.html)
e "O Seu Futuro Eletrônico".
----------------------------------------------------------------------
Inscreva-se na lista Leitor Ajuda Leitor!
=========================================
Participam desta lista todos aqueles que estão dispostos a trocar
informacoes e repartir conhecimentos sobre uso da Internet e dos
computadores.
Nesta lista nao existem segredos. O que voce aprender, voce deve
ensinar. O que voce deseja aprender, voce deve perguntar. A lista e
moderada por Sergio Charlab (charlab@charlab.com.br), que deve zelar
para que as mensagens que circulam na lista sejam sempre perguntas e
respostas apropriadas ao tema da lista.
O que voce pode perguntar na lista?
==================================
Qualquer coisa que voce nao saiba ligada a computadores e a Internet.
Nao tenha receio de fazer perguntas basicas. Suas duvidas podem ser as
mesmas de outros assinantes da lista. Quando voce perguntar, as
respostas servirao de ajuda a todos.
O que voce pode responder na lista?
===================================
Qualquer pergunta formulada cuja resposta voce saiba. Procure responder
aquilo que realmente conhece, evitando informacoes que nao estejam
checadas. Nao tente competir com ninguem pelas melhores respostas. A
contribuicao de cada um, muitas vezes, se somara para formular a melhor
resposta.
Como enviar mensagens para a lista?
===================================
Envie mensagem para: leitorajudaleitor@listas.horizontes.com.br
e coloque no assunto, da questao ou resposta, no campo: "Subject"
Comandos que voce deve ter a mao:
=================================
Devem ser enviados para: listserv@listas.horizontes.com.br em mensagem
*SEM SUBJECT* e com os comandos na primeira linha:
* Para assinar a lista (ensine seus amigos):
SUBscribe leitorajudaleitor
* Para sair da lista:
SIGnoff leitorajudaleitor
* Para pegar arquivos complementares da lista
GET leitorajudaleitor
Duvidas? Escreva para Sergio Charlab -- charlab@charlab.com.br