Eis as colunas já publicadas da série "Os Oráculos Digitais". Espero que os acentos não causem problemas e que o conteúdo seja útil para você. Veja no final deste texto como fazer sua inscrição na lista (gratuita) Leitor Ajuda Leitor! Sergio Charlab ---------------------------------------------------------------------- SÉRGIO CHARLAB (charlab@ax.apc.org) (http://www.charlab.com.br) é Editor-Chefe de Seleções do Reader's Digest (http://www.selecoes.com.br), colunista de "Ciberespaço" do Jornal do Brasil e autor dos livros "Você e a Internet no Brasil" (http://www.charlab.com.br/ch2505.html) e "O Seu Futuro Eletrônico". ---------------------------------------------------------------------- ........................................................................ Os oráculos da Internet: Altavista (tutorial, parte 1) Tantas são as informações existentes na Internet que seria quase impossível encontrar o que se procura sem a ajuda dos mecanismos de busca, espécies de oráculos digitais. Cada mecanismo de busca existente na Internet pode ser comparado aos antigos oráculos, divindades que respondiam a consultas e orientavam os crentes na Grécia, Egito e entre os hebreus, fenícios e babilônios. +++ Mas se os mecanismos de busca estão relacionados aos oráculos, então para mim o Altavista (http://www.altavista.digital.com) é uma espécie de Oráculo de Delfos (o mais popular de todos). Com menos de um ano de vida, o Altavista, criação gerada casualmente na Digital Equipment Corporation e oportunamente utilizada para fins de marketing, é certamente poderoso. Colocou na sombra, desde o primeiro dia, todos os seus competidores, anunciando uma capacidade fenomenal de acompanhamento do World Wide Web. Hoje, assegura ter um banco de dados com 30 milhões de páginas -- menos do que as 54 milhões alegadas pelo HotBot (http://www.hotbot.com) ou as 51 milhões alegadas pelo Lycos (http://www.lycos.com) -- de mais de 275 mil servidores, além de 4 milhões de artigos Usenet retirados de 14 mil newsgroups. Recebe quase 200 acessos por segundo! Apesar do que diz o Lycos, o Altavista parece ser maior, mais rápido e mais versátil do que qualquer outro mecanismo de busca. Outros surgiram depois dele, mas não creio que se possa, em qualquer lista de usuário, prescindir do Altavista pelo menos entre os três mais do ranking de mecanismos de busca. O uso do Altavista é tão simples ou tão complexo quanto o desejo do usuá rio. Quanto mais genérica for sua busca, ainda que o Altavista se preocupe em apresentar os resultados em um "ranking" de incidências, menor a chance de você encontrar algo útil nas primeiras citações e referências apresentadas. Portanto, é preciso aprender a ser específico. E, felizmente, o Altavista permite refinar a busca até um nível que poucos imaginam. Minha expectativa é de que este texto sirva para você conhecer e aprender a usar estes refinamentos no dia-a-dia de suas navegações na rede. Outros mecanismos de busca, do conhecido "Yahoo!" ao brasileiríssimo "Yaih?" serão vistos nas próximas semanas desta série tutorial, "Os oráculos da Internet". Avise aos seus amigos para que não percam e escreva para mim no endereço (charlab@charlab.com.br) dando sua opinião sobre os tutoriais. +++ Na tela principal de acesso do Altavista vê-se em destaque um fino e longo retângulo com fundo branco. É ali o local para que o usuá rio insira sua "pergunta" ao oráculo digital. Basta uma única palavra seguida de "enter" ou de um clique no botão à direita, o retângulo em fundo cinza com a palavra "submit". O Altavista, movido por poderosos e rápidos servidores, vasculhará seu enorme banco de dados em busca de citações da palavra. Em questão de segundos, uma lista das dez primeiras citações será apresentada como resposta. A ordenação obedece um ranking de incidência da palavra-chave, do maior número para o menor. Antes de iniciar sua busca, porém, você pode ainda tomar duas decisões. Se vai fazer um "Search the Web" ou um "Search Usenet" e se deseja os resultados apresentados em "Standard", "Compact" ou "Detailed" forma. A "Detailed" (detalhada) é igual a "Standard". A "Compact", naturalmente, é mais resumida. Na busca em newsgroups Usenet ocorre o oposto: a "Standard" é igual a "Compact". Para configurar isso basta clicar nas op ções que aparecem imediatamente acima do retângulo em que você insere suas palavras-chaves. Faça várias experiências para fixar as circustâncias em que cada configuração lhe trará o melhor proveito. +++ Em vez de uma só palavra, o usuário pode experimentar duas ou mais delas. Se quiser ter certeza de que duas ou mais palavras apareceram tal qual digitado na busca, certifique-se de que usou sinal de aspas antes e depois do grupo de palavras. Exemplo: "Jornal do Brasil", traz como resultado (no momento em que escrevo) 2000 referências, sendo que a primeira é logo a que se procura, com a home-page do JB. Sem as aspas, o Altavista vai procurar pela incidência, separadamente ou não, das palavras "Jornal", "do" e "Brasil": Jornal:10879; Brasil:107493; do: 10609250. Em vez de aspas, se preferir, você pode usar ponto e vírgula separando as palavras (Jornal;do;Brasil). Não se preocupe em usar maiúsculas ou minúsculas, porque neste exemplo o Altavista não faz distinção e buscará todas as palavras. Letras maiúsculas no meio de uma palavra forçam o Altavista a procurar uma palavra idêntica. Experimente buscar resultados com a palavra "Brasil" e depois com "BrAsil" (com o "A" maiúsculo) e você terá a medida da diferença. É possível também indicar na busca palavras que se quer encontrar, mas outras que não se quer. Esta é a solução para o grande número de queixosos que vivem dizendo que não conseguem resultados úteis diante da avalanche de citações obtidas pelo Altavista. Eis um exemplo: +rio -"rio de janeiro". Ou seja, sinal de "+" entra; sinal de "-" fica de fora. No exemplo, excluindo o Rio de Janeiro fica mais fácil procurar citações da palavra "Rio". Existe um http://www.rio.com/ que nada tem a ver com o Rio de Janeiro. Muito útil é o asterisco na terminação de uma palavra, como em jorna*, que serve para buscar citações de "jornal", "jornalismo", "jornalista" e assim por diante. O asterisco é uma verdadeira mão na roda quando você estiver em dúvida sobre a ortografia de uma palavra, porque pode também ser usado no meio. Exemplo: exce*ao. Mas cuidado com as respostas, porque se cair em Portugal, exceção ganha um "p" e vira "excepção"! +++ E como é que funciona o algoritmo usado pelo Altavista para fazer o ranking de respostas? Dá maior peso se a palavra ou expressão buscada for encontrada entre as primeiras a aparecerem no documento, especialmente nos títulos. A distância entre as palavras também pesa favoravelmente caso seja pequena (quando as palavras estão próximas). A quantidade, naturalmente, também pesa muito. Conheço páginas em que os autores, procurando "enganar" as m áquinas dos mecanismos de busca que utilizam estas regras para ponderaç ões, escrevem, logo no alto, 200 vezes uma mesma palavra. Há toda uma técnica para "fazer sucesso" em mecanismos de busca. Considerando que a maioria dos navegantes hoje vai parar em alguma home-page a partior de uma busca, recomendo aos designers de Web que passem a dar tanta atenção à estas páginas de acesso via mecanismos Web quanto às próprias home-pages. Muitos designers planejam dedicadamente o caminho de acesso dos visitantes a partir da home-page e se supreendem de ver que a maioria entra por alguma "porta dos fundos". Com paciência, é possível descobrir como "enganar" as ponderações dos mecanismos de buscas para que sua página seja sempre apresentada entre as primeiras quando alguém utiliza determinadas palavras-chaves que lhe interessam. +++ Mais poder de busca pode ser obtido utilizando uma série de palavras especiais reconhecidas pelo Altavista para direcionar a procura. Eis algumas das palavras: anchor, applet, host, image, link, text, title, url. Em todos estes casos, a utilização é simples. Basta usar a palavra, seguida de dois pontos ":" e da expressão que se deseja localizar. Exemplos: * anchor:clique aqui -- localiza as aparições das palavras "clique aqui" dentro de um hyperlink, como em Clique aqui. * applet:count.class -- busca os Java applet class com este nome, e que provavelmente indicam a existência de um contador em Java. Veja em http://www.informatik.hu-berlin.de/~mhunger/. * host:jb.com.br -- busca domínios. * image:brasil.gif -- busca imagens pelo nome (e é ótima solução para pesquisa escolar dos seus filhos...). * link:http://www.jb.com.br/ -- busca referências a outras URLs e permite que você avalie a popularidade de uma home-page. * text:sexo -- busca páginas por uma palavra que apareça no texto * title:charlab -- busca páginas por uma palavra que apareça no título * url:charlab -- busca páginas com uma palavra que apareça na URL Sérgio Charlab charlab@ax.apc.org http://www.jb.com.br/charlab.html Os oráculos digitais: Altavista (tutorial, parte 2) O Altavista, quando surgiu, também surpreendeu ao oferecer potentes buscas na Usenet. Trata-se do local em que usuários trocam mensagens sobre temas específicos, os chamados newsgroups. Existem mais de 20 mil newsgroups. O Altavista mantém um extraordinário arquivo de todas as palavras de 70% destes newsgroups. E você pode e deve usar este recurso, bastando para isso que, ao iniciar a busca, não se esqueça de mover o menu de opção, trocando "web" por "usenet". Numa busca Usenet, é possível procurar pelos campos das mensagens que lá circulam, como "from", "newsgroups", "summary", "keywords". Se assim é, então o leitor mais atilado já percebeu que o Altavista pode ser usado como o "servidor" Usenet que muitos de nós, aqui no Brasil, não dispõem. Experimente, por exemplo, "newsgroups:soc.culture.brazil" e você lerá as mensagens que foram postadas no newsgroup "soc.culture.brazil". Em muitos casos, a busca na Usenet é muito oportuna. Ali se pode ler opiniões sobre assuntos tão variados como uma doença, um software, um esporte. E você, ao ler as mensagens, pode pegar o e-mail de alguém e escrever, fazer uma pergunta, começar uma amizade, trocar um favor. Eu escrevi a palavra "Varig" e encontrei 94 respostas. Ali já se discute em primeira mão as novas cores desta companhia aérea. Aliás, ao lado da Iberia e da Alitalia, a Varig é considerada uma das mais anacrônicas no que diz respeito à pintura de seus aviões. Sabe-se de tudo lá na Usenet. Mas a busca mais "terrível" é o "from:e-mail". Pense bem: tudo o que você escreve está sendo gravado lá e poderá ser lido pelos outros, na semana seguinte, ou cinco anos depois (no caso de outros arquivos Usenet). Suas palavras podem voltar para assombrá-lo! Seja cauteloso! Quem testar "from:charlab@ax.apc.org" não encontrará muita coisa, pois eu tenho um e-mail secreto para estas coisas. Mas você pode também adicionar a linha "X-no-archive: yes" às suas mensagens na Usenet. Isso impedirá que o Altavista as catalogue. *** Há uma dica interessante sobre o Altavista para quem tem home-page e fica curioso sobre a forma com que este mecanismo de busca a cadastra. Você pode cadastrá-la a partir do "link" "Add URL", lá embaixo, na pá gina principal do Altavista, ou então do Submit It (http://www.submit-it.com) ou ainda não fazer nada e esperar que, mais cedo ou mais tarde sua página estará registrada no Altavista pelo conteúdo das palavras que existirem lá. Mas você pode usar uma "tag" especial para que a definição do Altavista siga o modelo que desejar. Pode também definir as "keywords". Por exemplo: Não ultrapasse os 1.024 caracteres. Desta forma, o Altavista não precisará reproduzir as primeiras palavras de sua home-page, sejam elas quais forem. Poderá usar a sua definição. Quero ver agora se você descobre como fazer para aumentar suas chances de o Altavista classificar seu site entre os primeiros que aparecem na relação de respostas diante de uma palavra-chave que lhe interessa. Por exemplo: "jornal brasil" (mesmo sem as aspas) chama logo uma página do JB. Você conseguiria ser habilidoso o suficiente para criar uma página fictícia com a palavra-chave "sexo" de modo que ela aparecesse em primeiro, entre as mais de 10 mil da resposta, numa busca no Altavista? Se conseguir, me avise, porque será notícia e você vai contar aqui como fez. Isso parece uma brincadeira, mas não é. Hoje, tão importante quanto o esforço dos designers para fazer uma bela home-page que chame e conduza o visitante pelo site, é manter as portas "dos fundos" preparadas para receber acessos de quem chega via mecanismos de busca e não está nem aí para sua página principal. Se estiver planejando um site, pense nisso. *** Também é possível usar os operadores AND, OR, NEAR e NOT ("e", "ou", "próximo" e "não") nas buscas no Altavista. AND, OR e NOT são mais ou menos claras. O NEAR garante a você que as duas palavras ou frases de sua busca não deverão estar mais de dez palavras afastadas. Não é tão fá cil assim perceber as nuances destas possibilidades avançadas ou fazer a melhor escolha na hora de preencher a busca. Mas se você testar, evitar a simplicidade de colocar uma palavra só, verá que não há razão para muitas queixas sobre a quantidade de respostas do Altavista. Seus resultados serão rápidos e certeiros. Quando você ficar afiadíssimo, será tal qual Delfos e seu famoso orá culo. Diga a seus amigos que esta série do JB, que começou na semana passada, continua na próxima terça em sua terceira parte. Até lá! Sérgio Charlab charlab@ax.apc.org http://www.charlab.com.br Os Oráculos Digitais: HotBot (Tutorial, parte 3) O que é o que é? Azul piscina com verde abacate, enorme, e com um buraquinho no meio para você, digamos, exercitar a interatividade? É o HotBot (http://www.hotbot.com), que anuncia o maior arquivo de páginas Web existente, com 54 milhões de URLs arquivadas. Quando surgiu, em maio de 1996, vinha com uma assinatura de peso: a da revista Wired! Era o ingresso da Wired no mercado de mecanismos de busca (search engines), que então já movimentava mais de uma dezena de empresas, todas disputando atenção dos usuários e o dinheiro de anunciantes e investidores de Wall Street. Funciona com tecnologia do Inktomi (http://www.inktomi.com) e passou um sufoco danado nas primeiras semanas de lançamento, quando um monte de gente correu para usá-lo e o HotBot não deu conta do recado. Mas se refez e hoje, de um modo geral, não parece ser mais lento do que o Altavista, para citar apenas a usual referência de rapidez. * * * O HotBot, como qualquer mecanismo de busca, é simples de usar. No pequeno menu acima do espaço para você colocar suas palavras-chaves ou expressões, pode-se escolher antes a busca por todas as palavras ("all the words"); qualquer uma das palavras ("any of the worlds"); pela expressão ("the phrase"); pela pessoa ("the person") ou pela URL ("the URL"). "Tiririca" usada como palavra-chave (você escreve a palavra "Tiririca" no retângulo longo e estreito, de fundo branco, e aperta sua tecla "enter" ou clica com o mouse no botão à direita com a figura do alvo, onde está escrito "search") traz 57 citações no Hotbot (contra apenas 31 no Altavista). "Tiririca Florentina" traz 11 citações. E assim vai: quanto mais precisa for sua busca (em número de palavras utilizadas), mas focado será seu resultado. Ainda mais específico do que duas palavras é uma expressão de duas palavras. Se você procura informações sobre o conjunto "Iron Maiden" não deve escrever as palavras "iron" e "maiden", mas sim a expressão "Iron Maiden". A resposta não levará em conta a quantidade de vezes que, por exemplo, a palavra "iron" aparece, mas sim a quantidade de vezes que estas duas palavras aparecem tal qual você as escreveu, lado a lado e com um espaço entre elas. Isso significa uma queda de 15.672 citações para 8.738. (Naturalmente, o Iron Maiden é muito popular, mas vamos ver logo adiante o que fazer num caso destes, diante de tão numeroso resultado de uma busca.) No HotBot, a terminologia disso é "phrase" em vez de "all the worlds". Prefira usar sempre "phrase" quando for possível. O Altavista, já vimos, é menos amistoso, pois em vez de oferecer a opção em menu (como o HotBot, que ainda oferece a notação de aspas) apenas aceita o posicionamento dos sinais de aspas. * * * Coisas interessantes por trás da tecnologia do HotBot são a identificação do browser do usuário, de modo que a página apresentada seja adequada à capacidade de exibição do browser em sua respectiva versão, e a possibilidade de exibir propaganda valendo-se desta informação e também das palavras utilizadas na busca. Mas há muitas promessas ainda. Não é capaz, por exemplo, de fazer uma busca por proximidade de palavras, tal qual o Altavista. Mesmo assim, o HotBot é muito mais do que um mecanismo de busca cor de abacate. Você pode fazer buscas por tipo de arquivo, local geográfico, domínio ou Web site. As coisas começam a acontecer quando você resolve deixar de ser igual à média das pessoas e arrisca clicar a palavra "modify", à esquerda, na área sob fundo azul. Trata-se da possibilidade de adicionar ou retirar itens de busca. Com o menu "must", "should" e "must not" você define o que deve entrar ou não. "Jornal do Brasil" como expressão de busca e "Charlab" usado sob a configuração "must not" trará como respostas as páginas do "JB" sem referências ao meu nome. "Must" e "should" fazem a mesma coisa e a sutil diferença entre os dois é que o segundo dá ênfase à palavra usada, mas mostra todas as respostas; o primeiro só mostra as respostas que contenham a palavra usada naquele campo. Lembra das 8.738 citações do Iron Maiden? Vamos reduzi-las! Digamos que você queira ver apenas as páginas que sejam frequentemente atualizadas. Nesse caso, pode ser uma boa idéia usar o "must" com uma palavra adicional, como "Blaze", nome do novo vocalista do Iron Maiden. A resposta passa a ser 425 citações. Uma vitória diante das 8.738 ou das originais 15.672. Digamos que você nem queira ver coisas que falem do passado da banda. Então, clique mais uma vez no sinal de mais "+" ao lado do botão "modify" e use o "must not" com a palavra "bruce" (vocalista anterior e que passou o maior período de anos com a banda). Resultado: 160. E se você quiser saber quais são as páginas mais completas, que respeitam o presente e o mais remoto passado? Use três "must": "blaze", "bruce" e "di'anno" (este último, o primeiríssimo vocalista da banda). O resultado é de apenas 38, mostrando que a memória anda curta. Naturalmente você não precisa conhecer a história do Iron Maiden para aprender a utilizar o HotBot! É um exemplo. No seu campo de interesse, você poderá agir de forma semelhante. Os melhores resultados de uma busca virão sempre a partir de uma boa dose de reflexão ("elementar, meu caro Watson!"). * * * Mas se você realmente quiser deixar de ser igual à média das pessoas, clique no botão "expert", logo embaixo do "modify". Vá brincando por ali. Semana que vem você confere, na continuação da série, as informações que eu preparei descrevendo estas novas opções. Mas quer uma dica (para usuários do Windows 95 apenas)? Busque pela palavra "powertoys" e use a condição "Media Type", "Extensions" e escreva "exe". Eu instalei aqui e gostei. Mas se você o fizer, é por sua conta e risco. * * * Esta foi a terceira parte da série sobre os mecanismos de busca e indexadores da Internet. Quem perdeu uma das partes anteriores pode pedir o texto digital enviando mensagem para este endereço especial: charlab@charlab.com.br. Histórias verdadeiras, instrutivas ou pitorescas, sobre o uso de mecanismos de busca são bem-vindas e devem ser enviadas para meu endereço usual, charlab@ax.apc.org. As melhores serão publicadas, com o crédito do autor. Também estou reunindo piadas relacionadas com a Internet. Serão publicadas, com crédito de quem as enviou, em alguma data entre hoje e o dia primeiro de abril. Inclusive. Sérgio Charlab charlab@ax.apc.org http://www.charlab.com.br Os Oráculos Digitais: HotBot (Tutorial, parte 4) O mecanismo de busca azul-piscina com verde-abacate, o HotBot (http://www.hotbot.com) - que enche o peito de orgulho ao anunciar seu arquivo (o maior!) de 54 milhões de páginas Web, e a disposição de vasculhar totalmente o World Wide Web a cada sete dias, encontrando novas páginas e atualizando as existentes - (ufa!) ainda é o nosso tema. A modalidade "expert" (clique no botão "expert", logo embaixo do "modify") confere enorme versatilidade ao HotBot e você deve aprender a usar estes recursos para alcançar melhores resultados em suas buscas. * * * A primeira opção de detalhamento de busca é fazer alguma restrição de data. Usei a palavra "restrição" porque é isso, afinal que queremos, não? Recursos que ajudem a evitar que uma busca apresente como resposta milhares de possibilidades (quem teria tempo de checar uma a uma?). O que desejamos é uma resposta de poucas dezenas de itens, bem no alvo, e arrumados segundo um ranking correto de importância para os objetivos da nossa busca. (O ranking do HotBot é feito a partir de uma ponderação entre várias coisas, como a frequência com que a palavra ou expressão procurada aparece na página, no título - sempre conta muito! -, na tag "meta" - esta é uma tag especial para os mecanismos de busca -, etc.) Ao restringir a data, nos casos em que isso for conveniente, você limitará as respostas do HotBot àquelas compreendidas no período da sua escolha. A opção "whenever" clicada não limita nada. Qualquer data serve. (E por data entenda-se o dia, mês e ano em que, pela primeira vez, o HotBot encontra uma página que inclui em seu arquivo.) Por exemplo, buscando referências com a palavra-chave "charlab" encontro entre as dez primeiras respostas nove ligadas ao conjunto de páginas chamado "Visita de Sérgio Charlab ao Recife" (quando lancei meu livro lá, no dia 8) onde a data é 9 de fevereiro de 1996. (Quem quiser ver os resultados de uma câmara digital Casio, de pouco menos de US$ 500, deve ir até lá: http://www.truenet.com.br/studioweb/charlab/index.html. As imagens foram feitas com a mesma câmara que, dias mais tarde, se tornaria famosa ao reproduzir para o mundo imagens do Carnaval de Olinda.) Voltando ao HotBot, pode-se escolher uma data que sirva de referência para uma busca "depois" ou "antes" dela ("after" e "before"). Colocando "after" 1 de março de 1996 eu só encontro uma página dos meus amigos do Recife (que traz uma data mais recente, provavelmente porque foi atualizada), e o número de respostas à palavra "charlab" cai de 977 para 696. Uma linha mais embaixo, se eu limitar para "within the last" (dentro dos últimos) "1 month[s]" (1 mês) - não esqueça de clicar na bolinha à esquerda da opção! -, fico sabendo o que é que o HotBot anda fazendo recentemente em suas buscas pela Internet: 51 respostas com "charlab". * * * Descendo na nossa oferta de restrições de busca do HotBot, temos "media type". Ali você pode selecionar o tipo de arquivo que deseja ver o HotBot procurar nas suas buscas. Para dar uma idéia de como isso é interessante, vamos ver um exemplo onde você acaba de descobrir a tecnologia de shockwave, da Macromedia (recomendo a quem ainda não instalou em seu browser; visite http://www.macromedia.com). Naturalmente, fascinado com o shockwave, você agora quer procurar páginas que tenham arquivos shockwave. Nada mais fácil! Em vez de escrever "shockwave" como palavra-chave, você simplesmente clica no quadradinho correspondente junto à área de "media type" do HotBot. Vai resultar numa montanha de páginas com arquivos shockwave. Você pode ainda escrever logo a extensão que está procurando (shockwave = cdr) junto ao quadradinho "Extensions". Usando o recurso "media type" você encontra facilmente páginas e arquivos contendo Java, JavaScript, VRML (3D), acrobat, shockwave, e até os "smileys" - aquelas carinhas que mostram as emoções de quem escreve na Internet. :-) Como fazer, por exemplo, para saber quais páginas ligadas ao Brasil têm algum recurso de shockwave? Escreva "brasil" como palavra-chave e clique em "media type" shockwave. Então imagine você ali, diante da sua home-page em construção e querendo procurar uma imagem da bandeira do Brasil. O que fazer? HotBot! Mas não faz sentido escrever "brasil" como palavra-chave e marcar em "Extensions" escrevendo "gif". Melhor é usar apenas como palavra-chave "brasil.gif". O resultado serão páginas que possuem uma imagem chamada brasil.gif. Há boas chances de que você encontre, então, sua bandeira nacional. Não se preocupe em seguir caminhos errados algumas vezes. Mas não deixe de recolher os ensinamentos resultantes dos erros. Assim você vai apurando sua técnica. * * * Em "location", o próximo item de restrições do HotBot, você pode selecionar suas buscas por domínio - seja por nome ou pela geografia. Posso, assim, limitar minha busca ao servidor jb.com.br (ou qualquer outro) para procurar apenas nele. Outro exemplo é quando escrevo "ercília" e mando procurar somente em "uol.com.br", e assim encontro um bate-papo com a simpática colunista da Folha de São Paulo. Ou posso escolher como limitação geográfica "South America" (se quiser procurar apenas no Brasil escreva ".br" no item "Cyberplace" ou visite os mecanismos brasileiros, claro - e por falar nisso, já visitou http://www.edirectory.com). Com o HotBot e estes recursos, posso saber quantas vezes a palavra "charlab" aparece no Web só no Brasil (866), nos EUA (89) e Europa (16) . * * * Finalmente, em "show" você pode controlar o número de referências que deseja obter por vez como resposta do HotBot (às vezes é muito aborrecido ir de 10 em 10, mas o carregamento de uma página com 100 referências pode ser muito lento). O que o HotBot não faz (e neste sentido perde feio para o Altavista): * Não faz busca por proximidade onde se obtém respostas que levam em conta a distância entre duas palavras que usadas como chaves na busca. * Não faz busca por "strings" parciais. Você não pode, por exemplo, buscar a Torre Eiffel sem saber como se escreve "Eiffel". No Altavista, você pode procurar por "Eif*l" e achar as referências da famosa torre, além de aprender a ortografia correta. Além disso, tem alguns bugs (defeitos) notáveis. * * * Esta foi a quarta parte da série sobre os mecanismos de busca e indexadores da Internet. Se você está gostando, avise aos seus amigos da Internet. Ainda vou escrever sobre vários mecanismos - inclusive os brasileiros - e softwares de busca. Eu acredito que dominar o uso das técnicas de busca nestes "oráculos digitais" é a melhor estratégia para quem quiser sentir-se à vontade com a Internet. Quem perdeu uma das partes anteriores pode pedir o texto digital enviando mensagem para este endereço especial: charlab@charlab.com.br. (Como sou eu mesmo quem responde, sem ajuda de ninguém - se bem que estou treinando o Jacques, meu filho de cinco anos, para isso... -, excepcionalmente você terá que aguardar 15 dias, pois estou longe do computador. Mas em compensação vai receber estas quatro e ainda as duas próximas partes da série, de modo que se você não assina ainda o JB poderá dormir até mais tarde nas duas próximas terças-feiras.) Sérgio Charlab charlab@ax.apc.org http://www.charlab.com.br ---------------------------------------------------------------------- SÉRGIO CHARLAB (charlab@ax.apc.org) (http://www.charlab.com.br) é Editor-Chefe de Seleções do Reader's Digest (http://www.selecoes.com.br), colunista de "Ciberespaço" do Jornal do Brasil e autor dos livros "Você e a Internet no Brasil" (http://www.charlab.com.br/ch2505.html) e "O Seu Futuro Eletrônico". ---------------------------------------------------------------------- Os Oráculos Digitais: Lycos (Tutorial, parte 5) As eleições já se foram e ninguém votou nele. E o slogan até que era bom: "If It's Out There, It's In Lycos" ("Se existe, está no Lycos"). Mas o Lycos tinha tudo para ser candidato. Como muitos políticos, o Lycos tem várias faces. Quem acompanha sua existência (foi um dos primeiros a aparecer neste competitivo setor dos "oráculos digitais") já viu pelo menos meia dúzia de tentativas de remodelação da página que está em http://www.lycos.com. Ora o Lycos se assemelha ao Altavista; ora ao Yahoo!. E recentemente mais parece uma feira livre (para não se perder, consulte o mapa do Lycos em http://www.lycos.com/sitemap.html). Não se deixe enganar. O Lycos, um serviço gratuito desenvolvido na Carnegie Mellon University, e hoje chamado de Lycos, Inc., uma companhia aberta com ações negociadas em Bolsas de Valores (NASDAQ: LCOS), a despeito de padecer de falta de personalidade, é bom e poderoso. (Se bem que o valor de suas ações andava em US$ 12.25 embora tenha chegado ao máximo de 29.25 nas últimas 52 semanas.) * * * Vamos ver o que há por lá: * Um mecanismo de busca (claro, ora pois!), que vasculha respeitáveis 51 milhões de URLs, o que o coloca atrás apenas do HotBot e oferece arquivos de páginas com texto, sons, software, gráficos e video no World Wide Web. Não é pouco, e por isso mesmo é que o Lycos faz seu marketing afirmando que 41% de seus usuários não usam nenhum outro mecanismo de busca. * "Sites by Subject" é um superíndice por assunto, à semelhança do Yahoo! (que pretendo comentar numa das próximas colunas). Excelente para buscas a partir de um tópico. * "Point Review" é uma classificação do World Wide Web, via Point Communications, uma empresa que foi adquirida pelo Lycos. A Point Reviews faz críticas e dá nota às páginas e atividades no Web. * "Top 5% Sites" são as páginas classificadas e recomendadas para visita, por grandes temas. Excelente para quem não está em busca de informação específica, mas apenas disposto a encontrar páginas interessantes sobre assuntos pré-escolhidos. * Top News com um serviço de "últimas notícias" que, na verdade, é feito de referências às notícias de dezenas de fontes variadas e de ótima qualidade dentro do World Wide Web, nas áreas "Internacional", "Esportes", "Internet", "Negócios", "Tempo" e "Pessoas". * "City guide" é um banco de dados de 7.500 Web sites a partir de 400 cidades norte-americanas que você escolhe clicando num mapa dos EUA. Tudo organizado, com histórico das cidades e ordenação das referências (uma boa idéia para brasileiros!)/ * "Peoplefind" permite a busca de norte-americanos que estejam listados em catálogos telefônicos. Não encontrei nenhum "charlab", mas achei mais de quatro dezenas de "charlap" por lá. É como se você tivesse à mão, de uma só vez, todos os catálogos telefônicos dos EUA. Você recebe o nome, endereço e telefone. Clicando no endereço, você pode localizá-lo num mapa de ruas! E pode procurar endereços comerciais que fiquem a uma distância determinada do endereço da pessoa. O Shlomo Charlap, por exemplo, mora na 110 Ridge Ave; Passaic, NJ 07055-2419, e seu telefone é 201-473-6661. Vejo no mapa que a rua dele fica próxima de um tal de Third Ward Park e também dos cemitérios King Solomon, Menorah e Crest Haven. Sei que o Mcdonalds mais perto da casa dele fica a cinco milhas, na 485 Broadway, já na cidade de Paterson, NJ, porque a cidade de Passaic - sei também fazendo minhas pesquisas - não tem mais do que três pequenos restaurantes de Fast Food (e eu nem me surpreenderia se um deles fosse um fast-food de comida kosher...). * "Road Maps" permite a você localizar ruas em mapas a partir de domínios no World Wide Web. É bom para você saber de onde vem um e-mail. Só funciona para os EUA, mas eu fui capaz de obter um mapa do endereço da Association for Progressive Communications (que é a "apc" de "charlab@ax.apc.org"). * "Pictures & Sounds" permite que você localize arquivos de som (wav, snd, ra, au) e imagem (gif, jpeg e mov). Usei a palavra "samba" e encontrei exemplos de samba em músicas e imagens. * "Software" leva o visitante para uma página com helpers e plugins para os browsers. * * * Fazer buscas no Lycos é simples. Escreva sua palavra-chave e escolha a opção de busca em "The Web", "Sounds", "Pictures" e "By Subject". Os resultados aparecem com notas, na verdade, pontos de um ranking que procura julgar a importância de cada página para sua busca específica. O Lycos considera o conteúdo dos títulos e uma seleção de 100 palavras e das 20 primeiras linhas da página para classificá-la. Clicando nas palavras "Custom Search", à direita de onde você preenche com palavras-chaves, a busca ganha novas opções, onde o mais importante é a escolha da combinação de todas as palavras de busca ("Match all Terms) ou de pelo menos uma (Match any Terms). Você pode ainda determinar o número de resultados da busca e seu detalhamento. O Lycos tem contra si o fato de parar de funcionar em horas importantes, provavelmente exausto diante de grande quantidade de conexões. A favor, apresentou muito menos resultados diante da palavra-chave "charlab", mas colocou em primeiro lugar minha própria home-page. Contra: endereço antigo, mostrando que a última adição ao banco de dados foi feita em julho. * * * Eis algumas das principais dicas para busca por palavra-chave no Lycos: * O sinal de menos "-" serve como exclusão na busca. "Sérgio -Charlab" vai procurar todo Sérgio que não seja o Charlab. * Evite símbolos e números. * Use um ponto após uma palavra-chave para que a busca seja exata. "Jornal." vai buscar somente a palavra "jornal", e ignorar "jornalista", "jornaleiro", etc. * Use um sinal de cifrão para procurar uma palavra da qual você desconhece uma ou mais letras ou que ampliar as possibilidades. "Bra$il" (para valer a grafia brasileira com "s" e a estrangeira com "z " ou "brasil$" para procurar também "brasileiro". * * * Esta foi a quinta parte da série sobre os mecanismos de busca e indexadores da Internet. Se você está gostando, avise aos seus amigos da Internet. Ainda vamos falar de vários mecanismos - inclusive os brasileiros - e softwares de busca. Eu acredito que dominar o uso das técnicas de busca nestes "oráculos digitais" é a melhor estratégia para quem quiser sentir-se à vontade com a Internet. Quem perdeu qualquer uma das partes anteriores pode pedir o texto digital enviando mensagem para este endereço especial: charlab@charlab.com.br. Sérgio Charlab charlab@ax.apc.org http://www.charlab.com.br Os Oráculos Digitais: Infoseek (Tutorial, parte 6) Você não está cansado dos "Oráculos Digitais", está? Eles são a quintessência da Internet. Sem eles, você e eu ficamos olhando para a tela sem saber onde ir. Mas já que usei esta palavra algo incomum - quintessência -, é hora de escrever sobre o Infoseek (http://www.infoseek.com, também chamado de Infoseek Guide em http://guide.infoseek.com), cujas várias atrações o tornam uma barraca de feira semelhante a do Lycos. (Como? Você não leu a parte 5 da semana passada que tratava do Lycos? Você também não leu a parte 4? Perdeu a parte 2? "Sim, sim salabim." Envie e-mail para charlab@charlab.com.br e peça o que você perdeu. Não faz sentido escrever uma dúzia de colunas numeradas para você ficar aí se lamentando que perdeu algumas delas. Portanto, peça já! Passei duas semanas longe do computador e meus ouvidos anseiam pelo "relinchar" dos modems negociando uma conexão; meus dedos precisam de ginástica entre as teclas; meu mouse precisa de botões para clicar. Mas não exagere, porque tenho também filhos e mulher para abraçar.) * * * "Welcome to the quintessential place for finding quick facts!" diz uma frase em meio ao Infoseek. Ali você encontra um pouco de tudo. E quando não há resposta no Infossek, é hora de parcerias. Clicando na gaivota de papel, no alto, onde esta escrito "Fast Facts", você encontra os parceiros do Infoseek. * Em "E-mail addresses" você pode achar pessoas na Internet a partir do nome completo ou apenas o sobrenome delas (neste caso, o parceiro é o WhoWhere (http://www.whowhere.com)). * Em "Stock Quotes" você vê o valor das ações NASDAQ a partir do símbolo das companhias. Procurei em "search for it" por "Infoseek" e achei o símbolo "SEEK". Chequei e vi que as ações estão em US$ 9, mas chegaram a US$ 16.50 no período das últimas 52 semanas. (neste caso, o parceiro é o Quote.Com (http://www.quote.com)). * Em "Bank and Market Rates" existem uma série de taxas de investimentos que se pode comparar por instituição (neste caso, o parceiro é o BanxQuote (http://www.banx.com)). * Em "Company Directory" você pode procurar informações sobre 45 mil companhias públicas e privadas dos EUA (neste caso, o parceiro é a CompanyLink (http://www.companylink.com)). * E em "Street Maps", claro, você obtém mapas de ruas nos EUA (neste caso, o parceiro é a Vicinity). Não satisfeito, o Infoseek ainda faz referência a outras ferramentas úteis (http://guide.infoseek.com/Reference), variando de dicionários a tutoriais HTML, passando por tabelas de conversões de medidas. Ao estilo Yahoo!, o Infoseek é também um classificador. Sua página principal apresenta vários temas e pode-se, por exemplo, clicar em "Arts", "Computers" ou "Science" para então mergulhar em novos níveis de classificação. Pode-se fazer buscas por palavra-chave (clique no menu junto à janelinha de busca) no World Wide Web, Usenet, Notícias e até FAQs existentes no World Wide Web. Experimente procurar por "Brazil" em "Timely News". Até o anúncio da página se adapta à sua busca! * * * Mas quando se fala em Infoseek - e é bom destacar logo que hoje o Infoseek é gratuito -, geralmente é preciso falar bem. Especialmente agora com o lançamento do Infoseek Ultra (http://ultra.infoseek.com/), anunciado com "o local" para se encontrar resultados que importam. Eles estão tão orgulhosos da capacidade do Ultra que afirmam ser possível encontrar, por exemplo, "Sérgio Charlab" mesmo que eu digite como palavra-chave "SergioCharlab" - assim mesmo, junto, sem espaço. Com coisas assim, o sistema de busca do Infoseek Ultra se mostra ainda mais refinado e poderoso que o do Altavista. Mas o conceito que importa é o de "relevância e precisão". Na comparação com AltaVista, Lycos, Excite e HotBot, o Infoseek Ultra (segundo eles mesmos, mas também pelos testes realizados por revistas especializadas) é muito melhor ao oferecer em seus 30 primeiros resultados a melhor "relevância e precisão". Faça o teste! * * * O Ultra se apresenta como o futuro das ferramentas de busca. É rápido (responde a 1000 consultas simultâneas a partir de um banco de dados de dezenas de milhões de documentos e uma Sun Enterprise Server 4000). É grande (localizou 80 milhões de diferentes URLs e já catalogou 50 milhões delas). É correto (consegue manter fora de seu banco de dados boa parte das URLs que estão nos demais mecanismos, mas que já não funcionam). É atual (tem um mecanismo que vasculha o World Wide Web segundo algoritmos que indicam quais as chances de algumas páginas serem mais frequentemente atualizadas que outras). * * * Como de hábito, quando falo de um mecanismo interessante, vou deixar a você a chance de experimentá-lo durante uma semana. Na próxima terça vou escrever de forma prática as múltiplas possibilidades de busca do Ultra e a linguagem utilizada para obter os melhores resultados. Também há uma ou outra coisa a mais para se falar sobre o Infoseek. Dominar o uso das técnicas de busca nestes "oráculos digitais" é a melhor estratégia para quem quiser sentir-se à vontade com a Internet. Esta foi a sexta parte da série sobre os mecanismos de busca e indexadores da Internet. Histórias verdadeiras, instrutivas ou pitorescas, sobre o uso de mecanismos de busca são bem-vindas e devem ser enviadas para meu endereço usual, charlab@ax.apc.org. Ainda vamos falar de vários mecanismos - inclusive os brasileiros - e softwares de busca. Se você está gostando, avise aos seus amigos da Internet que o encontro é aqui. Sérgio Charlab charlab@ax.apc.org http://www.charlab.com.br Os Oráculos Digitais: Infoseek (Tutorial, parte 7) O Infoseek (http://www.infoseek.com), do qual já falamos um pouco na parte 6, oráculo politicamente correto, customizável, permite que selecionemos até o idioma da home-page. Pedir (e encontrar) texto em português é exagero, por isso temos de nos contentar com o espanhol. Não é mau. Clique em "ayuda" e verá que, para nós brasileiros, a leitura (e a compreensão) em espanhol é apenas uma questão de velocidade e paciência. * * * A linguagem de busca do Infoseek é semelhante a do AltaVista. Você pode usar aqueles sinais de mais (+) e menos (-) para especificar palavras que "devem" e não devem" aparecer nos resultados. Exemplo: fernando +henrique; fernando -collor. Para procurar uma frase você deve escrever as palavras entre aspas (aquelas de duas marquinhas antes, duas depois). Não custa reforçar aqui a diferença entre procurar uma "frase" de três palavras e as mesmas três palavras sem ser numa frase. Digamos que, num dia de inspiração nacionalista, você queira encontrar menções à frase da nossa bandeira, "ordem e progresso". Pois então escreva no local de busca: "ordem e progresso". Vai achar três respostas, todas na "mosca". Mas se o seu amigo, que não está lendo esta série, fizer a busca e escrever apenas as palavras sem usar as aspas, vai encontrar 304.120 resultados (!!), porque neste caso a busca terá sido feita individualmente pelas palavras, "ordem", "e" e "progresso". Você pode também usar um hífen (tracinho) para caracterizar palavras que devem aparecer junto uma da outra, como em Itamar-Franco. Use colchetes para indicar palavras que não estejam mais distantes do que 100 palavras entre uma e outra. [Netscape dicas] me deu 19 resultados, que são as ocorrências das palavras "Netscape" e "dicas" a no máximo 100 palavras de distância entre uma e outra. Ou seja, boas chances de que sejam, de fato, dicas sobre uso do Netscape. Sem os colchetes, encontro 82.989 respostas, porque o Infoseek busca ocorrências das duas palavras. Naturalmente, como o sistema de classificação do Infoseek é de boa qualidade, na hora de apresentar as respostas você encontrará uma classificação por scores que tendem a colocar as mais importantes em primeiro lugar. O score vai de 0 a 100 e é baseado nas palavras e frases que você usa na busca. * * * Mas vamos agora ao Infoseek Ultra (http://ultra.infoseek.com/), anunciado como mais eficiente que o AltaVista, Lycos, Excite e HotBot. Clique no botão "special" abaixo do logotipo do Infoseek Ultra e veja quantas opções incomuns, mas interessantes, de busca. Você pode saber a popularidade de um site (medida pelo número de páginas que a ele fazem referências); avaliar quantas páginas de um site estão registradas no Ultra; procurar um site por um pedaço de uma URL (coloquei para procurar por ".br" e achei quase 50 mil URLs, a maioria, claro, brasileiras); localizar um site pelo "título"; e ainda procurar imagens e "applets" Java. Para estas características, permanecem válidas as regras das aspas, mais e menos, de modo que uma possível busca seria [url:+.br -com.br], o que imediatamente mostra que temos 12.610 sites "com.br" na Internet brasileira registrados no Infoseek. Um bocado, não? Da mesma forma, vi que "gov.br" são apenas 1978. Se você fizer estas buscas, convém colocar também uma restrição para ".br-online" para evitar os sites ligados a http://www.br-online.de/, que fica na Alemanha e, até onde vai meu alemão, não tem nada a ver com o Brasil. Com buscas em "site:" você descobre tudo o que existe "debaixo" de uma URL, até mesmos páginas perdidas, não-divulgadas (de testes), ou baixarias que os administradores desconhecem. Claro que alguém vai pensar em buscar [url:http] e vai encontrar os quase 15 milhões de páginas arquivadas no Ultra. * * * O Infoseek Ultra tem uma série de características que tornam, teoricamente, as buscas mais precisas. Quando usamos duas palavras que iniciam por maiúsculas, como Sérgio Charlab, ele conclui que deve tratar a busca como uma "frase", e portanto não é necessário colocar as aspas tradicionais. Duas frases separadas por vírgula resultam numa excelente busca. Lembre-se que uma frase é sempre melhor do que várias palavras, e três palavras, por exemplo, são melhores do que duas. E não se esqueça de colocar em maiúsculas aquilo que for em maiúsculas. É sempre a mesma regra: pense um pouquinho antes de sair procurando. Também é divertido avaliar as respostas que aparecem a partir de uma busca "natural"; ou seja, quando você simplesmente escreve o que deseja achar. Exemplo: "Pentium 166 multimídia" ou "mulher bonita no Brasil". Boa sorte! Aliás, procurando o e-mail do Bill Gates acabei me deparando com infame piada que descrevia seu (o dele, claro!) objeto de desempenho como "micro" e "soft". * * * Um leitor ficou preocupado com as dicas que eu dei aqui, numa das semanas anteriores, sobre como fazer para que uma página seja catalogada com destaque no AltaVista, de modo que surja entre as primeiras como resposta após uma busca. A sensação que tenho é de que não há nada que se deva esconder. Exatamente para evitar isso é que o Ultra, por exemplo, tem um algoritmo original que é capaz de identificar quando alguém "tenta enganá-lo". Se você faz uma home-page sem conteúdo, mas dá a ela o título de "Sexo no Brasil", escreve uma meta tag dizendo que a página é sobre sexo e ainda escreve 100 vezes a palavra sexo nas primeiras linhas de texto da página, o AltaVista julgará que você é autoridade na matéria, mas o Ultra, esperto, percebe que você quer enganá-lo e não classifica sua página. Na Internet, a lição que aprendo, é que inteligência se vence com inteligência e trabalho, e não com segredos e censura. * * * Esta foi a sétima parte da série tutorial sobre os mecanismos de busca e indexadores da Internet. Envie e-mail para charlab@charlab.com.br e peça as partes deste tutorial que você perdeu. Ainda há muita coisa pela frente e eu não faço idéia de quantas partes este tutorial terá. Mas sei que na semana que vem falarei de alguns oráculos verdes e amarelos, em português, brasileiríssimos, como o Bookmarks (http://bookmarks.ibase.org.br) e o Argos (http://www.argos.com.br). Apareça aqui. E chame os amigos. Dominar o uso das técnicas de busca nestes "oráculos digitais" é a melhor estratégia para quem quiser sentir-se à vontade com a Internet. Sérgio Charlab charlab@ax.apc.org http://www.charlab.com.br Os Oráculos Digitais: Bookmarks (Tutorial, parte 8) O Bookmarks (http://bookmarks.apc.org/) já sai na frente de qualquer outro oráculo digital conhecido, com pelo menos cinco endereços onde você pode acessá-lo: 1. http://bookmarks.ax.apc.org/ 2. http://bookmarks.apc.org/ 3. http://bookmarks.ibase.br/ 4. http://bookmarks.ibase.org.br/ 5. http://bookmarks.alternex.com.br/ O mais curto é o que eu reproduzi entre parênteses, logo na primeira linha. As múltiplas URLs não são demonstração de insegurança, estratégia para facilitar o acesso e tampouco reflexo de desorganização. Exibem, sim, um provedor que faz parte da história da própria Internet brasileira, o Ibase, buscando uma nova identidade profissional, com a marca AlterNex, e para isso exibindo criatividade e iniciativa. Só mesmo estas duas coisas podem explicar o aparecimento do Bookmarks, que indexa mais de 100 mil documentos no domínio .br e promete dominar a atividade de oráculo digital em toda a América Latina. * * * Sei que alguns devem estar lamentando a suposta injustiça que cometo hoje ao destacar o Bookmarks num universo brasileiro que há muito dispõe de oráculos mais antigos, mais famosos e até mais charmosos, como é o caso do Yaih? (http://www.ci.rnp.br/si/) ou do Cadê? (http://www.cade.com.br). Mas só há um único outro oráculo brasileiro que poderia "reclamar" espaço aqui, o Argos (http://www.argos.com.br). Por quê? Argos e Bookmarks são os únicos oráculos brasileiros com motorzinho de popa (se houver mais, que entre em contato comigo ou cale-se para sempre). Ou seja, dispõem de um mecanismo ativo que sai vasculhando a rede em busca de novas páginas. Os demais dependem da adição manual de páginas pelos visitantes ou pelos idealizadores. O Bookmarks é fácil de usar. Funciona com tecnologia Opentext. Você escreve uma ou mais palavras na ranhura apropriada. Seleciona o modo "esta frase" (apresenta resultados com todas as palavras na exata ordem que estão escritas), "todas estas palavras" (leva em conta a existência de todas as palavras, mas em qualquer posição), e "qualquer uma destas palavras" (responde com páginas que tenham pelo menos uma das palavras usadas na busca). Busquei a palavra "argos" no Bookmarks e encontrei 243 respostas. Depois fui ao próprio Argos comparar e encontrei oito respostas apenas, nenhuma delas a do próprio site do Argos. "Charlab" gerou 95 respostas no Argos, contra 264 no Bookmarks. E para não ter mais dúvidas despejei ali uma busca por "Tiririca" e recebi 42 respostas no Bookmarks contra apenas uma (!) do Argos. Não posso estar muito errado ao concluir que se for apenas uma questão de (ehr...) potência e tamanho, fique com o Bookmarks. * * * Ao responder a uma busca, o Bookmarks informa o número de documentos encontrados e exibe os 10 primeiros. Em geral, responde muito rapidamente. Aí permite que se escolha entre duas opções: "Selecione documentos a ver" e "Busque documentos similares". Nos dois casos, a primeira coisa a fazer é clicar nos quadradinhos que aparecem à esquerda da URL de cada resposta, selecionando algumas. Aí o Bookmarks reage segundo a opção, mostrando todos os que você selecionou ou realizando uma nova busca a partir da sua escolha. O Bookmarks também apresenta respostas usando "score", e ordenando por relevância. Permite ainda que se veja, antes de acessar a página, os locais em que houve coincidência de frases ou palavras com a sua busca, e uma cópia da própria página. Note que, ao apresentar uma cópia da página em seu banco de dados, o Bookmarks evita a irritante mensagem de que não existe a página, frequente nos demais mecanismos. Por outro lado, a cópia pode representar o último sopro de vida de uma página que mudou ou que já não existe, o que tem seu lado bom e ruim. Por ora, é o que há de mais distinto no Bookmarks, que de resto não oferece outras opções de configuração ou variedade de sintaxes de busca. * * * Convencido de que o Bookmarks é superior ao Argos (para não falar no fato de que o banco de dados do Argos parece não sofrer atualização há algum tempo), resolvi fazer a grande pergunta: afinal, qual a vantagem de um oráculo brasileiro que se restrinja geograficamente aos domínios .br ou à América Latina, em comparação com os poderosos Altavista, HotBot e Infoseek Ultra? Não pretendo apresentar dados conclusivos aqui. E lembre-se que o Bookmarks só atua em domínios brasileiros. Se um brasileiro em Helsinque faz uma página sobre César Maia o endereço não aparecerá no Bookmarks, mas possivelmente estará entre as respostas dos demais mecanismos. Trata-se, portanto, de uma pesquisa de observação. Vamos ver o resultado de algumas buscas, comparativamente, do Bookmarks (o primeiro número) contra o Altavista (o segundo número). Leve em consideração que quantidade de respostas nem sempre representa garantia de sucesso para quem pesquisa. * Tiririca: 42 x 28 * "Mamonas Assassinas": 128 x 200 * "Sergio Cabral": 27 x 52 * Manequinho: 2 x 5 Num enfoque mais qualitativo, veja o que acontece: * "Descoberta do Brasil": 7 x 0 Mas aí é preciso considerar as peculiaridades de sintaxe de busca. Refazendo a busca no Altavista com a sintaxe [+descoberta +Brasil] recebo 37 respostas, das quais a quarta (http://www.brasil.emb.nw.dc.us/bzhisto1.htm), num domínio estrangeiro e que portanto não será apontada pelo Bookmarks, era o meu sonho de trabalho escolar quando eu tinha oito anos... * * * Esta foi a oitava parte da série sobre os mecanismos de busca e indexadores da Internet. Histórias verdadeiras, instrutivas ou pitorescas, sobre o uso de mecanismos de busca são bem-vindas e devem ser enviadas para meu endereço usual, charlab@ax.apc.org. O leitor Paulo Cesar Bouhid (pcbouhid@nutecnet.com.br) foi mais longe e enviou uma dura charada em homenagem a seu pai. Veja se consegue resolver. Receio que os oráculos não sejam muito úteis desta vez... "Era uma noite fria, em Teresópolis (RJ). O velho professor recostou-se na poltrona, junto à lareira, abriu um livro e pôs-se a ler. Foi interrompido pela visita de um dos filhos. - Sabe, pai, em uma de minhas andanças pela Internet, tive a oportunidade de encontrar duas pessoas fantásticas: o Hélio e a Sandra. O que me deixou surpreso foi saber da diversidade de idades de pessoas que, às vezes, cultivam os mesmos gostos. - As idades são assim tão diferentes? - Olhe, pai, quando Sandra tiver a idade do Hélio, eu terei cinco vezes a idade que a Sandra tinha, quando Hélio tinha a idade que Sandra tem agora. E mais: quando Hélio tiver a minha idade, eu terei oito vezes a idade que a Sandra tinha, quando eu tinha a idade que Hélio tem agora. Imperturbável, o velho Bouhid, professor de matemática acostumado aos malabarismos com os números, tomou de um lápis e um pedaço de papel, rabiscou algumas equações, e prontamente apresentou a resposta ao filho. - Sabe, Paulo, para mim foi fácil porque eu conheço a sua idade. Mas será que os outros, que não sabem disso, e de fato não precisam saber, conseguiriam resolver o enigma ? É isso. Se cada uma das pessoas citadas tem menos de 100 anos, quais as idades de Paulo, Hélio e Sandra?" Só há uma resposta, e se vier com explicação, para este meu endereço (charlab@charlab.com.br), antes que outras cinco pessoas façam o mesmo, você ganha a "medalha digital do mérito matemático" e a simpatia dos Bouhid. * * * Ainda vamos falar de vários mecanismos - a toda hora surgem novos, como o LookSmart (http://www.looksmart.com) - e softwares de busca. Se você está gostando, avise aos seus amigos da Internet que o encontro é aqui. E diga aos que perderam as partes iniciais deste tutorial que podem enviar e-mail para charlab@charlab.com.br e pedir para completar a série. Semana que vem, mais Brasil na série. Sérgio Charlab charlab@ax.apc.org http://www.charlab.com.br Os Oráculos Digitais: Excite (Tutorial, parte 9) Temos nossas teorias secretas, especulações que vão e vêm nas nossas cabeças. Seria bom que as pudéssemos anotar. Se deixamos os pensamentos correrem com a missão de buscar respostas para o que falta nos processos, produtos e serviços que experimentamos no dia-a-dia, estaremos pertos de fazer, com grande probabilidade de acerto, nossas próprias previsões de futuro. * * * Num nível muito pouco pretensioso, tive mais uma destas experiências de Julio Verne a partir da dica de um leitor, que me sugeriu visitar http://www.thedj.com/. Gostei de imediato. Se você tiver o Real Audio Player (http://www.realaudio.com) instalado em seu browser, não deixe de visitar este conjunto de "rádios digitais". Escolhi a programação de "Classic Rock". Tocou Alice in Chains, Metallica e Iron Maiden. A minha vontade é pegar os 1600 LPs e mais os 400 CDs que tenho, digitalizar tudo e passar a ouvir música usando uma espécie de mecanismo de busca. Escreveria o nome da música que quero ouvir e o "mecanismo" a localizaria e providenciaria a execução. Escreveria o nome de um conjunto e o "mecanismo" listaria todos os discos e músicas que tenho deste conjunto no meu arquivo, para que eu selecionasse então as que desejo ouvir. Pode ser que estes pensamentos tenham me ocorrido diante da iminência de uma mudança de endereço, que me coloca de cabelo em pé. Isso porque não será fácil transportar minha volumosa coleção de discos (e o que dizer da possibilidade de a Telerj não ser rápida o suficientemente para garantir minha mudança de telefones...). Sérgio Charlab? Mudou-se e desconectou-se. Oh, não! * * * A mesma teoria Julio Verne deve ter sido responsável pelo surgimento do Excite (http://www.excite.com/), antes conhecido como Architext. Em setembro de 1993, seis alunos de graduação da Stanford University acharam que alguma coisa poderia ser inventada para facilitar o processo de busca e identificação de documentos no então nascente World Wide Web. Felizmente para eles, tiveram a idéia e sabiam como executá-la. Hoje, com sede em Mountain View, Califórnia, o Excite é mais um mecanismo do tipo profissional, com empresa (Excite Inc.) de ações em bolsa (NASDAQ: XCIT) e, agora, executivos angustiados com o sobe e desce do valor do papel. O Excite anuncia até em TV nos EUA; curiosamente, para buscar anunciantes para sua home-page, e não visitantes. Se você usa o Netscape, visite o Excite, e procure pelo "Turbo Search!" do Excite Direct, à esquerda na tela principal. Faça o download e instale o pequeno software (500 Kb), que se acomoda harmoniosamente junto aos "directory buttoms" do Netscape. Deste jeito, você vai poder fazer buscas no Excite a qualquer momento, sem precisar visitar antes a página deste excelente "oráculo". Mas o Excite oferece muito aos visitantes. Eis o que existe além, óbvio, do sistema de busca, descrito mais adiante: * Excite Reviews, com descrição e classificação de mais de 60 mil sites, inclusive brasileiros. * O Excite adquiriu a city.net, ótimo diretório de cidades, que você acessa clicando na figura central, ao alto da home-page do Excite. * Em http://www.excite.com/navigate/home.html o leitor que opera servidor Web (somente para SunOS 4.1.4, HP-UX 9.05, Solaris 2.4, IBM AIX 3.2, SGI IRIX 5.3, BSDI 2.0 e Intel Windows NT - Linux e Macintosh saem em 1997) pode instalar sem custo o "Excite searching". * Exciteseeing Tours, onde você escolhe um tema e é apresentado a um conjunto de informações dentro do Web relacionadas à sua escolha. Funciona como orientação e prevê a inclusão de dicas dos próprios usuários, que assim se beneficiam com as experiências dos outros. Já existem mais de 200 "tours" disponíveis, com temas bem interessantes. * O Excite Live! é um excelente sistema customizado de notícias de centenas de fontes, que "aprende" continuamente a identificar as notícias de maior interesse para o usuário. Não deixe de experimentar o "News Tracker". * Referências que vão desde mapas e dicionários até locais onde existem softwares disponíveis. * * * A PC World (USA) de setembro deu ao Excite a melhor classificação diante de comparações com AltaVista, Infoseek, HotBot, Lycos, Magellan, Open Text, e WebCrawler. São cerca de 50 milhões de URLs (que o Excite diz serem contadas de maneira diferente e mais rigorosa do que os 50 milhões anunciados também por alguns dos demais mecanismos). Dos 50 milhões, o Excite identifica o grupo de cerca de 5 milhões que mudam semanalmente, e está sempre reclassificando-as. As outras são atualizadas em prazos de algumas semanas. A busca do Excite não só vai atrás de ocorrências das palavras-chaves como, ainda, se aprofunda tentando oferecer idéias semelhantes. É a chamada busca por conceito (Intelligent Concept Extraction - ICE). Este é um processo dinâmico de aprendizado (quem disse que computadores não aprendem?). A partir de um documento resultante da busca, o Excite pode ser instruído a procurar outros semelhantes. Neste caso - note a diferença -, não está procurando mais a partir de suas palavras-chaves, mas a partir de uma resposta que você apreciou. Portanto, os resultados têm chance de serem ainda mais precisos. Testei o Excite com uma busca para "tirar mancha de gordura" e a resposta veio em português, http://www.sebes.com.br/empresas/supercou/dica.htm, a sétima das dez primeiras exibidas na tela. Embora o Excite não disponha de busca avançada, reaje diferentemente aos nomes, desde que você coloque maiúsculas. Também é possível usar os operadores boleanos AND, OR, e AND NOT. O AND serve para juntar palavras que devem aparecer no resultado; o OR trabalha como opção, onde pelo menos uma das palavras apareça; e o AND NOT aponta palavras que não devem ser consideradas. Podem-se usar sinais de parênteses para agrupar expressões boleanas mais complexas. Quem não se sente bem usando boleanos pode substituí-los por sinais de mais (+) e menos (-), que devem aparecer "grudados" às palavras. Quando se usa a busca com operadores boleanos, a busca por conceito é desativada para que as respostas possam obedecer às instruções boleanas. * * * Fiquei agradavelmente surpreso com a repercussão da charada criada por Paulo Cesar Bouhid (pcbouhid@nutecnet.com.br) e publicada aqui na semana passada. Várias dezenas de leitores se habilitaram a destrinchar o problema. A resposta única é: Paulo tem 49 anos, Helio 34 e Sandra 23. Quem quiser saber como se chega à solução pode enviar mensagem ao próprio Paulo. Naturalmente, as idades devem ser números inteiros e como "cada uma das pessoas citadas tem menos de 100 anos", inclusive, portanto, o pai de Paulo, o filho não poderia ter 98 anos, o que elimina uma segunda resposta de números inteiros. Os cinco primeiros a acertarem a charada foram Luis Melo (Luis_Melo@praxair.com), Hugo Kaulino Pereira (hugo@marlin.com.br), Inez (pedroc@ax.apc.org), Iris Novello (iris@iis.com.br) e alguém que se identificou apenas como (jcband@ibm.net). E a charada, uma vez publicada, mexeu comigo, com os leitores e também com os Bouhid. Veja o que me escreveu Paulo: "É desnecessário lhe dizer o tamanho da emoção do meu pai ao ler a coluna, e também a ponta de orgulho dos meus filhos por verem o nome da família num jornal e coluna respeitáveis. Algumas pessoas me perguntam como cheguei até você, se o conheço, como é que alguém publica alguma coisa de outra pessoa que nem conhece. Elas ainda não foram atingidas pelo espírito de fraternidade que envolve as pessoas que navegam na Internet." O velho professor Bouhid, a propósito, tem 83 anos. * * * O médico e leitor Jorge Calasans Maia (cadri@ibm.net) tem uma história interessante: "Após ler seu artigo sobre o Lycos criei novas esperanças de achar alguns amigos há muito tempo perdidos nos EUA. Assim, após clicar "People Find" e digitar os três nomes que procurava, o Lycos respondeu em menos de 10 segundos, apresentando os respectivos endereços e telefones. A maior surpresa foi que, logo após, eu liguei e eles atenderam. Emocionante! Foi surpreendente o poder do Lycos, visto que os endereços que achei não foram de nenhuma metrópole e sim de cidades pequenas (Lakewood e Boulder) próximas a Denver (Colorado). O Lycos me deu todas as dicas e informações sobre as cidades. Mapas com localização dos endereços nas ruas, atrativos, serviços, etc. Um espetáculo!" * * * Esta foi a nona parte da série sobre os mecanismos de busca e indexadores da Internet. Faltou espaço para falar de outros sistemas brasileiros, como era minha intenção. Farei isso, portanto, na terça que vem, encerrando a série com um resumo para servir de guia prático de uso dos "oráculos". Na verdade, estou em dúvida se sigo em frente por mais umas três ou quatro semanas, pois ainda há assuntos importantes que não abordei. Agradeceria receber mensagens indicando se devo ou não me estender por mais algumas semanas com o tema dos "Oráculos Digitais". Enquanto isso, histórias verdadeiras, instrutivas ou pitorescas, sobre o uso de mecanismos de busca são bem-vindas e devem ser enviadas para meu endereço usual, charlab@ax.apc.org. Dominar o uso das técnicas de busca nestes "oráculos digitais" é a melhor estratégiapara quem quiser sentir-se à vontade com a Internet. Se você está gostando da série, avise aos seus amigos da Internet que o encontro é aqui. Quem perdeu alguma parte deste tutorial pode pedir o que falta enviando e-mail para charlab@charlab.com.br. Sérgio Charlab charlab@ax.apc.org http://www.charlab.com.br ---------------------------------------------------------------------- SÉRGIO CHARLAB (charlab@ax.apc.org) (http://www.charlab.com.br) é Editor-Chefe de Seleções do Reader's Digest (http://www.selecoes.com.br), colunista de "Ciberespaço" do Jornal do Brasil e autor dos livros "Você e a Internet no Brasil" (http://www.charlab.com.br/ch2505.html) e "O Seu Futuro Eletrônico". ---------------------------------------------------------------------- Os Oráculos Digitais: NlightN (Tutorial, parte 10) Se a série dos Oráculos Digitais fosse minha plataforma eleitoral, eu já estaria eleito mesmo antes de sexta-feira. Não recebi uma única mensagem em favor do encerramento da série agora, nesta parte 10. Os que escreveram (foram dezenas de mensagens muito gentis e muito estimulantes às quais eu agradeço aqui) querem ler mais sobre os oráculos. Que assim seja. Foi bom ter feito este plebiscito porque também ficou muito claro que, ao final, é indispensável um bom quadro comparativo entre os vários mecanismos de busca citados ao longo das última semanas em Ciberespaço. Vou me esforçar para fazer isso de forma que, ao final da série, seja lá quando for, tenhamos um material útil e de consulta rápida para identificar os caminhos mais apropriados na hora de usar os oráculos. Estou cada vez mais convencido de que dominar o uso das técnicas de busca nestes Oráculos Digitais é a melhor estratégia para quem quiser sentir-se à vontade com a Internet. Recebo muitas mensagens com perguntas e dúvidas variadas, de software, hardware e o que mais se puder imaginar. Sei que as respostas estão nos oráculos. E se puder ajudar você a encontrá-las, é como se eu o ajudasse a pescar, em vez de dar o peixe. Se você está gostando da série, avise aos seus amigos da Internet que o encontro é aqui, às terças. Aos que estão chegando ou aos que perderam algumas das partes anteriores, lembro que basta enviar mensagem de e-mail para charlab@charlab.com.br e pedir o que falta. * * * Creio que pouca gente aqui conhece ou já ouviu falar do NlightN (http://www.nlightn.com e informações via info@nlightn.com). Eu o venho usando há mais de um ano. É um oráculo interessantíssimo, mas preciso antes deixar bem claro que é pago (vamos ver exatamente como) e que eu não tenho qualquer relação com esta empresa. Ou seja, escrevo sobre o NlightN porque gosto do serviço. Não estou pedindo a nenhum leitor que o assine. Cada um deve avaliar por si a conveniência de usar os serviços pagos do NlightN. Embora o NlightN esteja apto a fazer busca no World Wide Web (usa o Infoseek para isso), sua grande utilidade é a busca numa vasta coleção de banco de dados. Podem ser pesquisados simultaneamente, com a mesma simplicidade a que nos acostumamos a partir do uso de outros oráculos. Não há nenhum custo para a busca. Mas quando você localiza um artigo que o interessa, para obter o texto completo é preciso se registrar, e obter crédito através do uso de cartão ou depósito em conta. Pode-se fazer isso pela própria Internet. Você determina o valor do crédito. Digamos que queira disponibilizar apenas US$ 5. Você é cobrado por documento, em geral, 10 centavos de dólar por unidade. Seus US$ 5 dão para comprar 50 documentos. Existe 1 bilhão de itens de informação disponíveis nos bancos de dados do NlightN. * * * Muito bem, se você é bibliotecária (usei o gênero feminino pensando numa amiga que conheci pela Internet e que trabalha na área), pode correr para o NlightN. Mesmo que não seja bibliotecária, pode ir lá dar umas tacadas. A partir do que eles chamam de Universal Index, usei Charlab como palavra-chave de busca. Você pode usar combinações com os operadores boleanos. Se você usa duas palavras, o NlightN considera um and e procura pela ocorrência simultânea das duas. Também pode-se usar o or ou o not e uma combinação complexa a partir do auxílio de parênteses. Depois, pode escolher se vai realizar a busca em Databases, News, Internet, Reference, ou Book Store. Charlab resultou em 19 entradas nos bancos de dados do NlightN. Através desta busca, minha irmã, pesquisadora, descobriu alguns trabalhos em que fora citada e não tinha conhecimento. E eu encontrei alguns artigos que escrevi há quase dez anos quando era colaborador de uma revista especializada em café. Se você escreveu ou produziu algum tipo de trabalho de pesquisa, tem boas chances de se encontrar no NlightN. As bases de dados, internacionais, compostas de índices de periódicos, abstratos, resenhas e documentos completos, abrangem fontes que vão desde a famosa Library of Congress, passando por Film Literature Index e Magazine Articles Summary, e tratam de temas tão diversificados quanto ciência, negócios, saúde, humanidades, entretenimento e educação. Veja a lista em http://www.nlightn.com/nlndemo/docs/dblist.htm. Além disso, o NlightN, em suas outras modalidades de busca, ainda inclui os arquivos de texto completo de serviços de notícias importantes como Knight-Ridder, PR Newswire, Sports Wire, e Investment Wire, fora as obras de referência, como o Webster. A mesma empresa responsável pelo NlightN criou o excelente Net Locator (http://nln.com/). Uma vez lá, use o AccuFind (você pode preferir ir direto para http://accufind.com) para fazer buscas. Vale a visita. Ele busca tudo, sem restrições. E aceita qualquer palavra, pedaço de palavra, número e o que mais lhe vier na cabeça. Minha personalidade adolescente assumiu o controle e resolveu procurar usando algumas das palavras que aqui chamamos de palavrões mas que não são, necessariamente, longas. Foi divertido encontrar gente que tem nossos palavrões como parte de seus nomes. Imagine se um dia você dá de cara com a Sra. Lia Bu**** ou com o Dr. Paulo Ca****. Perdão, perdão... Não pude resistir... * * * Esta foi a décima parte da série sobre os mecanismos de busca e indexadores da Internet. Ahh..., a Internet. Eu que nunca me interessei por horóscopos devo admitir que me deixei seduzir pela magia desta previsão aqui, colhida sob encomenda depois que visitei casualmente http://hotstuff.plugue.com.br/blocos/horoscop2.html. "Querido Charlab, nosso encontro virtual estava escrito nas estrelas. Sabia que você ia gostar de Horoscopulações. Gêmeos é regido por Vênus, e você como bom geminiano ficou excitado com o duplo sentido das minhas palavras. Ainda tenho outros mil artifícios para atraí-lo. Posso traçar o seu mapa, entregar-lhe o mapa da mina ou ainda fazer-lhe previsões que não estão no mapa. Se você preferir também podemos experimentar, só nós dois, um método revolucionário de quiromancia. Não é leitura de mão. Você tem que segurar meus seios. Na mão esquerda desvendarei seu passado, na direita adivinharei seu futuro, mas se quiser um presente inesquecível arranque selvagemente minha calcinha com ambas as mãos! Mantenha o astral elevado. Sua, Vênus de Andrômeda." Uma brincadeira, claro. B-r-i-n-c-a-d-e-i-r-a! Ouviu, Raquel! (Raquel é minha mulher.) Aliás, esta Vênus de Andrômeda brinca de modo bem mais sadio do que aquela maluca nos Estados Unidos que pediu, pela Internet, para outro maluco assassiná-la. E o idiota ainda cumpriu o pedido... Sérgio Charlab charlab@charlab.com.br. Os Oráculos Digitais: Deja News (Tutorial, parte 11) Acho que já disse aqui que estou de mudança. Para ir do computador à cama, um dos caminhos principais onde ainda moro (passei anos tentando colocar a geladeira neste trajeto), preciso driblar meia dúzia de caixas de papelão entupidas de livros e cacarecos. Eu não sou uma pessoa experiente com mudanças de residência. Até hoje só fiz uma. Por isso mesmo, quando minha mulher pediu para eu começar a arrumar as coisas, sentei-me diante do computador e comecei a apagar todos os arquivos e diretórios imprestáveis. Não faz sentido ter o trabalho de levá-los para nosso novo endereço. Senti-me orgulhoso por assim poder colaborar para que nossa mudança seja feita com mais organização. Fiquei tão empolgado com a faxina que tomei uma decisão que vinha protelando: resolvi investigar minha correspondência eletrônica diária não-solicitada. Durante dois dias, somei tudinho e calculei que mais de 35% dos e-mails que chegam aos meus..., deixe ver..., cinco endereços (agora quatro, porque, diante do custo incompatível com os preços do mercado, resolvi cancelar o charlab@embratel.net.br) são indesejados. Listas que não pedi para entrar, releases (muitas vezes em duplicata) que não dou conta de ler e uma enxurrada de correntes e propaganda capaz de desesperar até gari da Comlurb acostumado a trabalhar no dia 1 de janeiro na praia de Copacabana. Note que não são - jamais serão - indesejáveis as mensagens espontâneas de amigos, leitores e gente que quer me contar algo, trocar uma conversa ou fazer umas perguntas. Diante do lixo, no entanto, minha correspondência desejada, muita vezes, fica encoberta. E isso é mal. Na verdade, se há algo que me preocupa em relação à Internet neste fim de 1996 não é a velocidade da rede ou a briga dos browsers. Mas, sim, a ameaça da correspondência eletrônica não-solicitada. Não creio que tenha a força para liderar um movimento desta natureza, mas considero iniciada minha batalha contra as correntes. O leitor está convidado a me acompanhar, bastando para isso que não as passe adiante. * * * O que isso tudo tem a ver com o Deja News (http://www.dejanews.com)? Pesquisa. Um dos endereços (falsos) mais ofensivos em termos de e-mails não-solicitados é o Mailer@aol.com. Na verdade, o verdadeiro emissor destas "baboseiras" se esconde atrás do domínio Interramp, mas quando escrevo o e-mail "Mailer@aol.com" no mecanismo de busca do Deja News, fico logo sabendo que milhares e milhares de usuários da Internet adorariam dar um "boot" na cara deste artista. Ou se escrevo "good times virus" logo fico sabendo que não passa de mais uma lenda da Internet. É mentira, não existe. O que o Deja News faz é ler tudo o que se escreve em 15 mil newsgroups da Usenet. (E para atiçar logo alguns leitores, hoje o Deja News é provavelmente a melhor solução para a maioria de nós brasileiros que não conta com um servidor de news operativo em nossos respectivos provedores.) * * * O que é Usenet? O Deja News gosta da definição de Harley Hahn, no trabalho "A Student's Guide to UNIX": "Simplificando, a Usenet é o maior serviço existente de informação". Abriga, em todo o mundo, mais de 20 mil diferentes tópicos. Em cada um deles, uma determinada comunidade de usuários pergunta, responde e troca informação ou papo furado. Fala-se de receitas da vovó, ao reverso da turbina do Fokker; de vídeos piratas da Xuxa, até a reeleição de FHC. Acredite, fala-se de tudo, todos os dias. Alguém disse certa vez que o conhecimento humano roda nos newsgroups Usenet inteiramente a cada três dias. É um certo exagero, mas a Usenet é capaz de resolver muita dúvida, fazer amigos e encontrar gente como a gente em qualquer canto do planeta digital. Os newsgroups não são ainda muito populares no Brasil. Primeiro porque, em geral, o idioma é o inglês (embora existam newsgroups absolutamente brasileiros). Depois porque a maioria dos usuários de Internet no Brasil não dispõe de condições de acesso aos newsgroups. Mas é lá, na Usenet, que se desenrolam os grandes papos da Internet. Note que é diferente do conceito de IRC, onde o papo é na hora, em tempo real. Na Usenet, você escreve e sua mensagem fica disponível para quem desejar lê-la, como se fosse num grande quadro de aviso. Que tal testar este conceito? O Deja News mantém uma coleção indexada de tudo o que se posta na Usenet, desde março de 1995, o que significa 80 Gbytes de informação disponível para sua procura neste oráculo. São mais de 50 milhões de artigos, o que não impede o Deja News de ser extremamente rápido. E a meta é aumentar os arquivos de modo que algum dia o Deja News se orgulhe de ter absolutamente tudo postado na Usenet desde 1979, quando surgiram os newsgroups. * * * Usar o Deja News é fácil. Aprender toda a potencialidade do mecanismo de busca deste oráculo requer, no entanto, mais dedicação. Para começar, basta escrever uma ou mais palavras-chaves para a busca. Palavras incompletas, usadas como radicais, também funcionam, como "jorna*", que serve para localizar menções de "jornal", "jornalista", "jornaleiro", etc. Usando os chamados filtros, sua busca pode ser restrita a um subconjunto do banco de dados, formado por determinado newsgroup, autor, data e assunto. Pode-se também ler todo o fluxo de mensagens sobre um determinado assunto. É nestas possibilidades que o Deja News se mostra superior aos mecanismos de busca no Web, como o Altavista, Excite ou Infoseek, entre outros, que também vasculham a Usenet. Só no Deja News você pode, por exemplo, pedir um relatório completo sobre as postagens de determinada pessoa nos últimos meses. São dados interessantes, mas também absolutamente antiprivacidade. Empresas nos EUA vasculham o Deja News antes de contratar candidatos a empregos. É o lado bom e mau da tecnologia. Por isso mesmo é que existem os meios de você postar mensagens na Usenet de forma anônima. Mas isso é outra conversa. * * * Por favor, teste o Deja News, porque vou voltar a falar dele assim que me livrar das tarefas da mudança, o que espero seja na próxima terça, claro. Esta foi a décima primeira parte da série sobre os mecanismos de busca e indexadores da Internet. Apostas estão sendo aceitas para ver quem adivinha em que parte a série chegará ao fim. Histórias verdadeiras, instrutivas ou pitorescas, sobre o uso de mecanismos de busca são bem-vindas e devem ser enviadas para meu endereço usual, charlab@ax.apc.org. Os que chegaram agora podem pedir os textos anteriores da série enviando mensagem para este outro endereço: charlab@charlab.com.br Sérgio Charlab charlab@ax.apc.org http://www.charlab.com.br Os Oráculos Digitais: Deja News (Tutorial, parte 12) Depois que o caminhão se foi com a mudança, notei que levaram minha cadeira preferida, aquela que uso junto do computador. Assim, resignados, ficamos nós três - eu, o computador e a linha telefônica - no endereço antigo por mais alguns dias. Naturalmente não passei estes dias inteiros lá com eles, porque, na mudança, levaram a imprescindível geladeira. Dos três, eu era o único que resmungava, não só porque os outros não têm fome e sede, mas também porque o caixote que arrumei, na garagem, para sentar estava bastante desconfortável. (Céus, que injustiça eu quase ia cometendo! Devo dizer que o aquário com meus sete peixes também ficou - até hoje o Jacques, meu filho de cinco anos, quer saber onde foi parar "aquele peixinho malhado", que era o oitavo e foi comido impiedosamente por outro. As empresas de mudanças podem até ter experiência para descer um piano de cauda pela janela, mas ainda não se familiarizaram com aquários.) * * * Vou usar o Deja News (http://www.dejanews.com) para postar uma mensagem em algum newsgroup que trate do tema, perguntando se é mesmo preciso transportar a água do aquário ou se posso tornar a enchê-lo com água nova e o anticloro. Deixe-me ver... Em inglês, temos aquarium. Escrevo "aquarium" na segunda ranhura de busca da página principal do Deja News. Ali, a busca é por newsgroup. O Deja News verifica em quais dos 15 mil newsgroups disponíveis em arquivo a palavra chave foi citada. No meu caso, a resposta, que vem classificada em percentuais segundo a frequência das citações, foi: rec.aquaria (99%), alt.aquaria (47%), sci.aquaria (26%), rec.aquaria.marketplace (24%) e outras cotadas com menos de 20%. Então decido que vou postar uma mensagem no rec.aquaria. Clico na figura onde se lê "post" e descubro que o sonho de muitos usuários brasileiros está ao alcance do clique do mouse, em http://grunt.dejanews.com/post.xp. Você pode escrever e postar mensagens na Usenet ainda que não disponha de acesso a um servidor, utilizando a funcional interface Web do Deja News. * * * As principais regras são a da boa ética e educação; use seu próprio e-mail, não poste cópias de uma mesma mensagem, não poste mensagens inadequadas ao newsgroup e não poste besteiras, como as famosas correntes. Se você se registrar com o Deja News (é de graça!), poderá postar mensagens sempre que desejar diretamente desta interface. Caso contrário, será pedida uma confirmação do seu e-mail, via mensagem de correio eletrônico. E para ler as respostas à sua mensagem? Visite http://www.dejanews.com/forms/rn.html e preencha o quadro com os nomes dos newsgroups que lhe interessam. Na ranhura em baixo do quadro maior, você pode usar palavras chave para descobrir nomes de newsgroups. Uma vez feita sua escolha de newsgroups, clique no botão "read news". Na nova página, basta usar o quadro de escolha do nome do newsgroup e do número de dias que você deseja ler. Para facilitar as coisas, você pode escrever na primeira ranhura palavras que você deseja ver nas mensagens e, na segunda ranhura, as que não deseja. * * * Embora seja um pouco entediante para quem vai lendo sem acompanhar com o computador ligado no Deja News, vale a pena destacar algumas das possibilidades de uso avançado deste mecanismo de busca. * Como padrão, o sistema assume que a busca feita com mais de uma palavra chave deve gerar resultados em que todas as palavras sejam encontradas. Se não for este o desejo de quem faz a busca, é necessário usar os outros (assumindo que o padrão é o "AND") operadores boleanos "OR" e "NOT". Use parênteses para fazer combinações de boleanos. Exemplo: "(Jacques OR Layla) AND Charlab" * Asteriscos podem ser usados para cercar múltiplas palavras que iniciem da mesma forma, como, por exemplo, "jornal*", que serviria também para "jornalista", "jornaleiro", etc. * Aspas podem ser usadas para busca das palavras na exata sequência, como em "Jornal do Brasil". * O símbolo do acento circunflexo pode ser usado para denotar uma busca de proximidade, onde pode-se determinar a que distância máxima duas palavras devem ser encontradas para servirem como resposta. O Deja News também permite busca por contexto, como "author", "subject", ou "newsgroup". O sinal usado é o de um til, seguido, sem espaço, das letras "a", "s" ou "g", respectivamente para as três possibilidades de busca. Exemplos: ~a charlab@ax.apc.org, ~s Photoshop 4.0 ou ~g warez. Note que dentro dos campos de busca você pode usar a linguagem boleana ou outros operadores, não havendo, por exemplo, necessidade de colocar um e-mail completo na busca por autor. Não posso deixar de mencionar o chamado "Query Filter", que lhe permite definir campos de busca no modo avançado. Sei que não é todo mundo que vai se interessar por tamanho minúcia para melhorar os resultados de suas buscas. Mas está lá, disponível. * * * Ninguém tem dúvidas de que o Deja News, na categoria de oráculo Usenet, é o maior. Mas já vimos que nele não é possível ler, por exemplo, as mensagens binárias. Felizmente a Internet é democrática o suficiente na oferta de opções para tudo. Tome nota de um dos, por assim dizer, concorrentes do Deja News: http://www.reference.com/ O Reference.COM, em fase beta ainda, faz busca em 16 mil newsgroups e ainda inclui centenas de listas de discussão. Também permite leitura e postagem de news. E lembre-se que o AltaVista, Excite e Infoseek, oráculos tradicionais, também permitem a busca de mensagens Usenet. * * * Dominar o uso das técnicas de busca nestes "Oráculos Digitais" é a melhor estratégia para quem quiser sentir-se à vontade com a Internet. Esta foi a décima segunda parte da série sobre os mecanismos de busca e indexadores da Internet. Os que chegaram agora à série podem pedir os textos anteriores enviando mensagem para este outro endereço: charlab@charlab.com.br. Se as respostas atrasarem é porque ainda estou sentado no caixote na casa antiga, sem a geladeira. (Espero que não!) Semana que vem, Yahoo!, o mais famoso "oráculo diretório" da Internet. A propósito, descobri (dica obtida no newsgroup rec.aquaria.freshwater.misc) que para mover aquários deve-se colocar os peixes em sacos com água do próprio aquário. Quanto mais sacos e quanto mais água, melhor. Transporta-se o aquário vazio e, depois de recolocar os peixes e a água transportada em sacos, completa-se o nível com água nova. Bem lógico, não? Aproveito e compro mais um para que o Jacques fique feliz ao contar oito peixes novamente no aquário. Sérgio Charlab charlab@ax.apc.org http://www.charlab.com.br Os Oráculos Digitais: Yahoo! (Tutorial, parte 13) O que têm em comum o Chevere! (http://www.chevere.com), Explora Mexico (http://www.exploramexico.com/), Robohoo! (http://www.geocities.com/CapeCanaveral/3355/index.html), YoPet! (http://www.hisurf.com/yopet/), Adultinks (http://www.adultlinks.com/), Cade? (http://www.cade.com.br), Fantastico! (http://www.fantastico.com/), Jubii! (http://www.jubii.dk/), Naughty Linx (http://www.naughty.com/), Ole! (http://www.ole.es/), Ozu (http://www.ozu.com/), Seznam (http://www.seznam.cz/), Snoohoo! (http://www.ifi.uio.no/~hermunda/Snooker/Snoohoo/), Uffda! (http://www.mnonline.org/uffda/), Walla! (http://www.walla.co.il/), Who's Hoo in South Africa (http://www.whoshoo.co.za/cgi-bin/index.pl), Woohoo! (http://woohoo.pair.com/), Yahala! (http://www.yahala.com/), Yahho (http://yahho.ita.tutkie.tut.ac.jp/yahho/), Yaih? (http://www.ci.rnp.br/si/index.html), Yeehaw (http://Yeehaw.Nashville.Net/), Yehaa! (http://www.yehaa.com/), YEOWSA! (http://www.msjnet.edu/yeowsa/), YiPPiE! (ttp://www.dn.net/yippee/), Yoohoo! (http://www.amorn.baremetal.com/yoohoo/), Yoohoo! Lesbians! (http://www.sappho.com/yoohoo/) e o yOyee! Net (http://www.yoyee.com/)? São todos "Yahoo! Inspired". Ou seja, inspirados no Yahoo! (http://www.yahoo.com). E se é verdade que as coisas bem feitas são logo copiadas, então o Yahoo! está no bom caminho. O Yahoo! surgiu em abril de 1994 e era apenas um hobbie de David Filo e Jerry Yang, candidatos a um doutorado em Engenharia Elétrica na Universidade de Stanford, na Califórnia. O nome é um acrônimo para "Yet Another Hierarchical Officious Oracle". Bem, a empresa hoje é a Yahoo! Inc. Tem ações em bolsa e 340 anunciantes na carteira. Ainda está em fase de amadurecimento, por isso perde dinheiro. Mas sua liderança entre os mecanismos de busca, com oferta diária de 14 milhões de páginas para os usuários, põe o Yahoo! numa situação bem especial. * * * Um dos pioneiros e certamente o mais popular mecanismo de busca da Internet, o Yahoo!, um "oráculo diretório", baseia sua funcionalidade na classificação do World Wide Web em categorias. São 14 as categorias principais do Yahoo!: Artes e Humanidades, Economia e Negócios, Computadores e Internet, Educação, Entretenimento, Governo, Saúde, Notícias e Mídia, Recreação e Esportes, Referência, Regional, Ciência, Ciências Sociais, e Sociedade e Cultura. Naturalmente, tudo isso devidamente no idioma pátrio do Yahoo!, o inglês. A partir de umas das 14 categorias, você, mesmo sem fazer qualquer busca por palavra-chave, pode refinar a procura. Clique, por exemplo, em "Society and Culture" e você verá dezenas de subcategorias, como "Relationships". O número à direita indica quantos sites estão catalogados, o que, no caso de "Relationships", chega a 202. Clique ali e vai obter mais umas duas dezenas de (sub) subcategorias, como "Romance", que aparece com 41 sites. Clique em "Romance" e você estará diante de mais algumas (sub)(sub) subcategorias e vários sites com endereço e breve descrição, como o "Cupid’s Love Notes", a partir do qual você envia um galanteio digital para a pessoa que ama. Naturalmente, se já ao acessar a página inicial do Yahoo! você resolver fazer uma busca por palavra-chave usando para isso a palavra "cupid", vai receber 26 respostas, das quais a última é exatamente o "Cupid’s Love Notes" (http://www.northernlife.com/valentin/). * * * Como o Yahoo! é um oráculo de diretórios, através dele mesmo é fácil pesquisar a popularidade dos sites de mecanismos de busca na Internet (http://www.yahoo.com/Computers_and_Internet/Internet/World_Wide_Web/Sea rching_the_Web/). Segundo o Yahoo!, são 144 diretórios e 35 índices. Chegam a 103 o número de páginas que reúnem vários mecanismos de busca em forma simplificada e a 104 o número de mecanismos de busca propriamente ditos. Além dos já mencionados "Yahoo! Inspired", entre os quais os brasileiros Yaih? E Cadê?, existe ainda a categoria de "Yahoo! Parody" (paródia), e um destes merece a sua visita: o Yancovic! (http://www.contrib.andrew.cmu.edu/~sc5x/yankovic.html). Mas voltando ao sistema de categorias do Yahoo!, você pode usar uma ou mais palavras-chaves para achar o que procura. Clique em "options" e haverá a chance de escolher o local de busca (no próprio Yahoo!, na Usenet - via Deja News - e num catálogo de e-mails - via Four11); o uso do boleano "AND" ou "NOT", para você combinar ou excluir palavras-chaves na busca; a quantidade de resultados exibidos por tela; e o uso das palavras completas ou não para localizar os resultados. Sendo um "Oráculo Diretório", ao Yahoo! nunca coube destaque no trabalho de vasculhar a imensidão de sites da rede. Seu banco de dados, embora classificado por seres humanos (o que, felizmente, ainda traz algumas boas vantagens) é modestíssimo perto dos arquivos dos demais mecanismos de busca. Portanto, o Yahoo! só é bom para coisas mais genéricas, e não para buscas de termos específicos. Ao apresentar resultados, primeiro lista categorias, depois sites avulsos. "Rio de Janeiro", por exemplo, é resultado da categoria "Regional" e subcategorias "Countries", "Brazil" e "States". O Yahoo! exibe esta informação assim: Regional:Countries:Brazil:States:Rio de Janeiro. Mas nem tudo está perdido para buscas mais específicas. Fãs do Yahoo! podem perfeitamente utilizá-lo como ponto de partida. Não só o Yahoo! está desenvolvendo um novo mecanismo de busca (que você acessa a partir da referência "Try Our New Search"), à direita, na página principal, como toda busca apresenta, logo acima da lista de resultados, a chance de procurar no "AltaVista Web Pages". Isso é resultado do acordo entre o Yahoo! e o AltaVista. Se sua busca no Yahoo! não der qualquer resultado, automaticamente você já receberá os resultados da busca no AltaVista. Se não bastar, no final da lista de resultados, aparecem ainda as referências para outros mecanismos ("Other Search Engines"), como o Alta Vista , Image Surfer, WebCrawler, HotBot, Lycos, Infoseek, Excite e DejaNews. Clicando num destes, você não precisa escrever as palavras-chaves de sua busca; o Yahoo! automaticamente repassa as palavras-chaves utilizadas para estes outros mecanismos. É rápido e interessante. * * * Junto ao Excite e ao HotBot, o Yahoo! acaba de ser escolhido como "Editor’s Choice" pela PC Magazine norte-americana. A revista fez uma avaliação comparativa dos dez principais mecanismos de busca (http://www.pcmag.com/iu/srchsite/_open.htm): AltaVista, Excite, HotBot, Infoseek, Lycos, Magellan, Open Text, WebCrawler, WWW Worm e o Yahoo! Há quem diga que vem acompanhando com atenção esta coluna (hehehe...). Mas é interessante notar como a reportagem destaca que "nenhum único mecanismo de busca é capaz de dar conta de todas as tarefas". O Excite (parte 9 deste tutorial) levou o título de melhor para buscas genéricas, apresentando alto percentual de respostas relevantes.O HotBot (parte 3 deste tutorial), ganhou destaque ao combinar seu enorme banco de dados de texto completo das páginas Web com uma sofisticada interface de busca. E o nosso Yahoo! de hoje ganhou como melhor diretório Web, com classificação de alta qualidade dos sites de suas 14 categorias e milhares de subcategorias. * * * Tem mais Yahoo! semana que vem. Até lá, procure instalar o "my yahoo! news ticker" (para Windows 95! ou NT 4.0 apenas - usuários de Macintosh e Windows 3.1 serão atendidos em breve, eles prometem - e para quem usa qualquer versão do Netscape ou Explorer versão 3.0). É bem interessante para quem quer ter notícias enquanto navega pela rede. Está em http://my.yahoo.com/ticker.html. Esta foi a décima terceira parte da série sobre os mecanismos de busca e indexadores da Internet. Os 27 leitores que apostaram que a série terminaria na décima segunda parte já não ganham mais. Apostas estão sendo aceitas para ver quem adivinha em que parte a série chegará ao fim. Histórias verdadeiras, instrutivas ou pitorescas, sobre o uso de mecanismos de busca são bem-vindas e devem ser enviadas para meu endereço usual, charlab@ax.apc.org. Os que chegaram agora podem pedir os textos anteriores da série enviando mensagem para este outro endereço: charlab@charlab.com.br * * * Não sou fã de festas e comemorações, mas quero registrar meu agradecimento ao leitor de Ciberespaço, a primeira coluna sobre Internet na imprensa brasileira e que agora completa dois anos. Sérgio Charlab charlab@ax.apc.org http://www.charlab.com.br Os Oráculos Digitais: Yahoo! (Tutorial, parte 14) O Yahoo! (http://www.yahoo.com) é mais um dos oráculos que cresce lateralmente na Internet. Para satisfazer os 15 milhões de conexões diá rias que recebe de mais de 90 países, o Yahoo! cada vez oferece mais serviços paralelos. Meu filho Jacques, de 5 anos, por exemplo, mal sabe o que é o Yahoo!, mas confia plenamente no Yahooligans! (http://www.yahooligans.com/), espécie de Yahoo! para crianças operado pela mesma empresa do original. Lembre-se que, como o Yahoo!, o Yahooligans é classificado por humanos e mantém um catálogo de sites de qualidade. Pode deixar seu filho à vontade ali. Como pai, minha queixa é apenas o idioma. Está tudo em inglês. Mas até nisso o Yahoo! parece caminhar de lado em bom ritmo. Já existe um Yahoo! France (http://www.yahoo.fr/), um Yahoo! Deutschland (http://www.yahoo.de/) e um Yahoo! Japan (http://www.yahoo.co.jp/), fora outros de lingua inglesa como os do Canadá e do Reino Unido. Alguém precisa dizer aos executivos da Yahoo! Inc. que aqui temos 500 mil usuá rios da Internet que falam português! Afinal, já há Yahoo! especial até para algumas cidades americanas. Por falar nisso, hoje é uma empresa chamada Softbank Corporation, de origem japonesa, quem dá as cartas no Yahoo!, com quase cerca de 30% das ações da empresa. Trata-se da mesma que adquiriu 100% da ZDNet, a mais famosa editora de informática e que publica, entre outras, a PC Magazine. E entre os "serviços paralelos"do Yahoo! está até a publicação de uma revista, a "Yahoo! Internet Life". Gosto de enfatizar o aspecto econômico e de business destas empresas porque são elas, provavelmente, as que mais potencial de crescimento têm para a próxima década. Assim como em 1980 Compaq e outras empresa surgiam aproveitando o nicho novo dos computadores pessoais, agora são as empresas de "oráculos" e outros serviços Internet que sonham em aproveitar a nova onda de negócios. * * * Provavelmente a vedete destes "outros" Yahoo! é o My Yahoo! (http://my.yahoo.com/). Ali você customiza (faz com que o Yahoo! apresente informações especiais para você) tudo. Minha página, por exemplo, traz sempre as notícias dos assuntos que eu quero ler e as cota ções das Bolsas e das ações que me interessam. Infelizmente, nos resultados de esportes, ainda não posso escolher dados sobre futebol brasileiro, mas já é um avanço poder visualizar a temperatura do Rio, São Paulo e Brasília. Não vou entediar você descrevendo os passos para fazer um registro gratuito no My Yahoo! É simples e de graça. Investigue o "Firefly", que a partir de algumas respostas de suas preferências passará a dedicar-se a localizar sites só para seu deleite. Pode ser que sistemas "inteligentes" e personalizáveis como o My Yahoo! (já vimos outros similares nesta série dos "Oráculos") possam representar concorrentes de classe para as empresas jornalísticas na Internet. Explore o My Yahoo! Monte suas escolhas a partir dos botões de "My Internet", "My News" e "My Contacts". * * * O Yahoo! dispõe ainda de um mecanismo de páginas amarelas, em parceria com a Lookup USA para cidades americanas (só de brincadeira, escrevi "Rio" e descobri que existem cinco cidades com o nome de "Rio" nos EUA!). As páginas amarelas no estilo Yahoo! representam uma idéia e tanto para empreendedores digitais brasileiros. As que vi aqui no Brasil são ainda iniciantes (veja uma em http://www.telelistas.com.br/welcome.htm). Quem vai viajar para os EUA não deve deixar de consultar. E use o sistema de mapas que está lá e lhe mostra o ponto exato de cada pequeno comércio da cidade. (Pode deixar cair o queixo, porque é mesmo impressionante!) Como usar? Escreva na ranhura de busca, por exemplo, Orlando. Existem três cidades com este nome. Selecione a da Flórida (FL). Você vai ficar diante de um subYahoo! só para o comércio/serviços de Orlando. Como toco bateria, resolvi procurar uma loja do gênero. Claro que há muitas lá e que eu conheço bem. Quando as encontrei, foi porque abri o catálogo de páginas amarelas do hotel. Agora, posso chegar a Orlando com todos os endereços e mapas de que necessito. Ao fazer a procura, recebo o nome, endereço, distância e mapa da loja. Bem, mas o que é que há comigo? Não chega a ser tão extraordinário assim, pois até o Lycos oferece serviço similar (http://www.vicinity.com/yt.hm?&FAM=lycos&CMD=FILL&SEC=ytstart). * * * Também são atrações do Yahoo! as notícias oferecidas em parceria com a Reuters (http://www.yahoo.com/headlines/), cotações de ações (http://quote.yahoo.com/), e resultados esportivos (http://sports.yahoo.com/). O mecanismo de busca do Yahoo!, simples, ganhou reforço com o "http://search.main.yahoo.com/". Há ótimas opções, como a colocação dos sinais [c], [s], [n] ou [e] na frente da palavra-chave (como em "[e]music") para restringir a busca, respectivamente, às categorias do próprio Yahoo!, Web sites, Usenet e os "Net Events", espécie de guia de programação de TV, no caso, da Internet (veja direto em http://events.yahoo.com/). As outras opções de busca são similares às do AltaVista. Não tenho muito mais espaço e certamente não vamos fazer uma outra parte ainda sobre o Yahoo! Por isso, espie em http://www.yahoo.com/docs/family/more.html para ver o conjunto das ofertas de serviços do Yahoo!. * * * Esta foi a décima quarta parte da série que ameaça entrar 1997 apresentando os mecanismos de busca e indexadores da Internet. Os que chegaram agora podem pedir os textos anteriores da série enviando mensagem para este outro endereço: charlab@charlab.com.br. E eis aqui o leitor Cleverson (clever@iq.ufrj.br), que faz pós-Graduação em Química Orgânica na UFRJ, descrevendo suas experiências com o DejaNews. "Andei fazendo algumas pesquisas no DejaNews e confesso que fiquei impressionado. Realmente parece que lá [na Usenet] se conversa sobre tudo o que se possa imaginar. Só fiquei decepcionado porque na minha á rea de interesse (no caso, relativo ao meu trabalho) havia muitas mensagens de cunho comercial. Mas consegui extrair um artigo interessante com aproximadamente seis páginas de um pesquisador desta minha área (era uma FAQ). Só por isso já valeu a pena." Valeu a pena? Mas claro, seis páginas de FAQ (Frequently Asked Questions) mastigadinha (são perguntas já acompanhadas das respostas - h á um monte delas a partir de http://www.cis.ohio-state.edu/hypertext/faq/usenet/). "Por isso [segue Cleverson, agora levantando a bola da coluna e aliviando a consciência do colunista pelo fato de estar entrando no buraco sem fundo da série dos " Oráculos"], quero dar-lhe parabéns pela sequência de artigos. Você esta nos apresentando alguns elementos dentro da Internet que não são de conhecimento geral (eu mesmo só conhecia as search engines mais populares como Alta Vista e Yahoo!). Continue expandindo os nossos horizontes. Obrigado. Sobre a aposta [quantas partes terá esta série?]. Acho que se o Yahoo! for o último, então teremos mais uns quatro artigos. Mas pela amostra que a Internet nos dá, talvez não tenha fim." Será? Sérgio Charlab charlab@ax.apc.org http://www.charlab.com.br ---------------------------------------------------------------------- SÉRGIO CHARLAB (charlab@ax.apc.org) (http://www.charlab.com.br) é Editor-Chefe de Seleções do Reader's Digest (http://www.selecoes.com.br), colunista de "Ciberespaço" do Jornal do Brasil e autor dos livros "Você e a Internet no Brasil" (http://www.charlab.com.br/ch2505.html) e "O Seu Futuro Eletrônico". ---------------------------------------------------------------------- Os Oráculos Digitais: WebCrawler (Tutorial, parte 15) O WebCrawler (http://www.webcrawler.com) é veterano na área. Tem hoje como slogan a frase "Search before you surf" (procure antes de navegar) que é conselho que venho repetindo há 15 semanas. Virou "oráculo" ainda em 1994, a partir de um trabalho de pesquisa de Brian Pinkerton, da Universidade de Washington, que o transformou no primeiro mecanismo de busca por texto completo de páginas Web. Pessoalmente, nunca fui grande fã do WebCrawler. Por uma ou outra razão, havia sempre outro "oráculo" que me parecia melhor, mais rápido ou mais atraente. Pelo visto, minha indiferença diante do WebCrawler não o prejudicou. Depois de amargar problemas como próprio sucesso, foi adquirido, em 1995, pela gigante America Online, que injetou os recursos necessários para torná-lo competitivo em meio à avalanche de "oráculos" que surgiam a cada mês. Pesquisa da PC-Meter (http://www.npd.com:80/c_pcmdef.htm), em setembro, colocou o Web Crawler como o segundo site Web de maior tráfego, com 29,2% do total, graças, claro, ao fato de ele fazer parte da America Online. Na verdade, não faz mais, tecnicamente falando. O Excite (que já foi visto aqui neste tutorial) adquiriu o WebCrawler mês passado em meio a negócios e uma aliança estratégica com a América Online, que detém cerca de 20% do controle do próprio Excite. * * * O WebCrawler vai me dar licença um instante para que eu volte a falar do "milagre brasileiro". Está em http://www.openlink.com.br/art/ e chama-se "Assistente Remoto de Tradução Openlink" - que vamos chamar aqui, carinhosamente, de ARTO. Falei nele em Ciberespaço há alguns meses, mas volto ao tema porque a demanda por este pequeno milagre é incessante. O ARTO traduz, num click de mouse, frases de inglês para português. Só funciona em Windows95 e com acesso através da rede Dial-Up. É preciso estar conectado na Internet para usá-lo, mas o texto original em inglês não precisa estar numa home-page; pode estar no seu editor de textos. Compreendendo o funcionamento dos "Oráculos Digitais" e com o ARTO numa janela flutuante, pronto para traduzir as frases em inglês que eventualmente fazem com que você emperre em algum canto, você vira o mestre da Internet. Veja como o ARTO se sai com a primeira frase do relato sobre a história do WebCrawler. * Original em inglês (http://webcrawler.com/WebCrawler/Facts/WCStory.html): "The WebCrawler's history is a story about how the rapid rise of the Internet transformed a University of Washington research project into a successful commercial product." * Tradução do ARTO (sem correção): "A história do WebCrawler é um relato sobre como o crescimento rápido do Internet transformou uma Universidade de projeto de pesquisa de Washington num sucedido bem produto comercial." Que tal? Bem razoável, não? * * * Com uma interface simples, o WebCrawler é amistoso com o usuário. Como sempre, você escolhe uma ou mais palavras-chaves, digitando-as na ranhura e clicando no botão "search". Suas opções nesta busca são também simples: pode-se optar pela procura por "titles" ou "sumaries" (prefira o segundo, mais completo, embora o primeiro seja significativamente mais rápido) e telas de resposta com 10, 25 ou 100 itens. A exemplo de outros "oráculos", o WebCrawler hoje apresenta também uma seleção de 18 categorias de Web sites com sugestões de qualidade acompanhadas de uma pequena resenha. No alto da página, o logo do WebCrawler está sempre acompanhado de cinco botões. O primeiro (search) é o da própria home-page. O botão "browse" apresenta as 18 categorias de sites selecionados. O botão "special" oferece meia dúzia de links interessantes e divertidos. O primeiro deles é um link randômico, o WebRoulette, que apresenta 10 URLs quaisquer para quem gosta de aventuras e, em vez de navegar, prefere ficar à deriva, deixando-se levar pelos ventos e a maré. Outros links permitem a criação de um botão que você pode colocar na sua própria página já com uma busca programada; o acompanhamento, através de um dispositivo em Java, das palavras-chaves que os usuários estão usando para pesquisas no WebCrawler (não se preocupe, pois é impossível saber quem pesquisou o quê); e dados estatísticos do Web pesquisado pelo WebCrawler (83% do Web ainda está sob sistemas Unix!). Além disso, uma busca reversa no Web permite saber o número de referências feitas a uma determinada página e quais são os sites mais referenciados de toda a Internet: 1. Download Netscape Software (35,979) 2. Yahoo (33,758) 3. WebCrawler Searching (25,717) 4. Welcome to Netscape (20,884) 5. WebCounter Home Page (19,857) 6. The Blue Ribbon Campaign for Online Free Speech (16,395) 7. Starting Point (11,978) 8. Microsoft Corporation (10,342) 9. Lycos, Inc. Home Page (9,875) 10. Infoseek Guide (9,053) 11. Internet Audit Bureau (8,140) 12. Welcome to Pizza Hut (8,065) 13. Alta Vista: Main Page (6,161) 14. Point: It's What You're Searching For (5,977) 15. ESPNET SportsZone (5,192) 16. CNN Interactive (5,067) 17. Apple Computer (5,038) 18. Welcome To The White House (4,950) 19. Macmillan Computer Publishing (4,894) 20. IBM Corporation (4,847) Voltando aos botões, "add URL" permite que você adicione sua URL ou outras ao WebCrawler e o último botão é o de "help", que você agora já pode destrinchar, em companhia do ARTO, mesmo que não seja "fera" no inglês. * * * Interface simples no caso do WebCrawler é opção (que eu aplaudo) e não "falta de opção". Ninguém precisa ser mestre em boleanos (se você não sabe ainda o que são boleanos não deixe de pedir por e-mail as partes deste tutorial que você perdeu). Para quem já sabe o que é, basta experimentar as combinações de palavras-chaves com os boleanos "AND" (default), "OR" ou "NOT". O "NEAR" pode ser usado para buscar duas palavras que devam aparecer distantes por não mais de 25 palavras. Exemplo da sintaxe: "tradução NEAR/25 openlink". Sem a especificação do número, o WebCrawler vai procurar palavras que aparecem lado a lado, em qualquer ordem. Se quiser procurar palavras adjacentes numa determinada ordem use "ADJ". Use parênteses para organizar buscas mais complexas de boleanos. Aspas podem ser usadas para caracterizar "frases" de busca, sequência de duas ou mais palavras que são procuradas de forma idêntica pelo WebCrawler. Os resultados da sua busca nao melhoram com o uso desta sintaxe. O que ocorre é um refinamento das respostas, reduzindo a quantidade e facilitando a identificação das melhores. São boas opções, mas ainda assim podem ser consideradas pobres diante de outros mecanismos de busca vistos ao longo deste tutorial. * * * O WebCrawler utiliza os famosos "cookies" para guardar as suas preferências de busca (http://webcrawler.com/cgi-bin/prefs.cgi). "Cookies" poderia ser assunto para uma coluna inteira, mas por ora parece ser sufuciente entender para que servem: fornecem alguma informação sobre o visitante para o servidor da página visitada. No caso do WebCrawler, os "cookies" garantirão que suas preferências de busca se mantenham. Em outros sites, é usado para guardar sua senha e password de acesso, caso do Universo Online (http://www.uol.com.br). Não é tão assustador quanto parece, mas talvez você queira ler mais em http://webcrawler.com/WebCrawler/Help/Cookies.html. Não se queixe de que está tudo em inglês; use o ARTO! * * * Esta foi a décima quinta parte da série que apresenta os mecanismos de busca e indexadores da Internet. No ranking de apostas sobre em que parte a série chega ao seu final, está na frente a "parte 17", que coincide com o último dia do ano. Os que chegaram agora ou perderam partes anteriores podem pedir os textos da série enviando mensagem para este meu outro endereço: charlab@charlab.com.br. Já escrevi sobre o Altavista, Hotbot, Lycos, Infoseek, Bookmarks, Excite, NlightN e Yahoo! Começo a receber cada vez mais e mais mensagens estimulantes sobre a iniciativa da série, de gente que, como eu, compreendeu que dominar o uso das técnicas de busca nestes "oráculos digitais" é a melhor estratégia para quem quiser sentir-se à vontade com a Internet. Sérgio Charlab charlab@ax.apc.org http://www.charlab.com.br Os Oráculos Digitais: MetaCrawler (Tutorial, parte 16) Como tudo, cada oráculo digital terá sempre seu lado positivo e negativo. Então, depois de 15 semanas acompanhando a série, você quer saber como escolher o melhor para fazer sua busca? Embora eu já tenha me programado para não encerrar a série sem antes fazer a melhor análise comparativa que minha capacidade permitir, a escolha do melhor não é tão importante assim. Você sempre pode usar mais de um orá culo. Pensando nisso é que surgiu o MetaCrawler (http://www.metacrawler.com). Com este metaoráculo, você faz sua busca simultaneamente nos seguintes oráculos: Open Text, Lycos, WebCrawler, InfoSeek, Excite, Inktomi, Yahoo e Galaxy. Note a importância da palavra simultaneamente; não se trata de uma mera relação de vários orá culos, mas de um mecanismo que opera a busca nos vários oráculos de uma só vez. Brilhante idéia, não? Tão brilhante que o MetaCrawler tornou-se em pouco tempo o melhor segredo dos grandes WebDetetives. Uma busca: resposta de oito orá culos. Não tenho certeza se o projeto de Erik Selberg, Greg Lauckhart e do professor Oren Etzioni foi o primeiro a usar o conceito de meta na área. Mas eu venho usando o MetaCrawler há muito tempo, desde que ele era relativamente lento e atendia no modesto endereço http://metacrawler.cs.washington.edu/, da universidade de seus criadores. Como a Internet é campo fértil para mentes criativas, já, já aparecem os metametaoráculos. Sim, porque se existem metaoráculos que fazem buscas em outros oráculos, haverá de surgir metametaoráculos que farão busca em metaorá culos. E assim sucessivamente, claro... * * * A interface padrão do MetaCrawler é simplíssima, mas o que não falta é tecnologia e possibilidades de refinamentos com Java, frames, cookies e sabe-se lá mais o quê. Naturalmente, a utilidade de metaoráculos como o MetaCrawler paga o peso de relativa lentidão (embora a criatividade tenha contornado isso, oferecendo as primeiras respostas sem esperar pelo final dos resultados). Teoricamente não há risco de repetição de respostas, porque o MetaCrawler elimina duplicidades. Também não se pode sair refinando muito uma busca em metaoráculo, desde o início, com o uso de operadores boleanos (ou booleanos, porque vêm da criação do matemático Boole). Mas mesmo assim o MetaCrawler oferece a chance de uso de sinais de + e - e também de configuração extra com alguns recursos interessantes (descritos adiante). Além disso, permite busca por qualquer palavra-chave, por todas as palavras-chaves ou por frase (todas as palavras na ordem exata em que são pesquisadas). Finalmente, recebe-se aquela super-resposta. Depois, muitas vezes, ainda sobra o trabalho de refinar busca a busca, oráculo por oráculo. Mas são, assim mesmo, muito convenientes. Deu para entender que o MetaCrawler, portanto, não tem nenhum banco de dados interno, não? * * * O MetaCrawler permite algumas configurações muito úteis (embora exija do seu browser a capacidade de receber cookies - se quiser saber mais sobre cookies, escreva para charlab@ax.apc.org). Quem não tem browser com cookies pode fazer um bookmark da página resultante da configuração e acessar o MetaCrawler a partir deste bookmark. Vá até http://www.metacrawler.com/configure.html e selecione as opções de acordo com sua demanda. Extra Functionality mostra na tela padrão do MetaCrawler algumas opções a mais. Você poderá escolher o número máximo de respostas por oráculo procurado, o tempo máximo de espera e (excelente esta que vem agora) limitar os resultados geograficamente. Recomendo marcar. Dynamic Status Displays permite aos browsers equipados com Java acompanhar o processo de metabusca (sensacional!). Usuários do Explorer 3.0 devem fazer o upgrade para 3.01 se quiserem se divertir com este aplicativo Java. Frame Support, quando habilitado, põe o aplicativo Java mencionado acima num frame especial, melhorando o conjunto de interface. E Link Targets, com as opções same windows, same frame e new window permite escolher se, ao clicar num link de resposta, você abrirá uma nova página na mesma janela, no mesmo frame ou em outra janela de browser. O MetaCrawler permite também que seja ordenada a lista de respostas de uma busca por localidade, região ou tipo de organização. E apresenta os resultados em um ranking cujos escores representam a média dos escores dos oráculos pesquisados. * * * Esta foi a décima sexta parte da série que apresenta os mecanismos debusca e indexadores da Internet. A expectativa dos leitores, em votação estimulada pela própria coluna, é de que chegarei até a parte 17 ou 20. Sempre lembro aos que estão lendo pela primeira vez uma parte da série que podem pedir os textos anteriores enviando mensagem para este meu outro endereço fácil de guardar: charlab@charlab.com.br. Os leitores regulares ficariam impressionados com a quantidade de gente que aparece de repente e fica com vontade de saber o que aconteceu até aqui. E quem acompanha a série mas perdeu uma ou outra parte não deve se intimidar: peça o que lhe falta. Para mim, esta correspondência é estimulante. Monitoro o ânimo de quem me lê, e esforço-me mais para justificar as palavras carinhosas das mensagens dos leitores. Maurício Pereira (mpereira@acd.ufrj.br) me fez perceber a ambigüidade do meu comentário, semana passada, de que "83% do Web ainda está sob sistemas Unix!". Diz ele: "De acordo com a exclamação ao final da observação - e da palavra ainda - pressupõe-se que este ambiente não mais deveria estar rodando sob Unix. Gostaria de saber por quê". Ora, ainda, embora possa ser interpretado do jeito que o Maurício entendeu, foi colocado ali com orgulho. Ou seja, quer com NT, Mac ou sei lá o quê, o Unix está firmíssimo. Vê agora como o texto era dúbio? Interessante é o fato de que o Maurício, admirador do Unix como eu, foi entender exatamente pelo lado oposto. Parece usuário de Mac. :-) Sérgio Charlab charlab@ax.apc.org http://www.charlab.com.br Os Oráculos Digitais: URLs (Tutorial, parte 17) A primeira semana de 1997 já deu o tom do meu Ano Novo: estou trabalhando duro, "carregando pedra", mas com um sorriso no rosto, porque o faço com prazer e ao lado de gente que eu amo e bons amigos. Não falo apenas do trabalho convencional (porque muitos diriam que estou sempre cheio de vigor para trabalhar), mas do dia-a-dia. Na véspera do Ano Novo, notei uma mancha estranha em alguns dos botões do meu CD-Player. Liguei o aparelho e apertei o eject. A bandeja se abriu e o CD do Sepultura (Roots) apareceu. Guardei-o na caixa com cuidado e coloquei um CD do Dark Angel na bandeja. Apertei o play e observei a bandeja se fechar. Depois de um movimento curto, no entanto, fez um barulho seco e e parou, 80% para fora. Apertei o eject e o play sucessivamente, mas não houve jeito de fechar-se. Empurrei então a bandeja para dentro mas ela não entrou. Alguma coisa a estava travando. Molhei a ponta do dedo na língua e esfreguei na mancha sobre os botões. Tal como suspeitei, era chocolate. - Layla! - gritei. Desde que me mudei, o CD Player fica a meio metro de altura. Uma imprudência, sem dúvida, num lar onde o videocassete, no lugar onde se inserem as fitas, guarda pequenos bonecos plásticos chamados "Gogos", com os quais meus filhos Jacques, de cinco anos, e Layla ,de dois, brincam como se fossem bolas de gude deformadas. * * * Começar o ano sem uma musiquinha boa foi ruim. Pior foi apertar, no dia 1, o botão da Canon BJ da minha mulher e notar que a luzinha verde de "on" não se acendeu. Apertei as tomadas e revisei os fios. Nada. Eu não estava gostando daquilo. Dia 2, a confortável cadeira salmão que eu comprei - de segunda mão, na Praça da República, por uma pechincha - para usar com o computador desabou comigo em cima quando tentava ajustar a melhor altura do assento. Soltei três parafusos da base, disposto a consertá-la, mas havia um quarto parafuso que se entortou na queda e travou, coisa que só descobri depois de uns 40 minutos rodando nele todas as chaves de fenda que encontrei pela casa. Mau. * * * Quando o Jacques, dia 3, me acordou dizendo que o computador dele estava "dando um probleminha" um arrepio percorreu meu corpo de alto a baixo. Fui lá espiar e a coisa parecia negra. Literalmente, porque estava no DOS e não havia jeito de entrar nas telas coloridas do Windows. Pedi ao Jacques para contar, passo-a-passo, o que havia acontecido antes do problema. Aparentemente a pergunta o deixou preocupado, porque ele se apressou a descrever em detalhes algumas das fases do game "Full Throttle" que vinha jogando. - E aí? - perguntei. - Aí eu fui um instantinho no banheiro e quando voltei a tela estava assim, preta - disse ele. Pudera. Não sei o que o "Full Throttle" tem a ver com isso, mas aparentemente Jacques andou "explorando" novos limites no seu Pentium. Com a ajuda do temível "drag and drop" do Windows95, arrastou todo o diretório Windows (e subdiretórios) da máquina para um obscuro lugar debaixo do diretório de um game chamado Heimdall. Pelo menos tinha conserto, e era relativamente simples. Mas, na hora, esqueci do comando "xcopy". Na "munheca", botei tudo no lugar. Funcionou. As coisas estavam melhorando. * * * Mas o propósito disso tudo era justamente mostrar como é bom poder trabalhar nestas coisinhas do dia-a-dia. Ser surpreendido por dias diferentes dos outros ou por (para entrar logo no nosso assunto) "orá culos" que surgem despretensiosamente ou não para alojar-se em nossas "bookmarks". Eu os coleciono. Nesta que é a décima sétima parte da série dos "Oráculos Digitais", vou levar a coisa em estilo "light", e farei o mesmo até o Carnaval (menos texto e, esperançosamente, qualidade de conteúdo sem maiores alterações). É uma boa oportunidade para você completar sua coleção de partes desta série que apresenta os mecanismos de busca e indexadores da Internet., bastando para isso enviar mensagem para este outro meu endereço: charlab@charlab.com.br. As figuras e as URLs mostram seis bons oráculos com objetivos bem diferentes. Use a intuição e as informações sobre uso dos "oráculos" vistos aqui e você terá boas chances de aproveitar as seis dicas desta semana. Escreva se tiver problemas. Ei-las: 1 - http://www.looksmart.com 2 - http://www.hardseek.com/ 3 - http://ftpsearch.ntnu.no/ftpsearch/ 4 - http://euroseek.net/ 5 - http://www.fpsol.com/gems/webgems.html 6 - http://www.servtech.com/public/mvail/home.html Mas voltando às surpresas do dia-a-dia, seja em casa, com a família, com os amigos, no trabalho, ou com os computadores e a Internet, como acontece quando localizamos uma boa URL, um site interessante, cada um de nós pode encontrar pelo menos uma área estimulante para fazer um dia diferente do outro, e de cada um deles uma razão para estar feliz. E vou seguindo neste tom, "carregando algumas pedras", mas não tenho do que me queixar (até porque depois que sacudi meu CD Player caíram uns pedaços de chocolate e ele voltou a funcionar - embora a Canon continue parada). E este ano realizo, provavelmente, um de meus compromissos pessoais assumido em 1987: ficar dez anos com o mesmo carro! Só perde para meu relógio de pulso, um Casio 200 metros que comprei em 1983. Como a bateria do relógio acabou anteontem, cheguei a imaginar o carro, um dia, superando este recorde de estabilidade do relógio. Mas já ponho isto em dúvida. Talvez eu estivesse pensando nestas coisas, ontem, quando inesperadamente um sujeito parou o carro bem na minha frente. Pisei no freio e senti meu carro parando mas..., não! Será que não vai dar?... Pára!!! Crash! Foi-se meu farol esquerdo. Sérgio Charlab charlab@ax.apc.org http://www.charlab.com.br Os Oráculos Digitais: URLs (Tutorial, parte 18) Nesta que é a décima oitava parte da série dos "Oráculos Digitais", e até o Carnaval, "Ciberespaço" (a coluna) traz menos texto e, esperanç osamente, conteúdo suficiente para você somar mais alguns endereços importantes às suas "bookmarks" de "Oráculos Digitais". Como na semana passada, apresento mais seis endereços úteis. Antes, porém, deixe-me completar o trabalho da semana passada, com a descrição (breve) das seis primeiras URLs: LookSmart (http://www.looksmart.com) - Tecnologicamente, o LookSmart, empresa do grupo Reader's Digest, é hoje o mais impressionante oráculo do Web. Quem tem browser com Java não deve perder a oportunidade de pedir o modo avançado, embora existam dois outros modos de acesso mais simples. Sem Java. O LookSmart simula um browser e reúne, em menus que se expandem, mais de 140 mil endereços listados por categoria e selecionados entre o que existe de melhor no Web. Também faz conexão direta com outros oráculos. HardSeek (http://www.hardseek.com/) - Frequentemente procuramos pelo Web os sites de empresas de hardware de cujos equipamentos somos proprietá rios. Quem, por exemplo, é capaz de imaginar que o site da Diamond (famosa marca de placas de vídeo populares no Brasil) é http://www.diamondmm.com em vez de http://www.diamond.com? O HardSeek esta aí para isso mesmo. FTPSearch (http://ftpsearch.ntnu.no/ftpsearch/) - É o que o nome diz:um oráculo que faz busca em sites FTP, onde ficam guardados arquivos na Internet. Quem frequenta sabe que é um mecanismo valioso para encontrar obscuros arquivos na rede, inclusive pirataria, mas você não pretende us á-lo para isso, pretende? Não adianta procurar por descrição; tem que tentar procurar pelo nome do arquivo. EuroSeek (http://euroseek.net/) - Não seja apressado. O EuroSeek, como se poderia esperar de um mecanismo de busca voltado para a Europa, "fala" 24 idiomas, inclusive o português (lusitano, claro). Clique no "português" e navegue à vontade. WebGems (http://www.fpsol.com/gems/webgems.html) - Concebido para uso de estudantes e pesquisadores, o WebGems tem um pouco de tudo, dicionários, publicações, mapas, bancos de dados, arquivos, etc. Digital Librarian (http://www.servtech.com/public/mvail/home.html) - Quem não teve a oportunidade de encontrar uma daquelas excelentes bibliotecárias que sabem de tudo e dão as dicas certas? Eu não quero substituir minhas amigas bibliotecárias, mas uma delas fez um bom trabalho de catalogação neste endereço. Agora, vamos aos seis endereços desta semana. As figuras e as URLs mostram mais seis bons oráculos com objetivos bem diferentes. Use a intuição e as informações sobre uso dos "oráculos" vistos aqui e você terá boas chances de aproveitar as seis dicas desta semana. Para completar sua coleção de partes desta série que apresenta os mecanismos de busca e indexadores da Internet, basta enviar mensagem para este outro meu endereço: charlab@charlab.com.br. Galaxy (http://galaxy.einet.net/) - Não há nada de muito diferente do Galaxy, mas seria injusto não relacioná-lo num trabalho que pretende ser abrangente no tema dos oráculos. Uso o Galaxy quando quero procurar coisas no Gopher ou recursos de Telnet (para isso, clique em ädvanced search"). Hotfiles (http://www.hotfiles.com/index.html) - Trata-se de um arquivo de programas populares (shareware e freeware) mantido pela ZDNet (que publica a PC Magazine). Excelente para achar coisa útil e bem catalogada. CD Search (http://blueridge.infomkt.ibm.com/knudsen/cdsearch.html) - Um enorme arquivo de CD's, com mais de 11 mil títulos e 132 mil músicas. Image Surfer (http://isurf.interpix.com/) - Este é indispensável. Imagine você precisando de repente da imagem de um macaco, ou de uma loura, ou do mapa do Brasil. Basta escrever neste oráculo o que você quer procurar. Se for um arquivo de imagem, o Image Search acha. WeatherNews (http://weather.yahoo.com/) - Está lá no Yahoo!, mas é um serviço independente e de grande utilidade. Escreva qualquer uma das principais cidades brasileiras e você fica sabendo a previsão do tempo para os próximos cinco dias. Liszt (http://www.liszt.com/) - Se você quer achar uma lista de discussão sobre um assunto que lhe interessa, rume para este endereço. Quase 70 mil listas estão no banco de dados do Liszt, atualizado semanalmente. Para cada lista, as dicas de como anunciar. Sérgio Charlab charlab@ax.apc.org http://www.charlab.com.br Os Oráculos Digitais: URLs (Tutorial, parte 19) Eis o resultado da última pesquisa da PC Meter (http://www.npd.com:80/c_pcmdef.htm, citada na parte 15 deste tutorial) da relação dos mais visitados sites no World Wide Web: 1. America Online (40.1%); 2. Yahoo! (38.5%); 3. Netscape (38.2%); 4. WebCrawler (30.8%); 5. Microsoft (20.8); 6. Infoseek; 7. Excite.com; 8. Lycos; 9. Microsoft Network (MSN); 10. Geocities; 11. Digital Equipment Corporation (Alta Vista); 12. Prodigy; 13. CompuServe; 14. Global Network Navigator Inc;15. Magellan (McKinley.com). Dentre os 15 mais visitados sites do mundo, sete são oráculos.Nada mau... Estamos na décima nona parte da série dos "Oráculos Digitais". Até o Carnaval, "Ciberespaço" (a coluna) traz menos texto, mais imagens e, esperançosamente, conteúdo suficiente para você somar mais alguns endere ços importantes às suas "bookmarks" de "Oráculos Digitais". Como na semana passada, apresento mais seis endereços úteis. Para completar sua coleção de partes desta série que apresenta os mecanismos de busca e indexadores da Internet, basta enviar mensagem para este outro meu endereço: charlab@charlab.com.br. Planet Search (http://www.planetsearch.com/) - Um oráculo recém surgido, simpático, poderoso, e com uma página excelente de referências junto ao local de busca. What-U-Seek (http://www.whatuseek.com/) - Simples de usar e fácil de configurar a busca. Ainda é fraquinho de resultados, mas parece promissor. Snoopie (http://www.snoopie.com/) - Anuncia dispor de um arquivo de 5 milhões de programas de FTP, o que já faz valer a visita. OneKey (http://www.onekey.com/) - 25 mil sites selecionados por seres humanos Dr. Webster's (http://www.drwebster.com/search/search.htm) - Dezenas de oraculos para voce escolher o mais conveniente. Search.Com (http://www.search.com/) - O "meta" oráculo da C/NET. Brinde especial: mais duas relações de oráculos. UseIt (http://www.lookup.com/Homepages/73107/search.htm#USEIT) e The "BIG" Page (http://www.beaucoup.com/engines.html). * * * Eu nunca havia notado a semelhança entre um mouse e um sabonete até que a Layla, minha filha de dois anos, colocou o segundo, branco e cheiroso, em cima do meu mousepad. Dos males o menor. Felizmente - talvez porque estivesse preso pelo fio -, não levou o mouse para ensaboar-se. Sérgio Charlab charlab@ax.apc.org http://www.charlab.com.br Os Oráculos Digitais: URLs (Tutorial, parte 20) Vigésima parte! Estamos em ritmo morno, de verâo, e até o Carnaval, "Ciberespaço" (a coluna) traz menos texto, mais imagens e, esperançosamente, conteúdo suficiente para você somar mais alguns endereços importantes às suas bookmarks de Oráculos Digitais. Eu tenho surpresas mais para adiante. Os oráculos não são apenas endereços. Cada um de nós pode ter o próprio oráculo no computador. E treiná-lo como se fosse um cachorrinho. Esta é a série dos Oráculos Digitais. Como na semana passada, apresento mais seis endereços úteis. Para completar sua coleção de partes desta série que apresenta os mecanismos de busca e indexadores da Internet, basta enviar mensagem para este outro meu endereço: charlab@charlab.com.br. Internet Sleuth (http://www.isleuth.com/) - Trata-se de um meta-oráculo (como o MetaCrawler, parte 16 deste tutorial) capaz de fazer buscas simultâneas em 10 oráculos ou numa seleção destes, clicando nos itens com a tecla control pressionada. Você pode ainda controlar o tempo máximo de cada busca. Melhor ainda é o fato de que o Internet Sleuth oferece uma respeitável coleção de outros diretórios e bancos de dados para busca. Segundo eles, no total são 1800, em áreas como notícias, negócios e finanças, esportes, Usenet e toda a relação de assuntos que aparece num frame, à esquerda. Smartest Man in the World (http://www.allrise.com/SEARCH/index.html) - Uma grande brincadeira, felizmente, divertida. A proposta é fazer qualquer busca na Internet a partir de respostas a no máximo três perguntas. A primeira delas, veja só, é "Você está procurando por fotografias de mulheres peladas ou alguma outra coisa?" Se você responder "alguma outra coisa", fica diante de nova pergunta: "Você está procurando um site para aprender sobre o mundo ou para esquecer o mundo?" E vai por aí. Ah, se você responder que procura fotos de mulheres peladas, a listagem de sites vem na hora. Nem precisa responder às outras duas perguntas. Search.onramp.net (http://search.onramp.net/) - Também um meta-oráculo que se vende como o mais fácil de usar de toda a Internet. Você pode selecionar os oráculos nos quais deseja fazer a busca simultânea. Fiz ali uma busca pela palavra tchan e encontrei a página do Dr. Patrick Tchan. Mas o mundo não é perfeito, ora. Não se deixe impressionar pela simplicidade do Search.onramp.net; é bastante poderoso. Espie só, clicando no botão de advanced query options. Você pode ponderar a importância de cada oráculo no resultado geral, que aparece em ranking. Savvy Search (http://guaraldi.cs.colostate.edu:2000/form) - Um dos mais apreciados meta-oráculos (e também um dos mais antigos entre a nova leva deles). Fica difícil arrumar argumento para voltar a um oráculo tradicional depois de experimentar meta-oráculos como este. São mais de 20 oráculos a serem pesquisados. A pesquisa é feita por grupos. Acessando direto em http://guaraldi.cs.colostate.edu:2000/form?lang=portuguese você cai na versão em português. MetaSearch (http://www.metasearch.com/) - Ao estilo meta-oráculo, este faz busca no World Wide Web, busca de software e ainda espia dicionários. As buscas são feitas em dois passos. No primeiro o Metasearch prepara a interface; no segundo você manda ver. Starting Point (http://www.stpt.com/) - Como o nome diz, é mesmo um bom ponto de partida para navegações. Reúne um oráculo e uma série de diretórios numa interface simples e adequada. A busca também é feita em dois passos. Brinde especial: mais uma relação de oráculos: The Best Search Engines (http://www.lookup.com/Homepages/73107/search.htm), com 72 oráculos relacionados. Sérgio Charlab charlab@ax.apc.org http://www.charlab.com.br Os Oráculos Digitais: WebFerret (Tutorial, parte 21) O Carnaval está demorando. Portanto, vamos trabalhar. E atenção que hoje vai ser mais difícil. Você vai ter que fazer o download de um software se quiser experimentar o WebFerret. E eu recomendo. Não se pode conhecer os oráculos sem usufruir das possibilidades de acessá-los a partir de um software que exista dentro do seu computador. O WebFerret é um conceito diferente de metaoráculo. Não estou certo de que existam claras vantagens no uso de um software de metabusca como o WebFerret (há muitos outros nesta área) sobre um metaoráculo de qualidade como, por exemplo, o MetaCrawler. Mas meu papel é passar adiante o que experimento com sucesso. * * * Para quem está chegando agora, esta é a série dos "Oráculos Digitais". Uma seriezinha comprida, que neste ponto está cinco vezes maior que uma outra experiência seriada que fiz tendo o Netscape como tema. Estamos na vigésima primeira parte, o que significa cerca de cinco meses em cima do assunto "Oráculos Digitais". Sigo adiante até quando houver algo para escrever em benefício de quem leia. Minha obsessão com os oráculos se deve ao fato de que não há qualquer outro assunto referente à Internet que não encontre como ponto de partida para pesquisa estes mecanismos de busca. Para completar sua coleção de partes desta série que apresenta os mecanismos de busca e indexadores da Internet, basta enviar mensagem para este outro meu endereço: charlab@charlab.com.br. Certifique-se de que preencheu corretamente seu endereço de resposta. Não há como enviar resposta se você não configurar adequadamente seu programa de e-mail. Recebo mensagens de gente com e-mails como seunome@provedor.com.br. Pior foi alguém cujo endereço de resposta aparecia como sendo "Rua Pinheiro Machado, número tal e tal". * * * Pegue o WebFerret em http://www.webferret.com/webferret.htm ou http://www.stroud.com/95agents.html#wferret ou ainda http://www.windows95.com/apps/webmisc.html. Quando eu falo pegar, refiro-me a clicar sobre a referência em hypertexto com o nome do programa. Geralmente aparece sublinhada em azul. Mas atenção, atenção: lamento, mas o WebFerret é só para Windows95. Infelizmente, novos softwares já não surgem mais com freqüência para Windows 3.1. Fico triste por nem sempre poder fazer de Ciberespaço uma coluna pluralista. A versão que tenho do WebFerret é a 0.88 beta 56 (0.0056). É gratuita e seu tamanho é de 544k, o que significa menos de 10 minutos de tempo para download na maioria dos casos. Após o download completo, localize o arquivo no seu HD e dê um duplo clique nele. É auto-executável e vai instalar-se automaticamente no seu computador. Siga os passos de instalação, preenchendo com seu nome (nome da empresa), e-mail e país. Sugiro que mantenha acionada a "cruzinha" em Add WebFerret to the desktop para ganhar um ícone do software em local acessível. (Mesmo assim, ele vai se instalar também debaixo do botão de start (iniciar), find, World Wide Web pages). Quem não está em rede pode pular os campos para proxy. Pronto! * * * Rode o WebFerret. A interface é simples. Escreva uma ou mais palavras-chaves, opte por Match all keywords ou Match any keyword. Aperte [enter] e a busca vai começar. Você verá os resultados aparecendo, pouco a pouco, na janela de baixo, à medida que o WebFerret vasculha uma série de oráculos (Altavista, Yahoo!, Excite, Lycos, Magellan, Hotbot, InfoSeek, InfoSeek Ultra e WebCrawler) e outros recursos, como o Veronica (do Gopher). É possível configurar a quantidade máxima de respostas. Para escolher quais oráculos você deseja ver pesquisados pelo WebFerret, vá ao menu View, Options, Search Engines. Marque com um "x" os que deseja. Novas versões do programa trazem sempre as novidades em matéria de oráculos. E para usar os resultados não é preciso esperar pelo fim da busca. Basta clicar sobre o item desejado e automaticamente o WebFerret aciona seu browser que, então, carrega a página. Use também o botão direito do mouse para mais possibilidades. * * * Quem gostar do WebFerret pode fazer uma visitinha à home page do fabricante onde estão também disponíveis o EmailFerret, NewsFerret e FileFerret (http://www.vironix.com/netferret/). Sérgio Charlab charlab@ax.apc.org http://www.charlab.com.br Os Oráculos Digitais: More Like This (Tutorial, parte 22) Vou ao LookSmart (http://www.looksmart.com) avaliar outros softwares de mecanismos de busca, tal como o WebFerret, visto aqui na semana passada. Ali existem 14 deles listados: More Like This, Anysearch for Navigator, Vironix NetFerret (o WebFerret), Explorer Add-Ons, Internet Agents, NetSearch, TechSmith’s NewsMonger, Anarchie, WebCompass, CyberAge Raider, Infoseek Quickseek, LIKSE, Speed Surfer, Teleport Pro. (Depois que conhecer o More Like This, você pode querer ver mais alguns softwares do gênero). A maioria destes 14 já conhecia (gosto muito de experimentar novos softwares - e isso já está me dando uma idéia interessante-), mas acesso esta página para mostrar ao leitor que pratico o que prego: ao buscar respostas, recorro aos oráculos. O LookSmart é um oráculo de categorias. Quero encontrar, portanto, softwares locais de busca no World Wide Web. Começo clicando em Computers & the Internet, depois Software Downloads, em seguida, Internet, Surfing Tools & Software, Browsers & Plug-Ins e, finalmente, Search Tools, onde acho o que procurava. Experimente! Exige um mínimo de inglês para você identificar o assunto de cada categoria. O LookSmart parece-me cada vez mais interessante, mas tenho uma relação especial com ele, e posso estar sendo influenciado por isso. * * * O primeiro Search Tool relacionado lá é o More Like This (www.morelikethis.com/download.html). Gostei deste software já na primeira vez que o vi, em setembro passado. E destaco-o nesta que é a vigésima segunda parte da série dos "Oráculos Digitais", especialmente porque serve para usuários de Windows 95 e Windows 3.1. Esta seriezinha comprida já tem data para terminar: vamos até a parte 25. É o que parece ser suficiente para que eu acrescente o que ainda existe de importante sobre o tema e me aventure a encerrá-la com uma análise comparativa, resumo de comandos ou bateria de exemplos - e até os três, se concluir que posso produzir um bom e útil texto com estes enfoques. Tenho sido recompensado com mensagens muito carinhosas de gente que me conta estar sendo a série útil. É meu único objetivo. Dão exemplos do que acharam com os oráculos, pedem algumas colunas que perderam porque viajaram ou porque o gato fez xixi em cima. Para completar sua coleção de partes desta série que apresenta os mecanismos de busca e indexadores da Internet, basta enviar mensagem para este meu outro endereço: charlab@charlab.com.br. Mas já que, mais uma vez, vamos falar de um software cujo uso exige de você a paciência de um longo download (são cerca de 2,5 Mb), que tal antes dar uma passadinha em http://www.owt.com/headlightsw/ e pegar o software que todo mundo aguardava: GetRight (pouco mais de 1,5Mb, só para Windows 95 e NT)? Com este programinha, você pode esquecer os apuros dos longos downloads interrompidos e que o obrigavam a recomeçar desde o princípio. O GetRight "emenda" qualquer download interrompido, seja porque você esbarrou na tecla enter e o cancelou , seja porque sua ligação caiu ou a luz acabou. Antes dele minha opção era fazer download com o CuteFTP, que oferece há tempos o mesmo recurso, mas não funciona dentro do World Wide Web. Note que -- embora seja semelhante na prática - existe uma diferença entre fazer um download via FTP ou via Web (a não ser quando o endereço começa com ftp://). * * * Instale o More Like This. Esta cópia dá direito a 30 dias de uso gratuito. Antes, porém, você deve deixar que o programa acesse a home-page de registro provisório. Ele fará isso automaticamente. Coloque seu nome e e-mail e copie o número do registro na janela apropriada do More Like This. Pronto! Depois, dos 30 dias, para prosseguir, você deve registrar o software (US$ 35). Não tenho nenhuma relação com a empresa que o criou e vende. O meu não é registrado, ainda que tenha utilizado, em ocasiões diferentes, o More Like This por mais de três meses. O More Like This mantém uma pequena janela em formato de retângulo sobre seu desktop. Clique no botão "show options", à direita, e verá como configurar o software para acesso a Web ou Usenet, assim como o tipo e o destino da busca (em qual oráculo). Escreva uma ou mais palavras para busca e o More Like This entra em ação. Trata-se de um programa sem mistérios. Seu browser (que deve estar acionado antes de você usar o More Like This) carrega os resultados da busca desenhando as próprias páginas dos oráculos. Mas se é assim, qual seria, então, a vantagem do More Like This? A interface! É mais simples selecionar o oráculo em que se deseja basear a busca do que acionar a home-page a partir de um arquivo de bookmarks. Com o More Like This, você carrega só a página de respostas. Sem ele, você carrega a página principal de um oráculo e, aí sim, recebe a página de respostas. * * * Outra vantagem, e óbvia, está no nome: More Like This (Mais como esse). Após uma busca, supõe-se que você acabará navegando por algumas das páginas apontadas como resultados. Estando numa delas, clique no botão More Like Title e o software é capaz de procurar mais coisas com base no título da página carregada. É como se ele tentasse refinar sua busca. Faz isso também a partir de palavras que você guarde no clipboard. Eis um exemplo: assim que escrevi a palavra "clipboard", dei um "Control + C" selecionando a palavra e copiando-a no clipboard. Estou conectado, com o browser ligado e a janelinha do More Like This no alto da tela. Cliquei em "More Like Clipboard" e o software, que estava programado para fazer busca no Dejanews com target Usenet, apresentou os resultados da procura da palavra "clipboard" naquele oráculo Usenet. Mão na roda! Explore as demais opções, testando o tipo de search (standard, concept, wide angle e custom). Experimente as opções e os controles deslizantes que aparecem quando você seleciona "custom". Sérgio Charlab charlab@ax.apc.org http://www.charlab.com.br Os Oráculos Digitais: Booleanos (Tutorial, parte 23) Coisas estranhas acontecem por aqui e nem sei a quem culpar. Primeiro foi a letra "c" do meu teclado que começou a falhar. (Ainda está falhando, mas eu reviso o texto, para evitar que frases horríveis como "ao busar respostas, reorro aos oráulos" sejam publicadas nesta coluna.) Um dia depois, quando eu praticava com meu Thrustmaster Formula T2 (conjunto de volante e pedais que me permite dirigir simulações de corrida no computador) o amplificador pifou. Devo explicar que quando piloto carros de corrida no computador costumo ligar a Sound Blaster no meu stereo, com caixas de 70 centímetros de altura. É uma emoção e tanto, aquele sonzão do ronco da "máquina". Mas, como dizia, o amplificador pifou. Todo mundo sabe que eu não tenho medo de encarar equipamentos eletrônicos. Desaparafusei a carcaça com cuidado e vi que o problema era um fusível de 3 amperes queimado. Custa 20 centavos, mas era domingo. Eu teria pago umas dez pratas se alguém batesse na porta vendendo um. * * * Devo estar envelhecendo, porque, para mim, o que há é uma conspiração. O Communicator, a versão 4.0 do Netscape, às vezes carrega uma página mas não faz funcionar nem um link, de modo que não posso clicar em nada. Tenho que sair do programa e voltar a carregá-lo. Isso, e o novo e lento sistema de bookmarks do 4.0 está me deixando impaciente. Tanto que cheguei a examinar seriamente a opção de um tcheco louco que, na contramão, acaba de desenvolver um browser para DOS (versão de HTML 3.2). Esta máquina aqui roda Windows95. Mas como, não raro quando dou um boot, recebo um erro que me faz dar novo boot, caio em um loop até que, como única saída, só me resta entrar na porção DOS do Windows95 -- a "tela preta", como diz o Jacques, meu filho. Caso você se interesse, visite http://www.naf.cz/arachne/english.htm (767 Kb). Roda até em XT com 640 de memória e EGA de vídeo, se você dispensar as imagens do Web. (Visite http://www.fdisk.com:80/doslynx/ se o assunto browser para DOS seja do seu interesse.) Se eu não dissesse a URL deste browser, ou a outra, que relaciona experiências de criação de browsers para DOS, como você faria para localizá-las? Oráculos, claro. Qual deles seria mais apropriado? Para mim, qualquer um, desde que você identifique corretamente o que deseja procurar e, assim, utilize a melhor combinação de palavras-chaves de busca. Neste caso, penso que a melhor saída seja "browser" e "DOS", em combinação. Vou ao Excite (http://www.excite.com/) e experimento: caio de primeira na The FDISK.COM DOS Internet Pages, que é a página que recomendei acima. Ainda no Excite, desta vez buscando na Usenet, o primeiro item é sobre o "Archane www DOS browser!", cujo texto traz a indicação da URL do browser da república Tcheca. * * * Você é capaz de encontrar o que deseja no Web? Que tal alguns exemplos? Digamos que você ainda tenha dúvidas sobre o uso de operadores booleanos, que vêm sendo mencionados nesta série desde que falei do Altavista. Volto ao Excite (mas poderia ser no Altavista ou em qualquer outro dos oráculos) e procuro por "operadores booleanos". A primeira resposta já satisfaz. Vem do México, onde o idioma, nestas duas palavras, não difere do nosso. Cinco respostas abaixo encontro uma página do brasileiro Ibama (http://www.ibama.gov.br:80/help.htm ) que trata do assunto com pertinência (prepare-se para uma aula de álgebra!): "Os operadores (...) são conhecidos como lógicos [e] também como "operadores booleanos", do nome George Boole, matemático inglês do século XIX. Os fundamentos da lógica booleana aplicados à recuperação da informação são válidos independentemente do sistema ou idioma de trabalho. (...) Como em álgebra normal, você pode usar parênteses para alterar a ordem da execução." É o saber à disposição dos usuários Internet! Os operadores boleanos são: AND, OR, e NOT. O AND serve para juntar palavras que devem aparecer no resultado; o OR trabalha como opção, onde pelo menos uma das palavras apareça; e o NOT aponta palavras que não devem ser consideradas. O uso dos booleanos é recomendado quando você tem como possíveis palavras-chaves duas palavras de uso comum quando vistas separadas, como "fruta" e "laranja". Uma pesquisa sobre "laranja", cujo objetivo fosse a fruta, poderia resultar em citações da cor laranja. O melhor, portanto, é pesquisar por [fruta AND laranja]. Experimente, se quiser a receita de laranjas em calda. Da mesma forma, acrescente "lima" para busca por laranja-lima: [fruta AND laranja AND lima]. O resultado é a dieta da baiana Ingra Liberato, com direito a laranja-lima! Suco de laranja-lima é recomendado para o período de lactação também. Ah, este saber da Internet supera a famosa "rádio-relógio". Se a sua pesquisa tiver uma opção, acrescente o operador OR. Veja o exemplo: [fruta AND laranja OR abacaxi]. A sabedoria surge logo nas respostas. Tudo que é fruta, seja laranja ou abacaxi, está lá. Inclusive o "magnífico" Easy Slicer. "A partir de agora descascar um abacaxi não é mais sinônimo de problema (sic). Com Easy Slicer você leva poucos segundos para descascar a fruta." Custa R$ 39 na shoptime (http://www.shoptime.com.br:80/lojas/gourmet/1450.htm). E use o operador NOT para exclusão, como neste exemplo, que usa o parênteses: [fruta AND (laranja NOT lima) OR abacaxi]. Resumindo: o operador AND confina melhor uma busca e, deste modo, melhora a qualidade das respostas, que deverão ser mais próximas daquilo que você procura (fruta e laranja). Já o operador OR amplia seu espectro de resultados, porque indica aceitação de duas condições na resposta (laranja ou abacaxi). O operador NOT exclui coisas na sua busca, limitando-a. É utilíssimo, mas deve ser usado com moderação para que você não perca resultados úteis (laranja, mas não laranja-lima). * * * Diante de uma busca, primeiro você define o que deseja encontrar. Escolhe um oráculo (ou um metaoráculo) e um local para a busca (Web? Usenet? Se você acha que alguém pode ter feito uma home-page sobre o tema que procura, ou citado o assunto em revista, jornal, etc, vá para o Web; se acha que o assunto está no nível das conversas, escolha Usenet.) De acordo com o assunto, resolva se vai pesquisar em português ou se vai traduzir suas palavras-chaves mais óbvias para o inglês. Aí vem a hora de executar a busca. Se for simples, escreva uma ou duas palavras, ou uma frase. Pronto! Se for mais complexa, refine-a com operadores. Ao receber os resultados, se forem ainda muito numerosos, pense nas possibilidades para refinar mais sua busca, usando o operador NOT. * * * Para completar sua coleção de partes desta série que apresenta os mecanismos de busca e indexadores da Internet, basta enviar mensagem para este meu outro endereço: charlab@charlab.com.br. Anote mais quatro oráculos que valem a visita: EcoSearch (http://www.iconovex.com/ECHO/ECHOS.HTM); Cyber 411 (http://www.cyber411.com/); Forum One (http://www.forumone.com/); e Inference Find (http://m5.inference.com/ifind/) * * * Acabei de trocar o fusível do meu amplificador. É fácil. Mas o novo, que coloquei lá, durou um milionésimo de segundo e se foi com a luz de um pequeno raio assim que apertei o botão "power". Sérgio Charlab charlab@ax.apc.org http://www.charlab.com.br Os Oráculos Digitais: Qual o melhor? (Tutorial, parte 24) Eu não vou responder à pergunta do título, mas pretendo alimentar suas idéias para que, a cada vez que realize uma busca, conheça bem suas opções e avalie quais delas vai utilizar. Há três maneiras de anal;isar oráculos comparativamente: segundo seus recursos de arquivo e atualização, sua linguagem de busca e sua área de operação. Danny Sullivan, da Calafia Consulting mantém em http://calafia.com/webmasters/chart.htm uma atualizada comparação entre os "search engines" no aspecto arquivo e atualização. Quem gosta dos grandes números para tomar decisões deve se dirigir ao banco de dados de 66 milhões de URLs do Lycos (http://www.lycos.com). Hotbot (http://www.hotbot.com), InfoSeek (http://www.infoseek.com) e Excite (http://www.excite.com) seguem algo distantes dos calcanhares do Lycos, com cerca de 50 milhões de URLs. Mas, veja só, de todos estes oráculos citados, só o Lycos não mantém arquivo de texto completo das páginas que registra em seu banco de dados! A vantagem de oráculos com texto completo é óbvia: sua palavra-chave de busca poderá ser encontrada em qualquer palavra de qualquer página do banco de dados. No sistema do Lycos, apenas um resumo do texto da página é arquivado. O Lycos - e também o Excite e o Open Text (http://www.opentext.com) - não reconhece "meta-tags", um recurso da linguagem HTML que ajuda os oráculos a classificarem as páginas segundo as palavras-chaves e título de interesse do autor da página. Mas, em compensação, o Lycos, que ficou na berlinda, cataloga três níveis de cada home-page. Melhor que isso só o AltaVista (http://www.altavista.com), Excite e o Hotbot. A vantagem? Não só sua home-page estará disponível, como também todas as demais páginas que estiverem no servidor até o número de níveis (três, para o Lycos, e ilimitado para o HotBot). Naturalmente, o HotBot está liderando nesta área. * * * Somente o Lycos e o AltaVista são capazes de oferecer um importante recurso: a informação de quando a página foi checada pela última vez.. Fui ao Altavista e procurei por "charlab" e "97" (você já sabe que para procurar por duas palavras no AltaVista devemos colocar o sinal de + antecedendo-as). Assim descobri que, há poucos dias, mais exatamente dia 11 de fevereiro, ganhei menção na página do Mauricio Rocha, sobre "Oncologia e Aquariofilia" (http://www.geocities.com/CapeCanaveral/8557/). Uma informação similar, algo menos relevante, é a data de quando a página foi arquivada no banco de dados, o que pelo menos oferece pistas de quão atual é o oráculo. Este segundo recurso é oferecido pelo AltaVista, HotBot e InfoSeek. E qual seria o oráculo atualizado diariamente? O OpenText! Altavista e InfoSeek anunciam atualizações em um a dois dias; HotBot e Excite, semanais; Lycos, entre duas e quatro semanas. * * * A IslandWeb Ventures (http://www.lips.net/~islandav/search.htm) reuniu mais informações sobre os oráculos para um quadro comparativo sobre suas respectivas áreas de operação. Em resumo: * A busca exige palavra-chave ou grandes temas? No segundo caso, busque o Yahoo! (http://www.yahoo.com), Lycos, Excite, InfoSeek e Galaxy (http://galaxy.einet.net/). * Quais oráculos são do tipo "meta", submetendo sua busca a vários mecanismos simultaneamente? MetaCrawler (http://www.metacrawler.com/) e Savvy Search (http://guaraldi.cs.colostate.edu:2000/). * Liste os que são capazes de procurar arquivos em FTP: Lycos e Galaxy. * E os que vasculham mensagens da Usenet? Yahoo!, HotBot, AltaVista, Dejanews (http://www.dejanews.com), Excite e InfoSeek. * Para procurar por pessoas e seus respectivos endereços de correio eletrônico: Yahoo!, Excite e InfoSeek. * * * E Terry A. Gray, em "How to Search the Web - A Guide To Search Tools", apresenta outra interessante comparação, desta vez destacando aspectos específicos da linguagem de busca de cada oráculo. Veja: * Quais oráculos distinguem maiúsculas e minúsculas? AltaVista e InfoSeek. * Quais aceitam booleanos? AltaVista, Excite, WebCrawler, OpenText e NlightN * Quais fazem busca pela proximidade entre as palavras-chaves? AltaVista, WebCrawler, OpenText e InfoSeek. * Quais aceitam frases para a busca? AltaVista, WebCrawler, OpenText, InfoSeek, e NlightN. * * * Vale a pena saber o que a crítica especializada pensa sobre os oráculos. A C/NET (http://www.cnet.com/Content/Reviews/Compare/Search/ss2.html) recomenda o meu favorito - Metacrawler (http://metacrawler.cs.washington.edu:8080/index.html) - para quem sabe o que procura. Em busca de orientação, o caminho deve ser o, Yahoo!, claro. E ainda saiu uma menção honrosa para o AltaVista. Eu não faria uma crítica muito diferente disto. Gosto imensamente destes três oráculos, e ainda dou crédito ao Excite por sua página de notícias personalizadas; ao Lycos por sua variedade de assuntos pesquisáveis concentrados num único oráculo; ao NlightN por sua exclusiva utilização de bancos de dados (pagos) científicos que não fazem parte do Word Wide Web. Também destaco as ferramentas independentes, como o More like this. * * * Vou concluir este tutorial com um resumo de uso e indicações de exemplos de busca. Se desejar fazer parte, basta que me envie um tema ou palavras-chaves para busca, assim como a aprovação para que eu a cite no texto, bem como identifique você com nome completo e e-mail. Esta coluna de hoje é especialmente dedicada ao meu amigo André, cujo ramal de telefone é o 24. Também a dedico ao Liberatti, competentíssimo ilustrador aqui do JB, não por afinidade numerológica, mas porque me honrou com seu traço na edição da semana passada, que eu pretendia ilustrar com a teoria dos conjuntos, de álgebra. Facilitaria a compreensão dos booleanos (tema da parte 23). Quem tiver interesse (claro!) e for capaz de receber imagem formato jpeg, em "attached" numa mensagem de e-mail pode pedir enviando mensagem para charlab@ax.apc.org. Para receber as outras partes deste tutorial (que, aliás, acaba na parte 25!), escreva para charlab@charlab.com.br Sérgio Charlab charlab@ax.apc.org http://www.charlab.com.br Os Oráculos Digitais: Conclusão (Tutorial, parte 25) Meu filho Jacques é quem está mais triste com o fim deste tutorial na parte 25. Seu álbum de figurinhas de basquetebol da NBA está incompleto. Ele quer que eu escreva tutoriais com os números das figurinhas que lhe faltam: 34, 63, 83, 98, 115, 139, 148, 159, 192, 198, 203, 205, 210, 211, 227, 240, 245, 260, 262, 263, 275, 277, 280 e 282. -- Jacques -- eu disse --, não posso escrever um tutorial de 282 partes. -- Por que não? -- Ninguém aguentaria ler sobre o mesmo assunto durante 282 semanas, mais de cinco anos! -- É cinco vezes aquele dia que soltam fogos? -- Exatamente! Você ia dormir e acordar umas 2 mil vezes, mais ou menos o mesmo tempo que você viveu até hoje. * * * Eu me diverti com o estudo dos oráculos. Foi o mais próximo que cheguei até hoje do esoterismo. Confio aos oráculos minha vida e meus segredos. Escrevo nas ranhuras as palavras que me ajudam a encontrar o que procuro. E, assim, pouco a pouco, vou revelando muito de mim. E se algum oráculo guardar um arquivo completo de "log" das consultas que lhe fazem? Que será da nossa privacidade? Os oráculos saberão tudo sobre o mundo e saberão tudo sobre cada um de nós. Não confunda meu discurso sobre privacidade eletrônica com o livro "A profecia celestina". * * * Eis aqui todas as URLs citadas nesta série: http://www.altavista.digital.com http://www.hotbot.com http://www.lycos.com http://www.rio.com/ http://www.tcs-info.com/index.htm http://www.informatik.hu-berlin.de/~mhunger/ http://www.jb.com.br/ http://www.submit-it.com http://www.inktomi.com http://www.truenet.com.br/studioweb/charlab/index.html http://www.macromedia.com http://www.edirectory.com http://www.lycos.com/sitemap.html http://www.infoseek.com http://guide.infoseek.com http://www.whowhere.com http://www.quote.com http://www.banx.com http://www.companylink.com http://guide.infoseek.com/Reference http://ultra.infoseek.com/ http://www.br-online.de/ http://bookmarks.ibase.org.br http://www.argos.com.br http://www.ci.rnp.br/si/ http://www.cade.com.br http://www.argos.com.br http://www.brasil.emb.nw.dc.us/bzhisto1.htm http://www.looksmart.com http://www.thedj.com/ http://www.realaudio.com http://www.excite.com/ http://www.excite.com/navigate/home.html http://www.sebes.com.br/empresas/supercou/dica.htm http://www.nlightn.com http://www.nlightn.com/nlndemo/docs/dblist.htm http://nln.com/ http://accufind.com http://hotstuff.plugue.com.br/blocos/horoscop2.html http://www.dejanews.com http://grunt.dejanews.com/post.xp http://www.dejanews.com/forms/rn.html http://www.reference.com/ http://www.chevere.com http://www.exploramexico.com/ http://www.geocities.com/CapeCanaveral/3355/index.html http://www.hisurf.com/yopet/ http://www.adultlinks.com/ http://www.cade.com.br http://www.fantastico.com/ http://www.jubii.dk/Linx http://www.naughty.com/ http://www.ole.es/ http://www.ozu.com/ http://www.seznam.cz/ http://www.ifi.uio.no/~hermunda/Snooker/Snoohoo/ http://www.mnonline.org/uffda/ http://www.walla.co.il/ http://www.whoshoo.co.za/cgi-bin/index.pl http://woohoo.pair.com/ http://www.yahala.com/ http://yahho.ita.tutkie.tut.ac.jp/yahho/ http://www.ci.rnp.br/si/index.html http://Yeehaw.Nashville.Net/ http://www.yehaa.com/ http://www.msjnet.edu/yeowsa/ http://www.dn.net/yippee/ http://www.amorn.baremetal.com/yoohoo/ http://www.sappho.com/yoohoo/ http://www.yoyee.com/ http://www.yahoo.com http://www.northernlife.com/valentin/ http://www.yahoo.com/Computers_and_Internet/Internet/World_Wide_Web/Sea rching_the_Web/ http://www.contrib.andrew.cmu.edu/~sc5x/yankovic.html http://www.pcmag.com/iu/srchsite/_open.htm http://my.yahoo.com/ticker.html http://www.yahooligans.com/ http://www.yahoo.fr/ http://www.yahoo.de/ http://www.yahoo.co.jp/ http://my.yahoo.com/ http://www.telelistas.com.br/welcome.htm http://www.vicinity.com/yt.hm?&FAM=lycos&CMD=FILL&SEC=ytstart http://www.yahoo.com/headlines/ http://quote.yahoo.com/ http://sports.yahoo.com/ http://search.main.yahoo.com/ http://events.yahoo.com/ http://www.yahoo.com/docs/family/more.html http://www.cis.ohio-state.edu/hypertext/faq/usenet/ http://www.webcrawler.com http://www.npd.com:80/c_pcmdef.htm http://www.openlink.com.br/art/ http://webcrawler.com/WebCrawler/Facts/WCStory.html http://webcrawler.com/cgi-bin/prefs.cgi http://www.uol.com.br http://webcrawler.com/WebCrawler/Help/Cookies.html http://www.metacrawler.com http://metacrawler.cs.washington.edu/ http://www.metacrawler.com/configure.html http://www.hardseek.com/ http://www.diamondmm.com http://ftpsearch.ntnu.no/ftpsearch/ http://euroseek.net/ http://www.fpsol.com/gems/webgems.html http://www.servtech.com/public/mvail/home.html http://galaxy.einet.net/ http://www.hotfiles.com/index.html http://blueridge.infomkt.ibm.com/knudsen/cdsearch.html http://isurf.interpix.com/ http://weather.yahoo.com/ http://www.liszt.com/ http://www.npd.com:80/c_pcmdef.htm http://www.planetsearch.com/ http://www.whatuseek.com/ http://www.snoopie.com/ http://www.onekey.com/ http://www.drwebster.com/search/search.htm http://www.search.com/ http://www.lookup.com/Homepages/73107/search.htm#USEIT http://www.beaucoup.com/engines.html http://www.isleuth.com/ http://www.allrise.com/SEARCH/index.html http://search.onramp.net/ http://guaraldi.cs.colostate.edu:2000/form http://guaraldi.cs.colostate.edu:2000/form?lang=portuguese http://www.stpt.com/ http://www.lookup.com/Homepages/73107/search.htm http://www.webferret.com/webferret.htm http://www.stroud.com/95agents.html#wferret http://www.windows95.com/apps/webmisc.html http://www.vironix.com/netferret/ http://www.morelikethis.com/download.html http://www.owt.com/headlightsw/ http://www.naf.cz/arachne/english.htm http://www.fdisk.com:80/doslynx/ http://www.ibama.gov.br:80/help.htm http://www.shoptime.com.br:80/lojas/gourmet/1450.htm http://www.iconovex.com/ECHO/ECHOS.HTM http://www.cyber411.com/ http://www.forumone.com/ http://m5.inference.com/ifind/ http://calafia.com/webmasters/chart.htm http://www.opentext.com http://www.geocities.com/CapeCanaveral/8557/ http://www.lips.net/~islandav/search.htm http://www.cnet.com/Content/Reviews/Compare/Search/ss2.html http://metacrawler.cs.washington.edu:8080/index.html * * * Escrevi sobre o Altavista, Hotbot, Lycos, Infoseek, Bookmarks, Excite, NlightN, Deja News, Yahoo!,WebCrawler, MetaCrawler, vários outros endereços e ainda programas como o WebFerret e More Like This. * * * Para receber as outras partes deste tutorial escreva para charlab@charlab.com.br. Muito obrigado pela paciência e interesse. Isso e as mensagens (foram milhares nestes seis meses) que chegam todos os dias são a minha maior recompensa. * ** Esta série é dedicada à Raquel, minha esposa, que vive me lembrando como é que se desliga o computador e se sobe pelas paredes. Sérgio Charlab charlab@ax.apc.org http://www.charlab.com.br ---------------------------------------------------------------------- SÉRGIO CHARLAB (charlab@ax.apc.org) (http://www.charlab.com.br) é Editor-Chefe de Seleções do Reader's Digest (http://www.selecoes.com.br), colunista de "Ciberespaço" do Jornal do Brasil e autor dos livros "Você e a Internet no Brasil" (http://www.charlab.com.br/ch2505.html) e "O Seu Futuro Eletrônico". ---------------------------------------------------------------------- Inscreva-se na lista Leitor Ajuda Leitor! ========================================= Participam desta lista todos aqueles que estão dispostos a trocar informacoes e repartir conhecimentos sobre uso da Internet e dos computadores. Nesta lista nao existem segredos. O que voce aprender, voce deve ensinar. O que voce deseja aprender, voce deve perguntar. A lista e moderada por Sergio Charlab (charlab@charlab.com.br), que deve zelar para que as mensagens que circulam na lista sejam sempre perguntas e respostas apropriadas ao tema da lista. O que voce pode perguntar na lista? ================================== Qualquer coisa que voce nao saiba ligada a computadores e a Internet. Nao tenha receio de fazer perguntas basicas. Suas duvidas podem ser as mesmas de outros assinantes da lista. Quando voce perguntar, as respostas servirao de ajuda a todos. O que voce pode responder na lista? =================================== Qualquer pergunta formulada cuja resposta voce saiba. Procure responder aquilo que realmente conhece, evitando informacoes que nao estejam checadas. Nao tente competir com ninguem pelas melhores respostas. A contribuicao de cada um, muitas vezes, se somara para formular a melhor resposta. Como enviar mensagens para a lista? =================================== Envie mensagem para: leitorajudaleitor@listas.horizontes.com.br e coloque no assunto, da questao ou resposta, no campo: "Subject" Comandos que voce deve ter a mao: ================================= Devem ser enviados para: listserv@listas.horizontes.com.br em mensagem *SEM SUBJECT* e com os comandos na primeira linha: * Para assinar a lista (ensine seus amigos): SUBscribe leitorajudaleitor * Para sair da lista: SIGnoff leitorajudaleitor * Para pegar arquivos complementares da lista GET leitorajudaleitor Duvidas? Escreva para Sergio Charlab -- charlab@charlab.com.br