Usando o WebHarvy, você pode facilmente extrair texto, HTML, imagens, URLs e e-mails de qualquer site e salvar os dados extraídos em vários formatos.
O WebHarvy pode coletar dados de qualquer site, lidar com login, envio de formulário, navegação, paginação, categorias e palavras-chave. Suporta proxies e raspagem programada.
Recursos:
* Fácil Web Scraping: Web Scraping é fácil com a interface de apontar e clicar do WebHarvy. Não há necessidade de escrever código ou scripts para coletar dados. Você usará o navegador embutido do WebHarvy para carregar e navegar em sites e poderá selecionar os dados a serem copiados com cliques do mouse.
* Detecção de padrão inteligente: WebHarvy identifica automaticamente padrões de dados que ocorrem em páginas da web. Para extrair uma lista ou tabela de itens (nome, endereço, e-mail, preço, etc.) de uma página da Web, nenhuma configuração extra é necessária. Se os dados forem repetidos, o WebHarvy irá raspá-los automaticamente.
* Salvar em arquivo ou banco de dados: os dados copiados podem ser salvos em vários formatos. A versão atual do WebHarvy Web Scraping Software permite que você salve os dados raspados como um arquivo Excel, XML, CSV, JSON ou TSV. Você também pode exportar os dados para um banco de dados SQL.
* Lidar com a paginação: muitas vezes, os sites exibem dados como listagens de produtos ou resultados de pesquisa em várias páginas. O WebHarvy pode rastrear e extrair dados automaticamente de várias páginas. Basta apontar o 'link para a próxima página' e o WebHarvy coletará automaticamente os dados de todas as páginas.
* Enviar palavras-chave: raspe dados enviando automaticamente uma lista de palavras-chave de entrada para formulários de pesquisa. Qualquer número de palavras-chave de entrada pode ser submetido a vários campos de texto de entrada para realizar a pesquisa. Os dados dos resultados da pesquisa para todas as combinações de palavras-chave de entrada podem ser copiados.
* Proteger a privacidade: para coletar dados anonimamente e impedir que o software de captura da Web seja bloqueado por servidores da Web, você tem a opção de acessar os sites de destino por meio de servidores proxy ou VPN. Pode ser usado um único servidor proxy ou uma lista de servidores proxy.
* Raspagem de categoria: WebHarvy permite que você raspe dados de uma lista de links que levam a páginas/listas semelhantes dentro de um site. Isso permite que você raspe categorias e subcategorias em sites usando uma única configuração.
* Expressões Regulares: Expressões Regulares (RegEx) podem ser aplicadas em texto ou fonte HTML de páginas da web para raspar a parte correspondente. Essa poderosa técnica oferece mais flexibilidade e controle durante a coleta de dados.
* Suporte a JavaScript: execute seu próprio código JavaScript no navegador antes de extrair os dados. Isso pode ser usado para interagir com os elementos da página, modificar o DOM ou invocar funções JavaScript já implementadas na página de destino.
* Raspagem de imagem: as imagens podem ser baixadas ou os URLs das imagens podem ser raspados. O WebHarvy pode raspar automaticamente várias imagens exibidas nas páginas de detalhes do produto de sites de comércio eletrônico. *
Automatize as tarefas do navegador: WebHarvy pode ser facilmente configurado para executar tarefas como clicar em links, selecionar lista/opções suspensas, inserir texto em um campo, rolar a página, abrir pop-ups, etc.
atualizações e suporte gratuito por um período de 1 ano a partir da data da compra.