Estela

Web Scraping on-premise

A primeira solução de orquestração de scraping de código aberto do mundo

  • Reduza custos ao ter controle total do seu pipeline de dados
  • Relatórios de uso dos seus projetos e spiders
  • Elasticidade, escalabilidade e melhores práticas integradas
Confira o repositório
Bitmaker brain

Empresas que confiam em nós



Por que Estela?

On-premise

Estela é uma plataforma de orquestração de scraping executada em Kubernetes. Ela oferece mecanismos para implantar, executar e escalar spiders por meio de uma API REST e de uma interface web.

Elasticidade e escalabilidade

Automatize a carga de trabalho gerada pelos spiders e otimize suas operações de dados com uma infraestrutura que evolui junto com o seu negócio.

Redução de custos

Gere economia real ao operar na sua própria infraestrutura, eliminando a dependência de plataformas cloud externas e mantendo maior controle financeiro.

Código aberto

Nosso compromisso com a comunidade open source faz parte do nosso DNA. Defendemos a troca aberta de informações, tecnologia, transparência e desenvolvimento colaborativo.

Pronto para começar?

Bitmaker Cloud é uma instância do Estela hospedada pela Bitmaker.
Experimente gratuitamente

Benefícios do Estela
VS
Plataformas proprietárias de scraping

Autonomia

Operações e processos podem ser revisados internamente, sem depender de um provedor de serviço.

Multilinguagem

Suporta diversos frameworks e linguagens, como Scrapy e python-requests, dois dos mais utilizados no setor.

Soberania de dados

Segurança e privacidade completas ao manter os dados nos seus próprios servidores.

Controle

A infraestrutura on-premise oferece controle total sobre recursos, serviços e dados.

Recursos técnicos do Estela

Arquitetura tolerante a falhas

Automatiza a distribuição de recursos para manter a extração de dados contínua, mesmo em cenários desafiadores.

Arquitetura modular

Crie e adapte novas funcionalidades sem comprometer o desempenho do Estela.

Avaliação de desempenho

Use gráficos detalhados para analisar em profundidade os recursos consumidos durante cada execução.

Agendamento otimizado de spiders

A arquitetura tolerante a falhas otimiza o agendamento de spiders e evita sobrecargas desnecessárias na infraestrutura.

Rastreabilidade

Identifique problemas e erros rapidamente com uma visão em tempo real nos níveis de organização, projeto, spider e job.

Compatibilidade flexível

Estela se adapta às suas necessidades e aceita Scrapy e Requests, dois dos frameworks mais utilizados na indústria.

Últimas novidades

2023-07-12

Suporte a Requests no Estela

O suporte beta para a biblioteca Requests (ec08db0) foi adicionado recentemente ao Estela e continuará evoluindo.


2023-07-12

Notificações no Estela

Além do histórico de atividades por projeto, os usuários agora também recebem notificações quando uma ação ocorre em um projeto do qual fazem parte (2da9074).


2023-07-11

Visualização de estatísticas em tempo real

O Redis agora é usado para armazenar estatísticas de jobs em status RUNNING (5957952), permitindo visualizar estatísticas e consumo de recursos em tempo real.


2023-07-11

Menu de atividades do Estela

Uma nova proposta e implementação para o menu de atividades foi introduzida no Estela (5d4c8dc), permitindo consultar o histórico de ações em cada projeto.


2023-04-25

Estatísticas de projeto

O dashboard de projetos recebeu uma grande evolução, com novos gráficos para visualizar estatísticas de jobs de scraping e diferentes visões de métricas (536eaca, 2fdcd3e, fcd6e1e).

Artigos técnicos


Lançamento open source do Estela

Ler mais

Apresentando suporte a Requests no Estela

Ler mais

A transformação do primeiro ano do Estela

Ler mais