Redash vs Superset vs Metabase – Comparando Open Source BI Tools

Há anos que o Mercado de BI disponibiliza várias ferramentas boas para visualização de dados, mas nem sempre é possível pagar por uma licença ou serviço. Aqui na Oncase passamos um bom tempo tentando encontrar ferramentas de visualização de dados que atenda tanto a nossa demanda como a de nossos clientes. Utilizamos o Ctools e o Analyzer – ambos da Suíte Pentaho – sozinhos por bons anos, mas a necessidade nos levou a buscar algumas alternativas.

Vamos dividir com vocês um pouco do aprendizado que adquirimos durante esse processo, e tentar ajudá-los a escolher, alguma dessas ferramentas, caso estejam em dúvida. Analisamos várias ferramentas de Dashboard do Mercado, mas vamos falar de apenas 3 da categoria OpenSource que mais se destacaram neste post. Aqui está uma comparação rápida de Superset x Redash x Metabase.

Essas ferramentas estão sendo constantemente atualizadas, recentemente o Redash passou por melhorias significativas desde a última vez que o tínhamos testado. Tornando-o aparentemente mais maduro do que os seus concorrentes. Aqui na Oncase pela demanda de um cliente específico precisávamos que a ferramenta tivesse a possibilidade de conectar-se a base de dados via tunelamento, todas que listamos aqui tem essa função, entretanto algumas mais maduras do que outras. Então vamos começar a análise.

 

Análise técnica – Redash vs Superset vs Metabase

 

Metabase

 

 

  • Linguagem: CLOJURE
  • Versão atual: 0.29.3
  • Data Sources: BigQuery, Crate, Druid, Google Analytics , H2, MongoDB, MySQL, PostgreSQL, Presto, Amazon Redshift, SQLite, SQL Server, Vertica (Não nativo – veja como incluir em: https://github.com/metabase/metabase/blob/master/docs/administration-guide/databases/vertica.md)
  • Aceita tunelamento: Sim
  • Tipos de visualizações: Number, Progress bar, Table, Line chart, Bar chart, Row chart, Area chart, Scatterplot or bubble chart, Pie/donut chart, Funnel, Map
  • Autenticação: Google OAuth e LDAP
  • Usuários, Grupos e Permissões: User e Admin
  • Sistema de Alertas: Sim: E-mail e Slack

 

Redash – Versão Community

 

 

  • Linguagem: PYTHON
  • Versão atual: 4.0.1
  • Data Sources: BigQuery, Oracle, Impala, Amazon Aurora, Amazon Athena, Amazon DynamoDB , Hive, MongoDB, MySQL, PostgreSQL, Presto, Amazon Redshift, InfluxDB, SQL Server, Vertica, Graphite, Greenplum, ScyllaDB, TreasureData, Axibase Time Series Database, Cassandra, ElasticSearch
  • Aceita tunelamento: Sim
  • Tipos de visualizações: Line, Bar, Area, Pie, Scatter, Boxplot, Cohort, Sunburst, Word Cloud, Sankey, Map, Counter, Pivot Table
  • Autenticação: Google OAuth e LDAP
  • Usuários, Grupos e Permissões: Admin, mas permite criação de outros grupos com regras diferentes para cada grupo, e os usuários podem fazer parte de mais de um grupo.
  • Sistema de Alertas: Sim: E-mail, Slack, Mattermost, HipChat e webhooks

Superset

 


  • Linguagem: PYTHON
  • Versão atual: 0.25.2
  • Data Sources: BigQuery, Oracle, Impala, Amazon Aurora, Amazon Athena, Amazon DynamoDB , Hive, MongoDB, MySQL, PostgreSQL, Presto, Amazon Redshift, InfluxDB, SQL Server, Vertica, Graphite, Greenplum, ScyllaDB, TreasureData, Axibase Time Series Database, Cassandra, ElasticSearch – Além disso, o Superset suporta qualquer banco de dados suportado pelo SQLAlchemy
  • Aceita tunelamento: Sim
  • Tipos de visualizações: Bar, Pie, Line, XY, Area, Table, Pivot, Word cloud, Treemap, Heatmap(grid), Calendar heat, Box plot, Bubble/scatter, Bullet chart, Big number+trend, Big number, Histogram, Sunbrust, Sankey, Graph / directed force, Chord diagram, Country map, World map, Iframe, Parallel  coordinates, Horizon, Mapbox, Event flow
  • Autenticação: Google OAuth, LDAP, OpenID e Database
  • Usuários, Grupos e Permissões: Admin, Alpha, Gamma, Public, mas permite criação de outros grupos com regras distintas e os usuários podem fazer parte de vários grupos.
  • Sistemas de Alertas: Não

Considerações finais:

 

Metabase – Simples, barato e fácil de usar

 

Para você que busca algo simples e mais barato a ferramenta mais indicada é o Metabase, pois ele pode ser instalado na sua própria máquina ou em seu próprio servidor, também oferece suporte para ser implantado via Heroku, mas eles consideram que ainda está em Beta (testamos aqui e funcionou tranquilamente). Você obtém controle total de como e onde você executa o Metabase, assim você consegue reduzir custos e definir seus próprios limites de armazenamento. O metabase ainda possui um sistema de alertas que pode ser configurado com e-mails ou com a ferramenta Slack.

 

Redash – O mais completo

 

Para quem procura uma ferramenta que fornece conectividade para diversos bancos de dados o Redash é o ideal, pois ele suporta mais de 25 fontes de dados. Ele também conta com um sistema de envios de alertas, em que você pode configurar e ser notificado sobre determinados eventos nos seus dados, além de possuir integração com o Slack. O Redash também pode ser acessado via API, e permite o compartilhamento de dashboards via URL. Como eles deram uma melhorada na interface recentemente, a usabilidade melhorou bastante, e está muito mais intuitivo do que quando testamos na versão 2.0.0. O Redash possui duas versões: Community e Enterprise. Na versão community você terá que gastar com um bom servidor para suportar a ferramenta. Então cabe avaliar qual versão seria mais interessante para a sua necessidade.

 

Superset – O mais rico em visualizações

 

O Superset foi criado inicialmente pelo AirBnB e depois foi adquirido pela Apache. Até o momento foi a ferramenta que escolhemos utilizar na Oncase, por ela atender melhor a demanda que estávamos precisando. O Superset possui um rico conjunto de visualizações para analisar seus dados, bem como uma maneira flexível de estender os recursos (basta ter conhecimentos em Python que você mesmo poder incluir novas funcionalidades). O lado negativo é que mesmo sendo gratuita, para que a ferramenta tenha uma boa performance gastamos muito com um servidor que tenha capacidade para suportar a ferramenta tranquilamente.

 

Conclusão

 

Todas as ferramentas tem suas vantagens e desvantagens, fizemos uma comparação rápida para que você pudesse conhecer um pouco sobre cada uma delas. Cabe você analisar qual seria mais interessante para sua necessidade.

 

E aí, ficou com alguma dúvida? Escreve aqui nos comentários, faremos o máximo para lhe ajudar. Obrigada e até a próxima :)

Juliana Carvalho
Data Engineer at Oncase