websitelytics

Menu

Аналитика для проектов с электронной коммерцией

Этот сайт стремится продемонстрировать и дать сопутствующие пояснения по следующим темам:

Вы смотрите тестируемый вариант А.

Краткие характеристики некоторых аналитических платформ и вспомогательных сервисов

redash

Redash

Опенсорсный инструмент для аналитики и визуализации данных с большим набором возможностей для представления результатов SQL запросов и API реквестов.

Плюсы:
  • Большое количество встроенных коннекторов данных, включая, например, Clickhouse, PostgreSQL, API Яндекс.Метрика и т. п.
  • Возможность написать и подключить свой коннектор.
  • Redash использует для визуализации хорошо известную и давно разрабатываемую опенсорсную библиотеку Plotly. Соответственно вам доступны все ее возможности.
  • Обновляемый Docker файл, с помощью которого можно развернуть Redash на своем ресурсе с помощью пары команд.
Важные моменты:
  • Требует знание SQL для работы с данными DWH и Javascript для построения кастомных визуализаций.
Примеры кастомных визов в Redash:
Power BI

Tableau

Гибкий и в тоже время комплексный инструмент визуализации данных

Плюсы:
  • Достаточно легко интегрируется с большим набором внешних источников данных.
  • Tableau один из старейших инструментов, имеет хорошо проработанный интерфейс, надежно работающий базовый набор фитчей.
  • Широкий набор визуализаций.
Важные моменты:
  • Комплексность инструмента несколько удлиняет процесс его изучения в полном объеме.
  • Некоторые простые вещи, как например, сравнение с предыдущим отчетным периодом, приходится делать с помощью функций скриптового языка.
Power BI

Power BI

Один из популярных инструментов подготовки и визуализации данных

Плюсы:
  • Если ваш стек хранения и аналитики данных имеет продукты компании Microsoft, то Power BI позволит вам наиболее легко подключаться, интегрировать и визуализировать данные из этих источников, включая облачные сервисы Azure.
  • Имеет широкий набор возможностей по трансформации и подготовке данных, в том числе с использованием языка Python.
  • Внутренние скриптовые языки (M и DAX) дают вам возможность автоматизировать трансформацию данных для последующей визуализации.
Важные моменты:
  • Есть сложности с интеграцией со сторонними источниками данных, в том числе с Google Cloud Platform.
  • Основной набор инструментов содержится в десктопной версии, это накладывает ограничения для построения cloud-first решений c мультиплатформенными интеграциями данных.
Apache Airflow

Apache Airflow

Идин из самых популярных инструментов оркестрирования ETL для пайплайнов данных.

Плюсы:
  • Если вы знаете Python, то свою первую последовательность задач вы сможете создать достаточно быстро.
  • Проект развивается давно и уже имеет большой набор встроенных операторов, в том числе поэтому используется рядом крупных компаний, в частности на его основе работает Cloud Composer - оркестратор в GCP.
  • Имеет удобный интерфейс для мониторинга и визуального представления DAG-ов.
Важные моменты:
  • Для развертывания Airflow самостоятельно вам потребуются компетенции DevOps.
Jupyter Notebook

Jupyter Notebook

Удобный инструмент интерактивной аналитики

Плюсы:
  • Среда позволяет в удобной форме сочетать, объединять различные сниппеты кода, в процессе интерактивного анализа или исследования данных, например, при работе с несколькими API одновременно.
  • Позволяет удобно комментировать все шаги и сниппеты кода, например для пояснения коллегам или, как техническое описание.
  • Данные можно получать из разных источников, например из BigQuery, Google Analytics Reporting API или же просто из csv файла и помещать их в Pandas DataFrame для дальнейшего анализа или визуализации.
Важные моменты:
  • Есть варианты использования, как на своем компьютере, так и в облачных сервисах, например, Yandex DataSphere и Google Colab.
  • Есть возможность конвертировать и сохранять файлы ноутбуков в удобные для демонстрации или размещения на сторонних ресурсах форматы, например, в html, markdown, pdf.