websitelytics

Menu

Аналитика для проектов с электронной коммерцией

Этот сайт стремится продемонстрировать и дать сопутствующие пояснения по следующим темам:

Краткие характеристики некоторых аналитических платформ и вспомогательных сервисов

googlebigquery analytics

BigQuery

Недорогой сервис хранилища данных полностью поддерживаемый Google, который в частности можно использовать для анализа несемплированных низкоуровневых данных (хитов) из Google Analytics.

Плюсы:
  • Позволяет анализировать данные на низком уровне через SQL запросы, что расширяет возможности аналитики
  • Позволяет интегрировать данные из различных источников в единую комплексную систему аналитики посредством SQL
Важные моменты:
  • Требует технических знаний для интеграции стриминга данных из GA в Bigquery, а также познаний в SQL и javascript-подобных языках для использования всех его возможностей.
google analytics summary

Google Analytics

Хорошо всем известный инструмент, предназначенный для быстрого создания стандартных, а также пользовательских (кастомных) отчетов веб аналитики через удобный интерфейс. Отчеты формируются на основе агрегированных данных (т. е. обработанных данных с некоторыми подсчетами), которые собираются с помощью установленного на сайте снипета javascript кода.

Плюсы:
  • Универсальность, позволяющая формировать широкий набор отчетов
  • Большое профессиональное сообщество и накопленные готовые решения в виде библиотек легко доступных для использования
  • Прозрачность отправляемых данных в аналитику отправляются только те данные, которые вы задаете
Важные моменты:
  • Технический аудит требует познаний в javascript и умение пользоваться на базовом уровне инструментами разработчика (devtools)
  • Вариант установки "из коробки", практически всегда требует донастройки
  • Исторически GA базируется на анализе сессий, что создает определенные трудности при анализе поведения индивидуальных либо групп пользователей
Analytics 4 (App + Web):

Новая версия аналитики, на которую делается акцент вектора развивития системы. Позволяет объединять аналитику сайтов и приложений на основе новой модели данных - иерархии событий и параметров. Имеет новый интерфейс с рядом отчетов и графиков отсутствующих в Universal Analytics. Также интересны новые возможности построения аудиторий на базе предиктивных моделей. На данный момент рекомендуется параллельная установка с Universal Analytics.

datastudio reports

Data Studio

Сервис для построения информационных панелей (дашбордов) и отчетов из различных источников данных, которые легко кастомизируются, в том числе визуально, и которыми легко поделиться с коллегами.

Плюсы:
  • Инструмент позволяет визуализировать аналитические данные из GA, Google Ads и BigQuery с помощью встроенных нативных коннекторов, а при помощи дополнительных коннекторов данные из Яндекс Директ, Facebook ads и т.д.
  • Поддерживаются вычисляемые параметры, объединение данных из разных источников и SQL запросы к Bigquery, что дает основу для аналитики BI
Важные моменты:
  • Несмотря на широкий набор элементов визуализации есть ограничения по стилистике и представлению некоторых данных
Power BI

Power BI

Один из популярных инструментов подготовки и визуализации данных

Плюсы:
  • Если ваш стек хранения и аналитики данных имеет продукты компании Microsoft, то Power BI позволит вам наиболее легко подключаться, интегрировать и визуализировать данные из этих источников, включая облачные сервисы Azure.
  • Имеет широкий набор возможностей по трансформации и подготовки данных, в том числе с использованием языка Python.
  • Внутренние скриптовые языки (M и DAX) дают вам возможность автоматизировать трансформацию данных для последующей визуализации.
Важные моменты:
  • Есть сложности с интеграцией со сторонними источниками данных, в том числе с Google Cloud Platform.
  • Основной набор инструментов содержится в десктопной версии, это накладывает ограничения для построения cloud-first решений c мультиплатформенными интеграциями данных.
Apache Airflow

Apache Airflow

Идин из самых популярных инструментов оркестрирования ETL для пайплайнов данных.

Плюсы:
  • Если вы знаете Python, то свою первую последовательность задач вы сможете создать достаточно быстро.
  • Проект развивается давно и уже имеет большой набор встроенных операторов, в том числе поэтому используется рядом крупных компаний, в частности на его основе работает Cloud Composer - оркестратор в GCP.
  • Имеет удобный интерфейс для мониторинга и визуального представления DAG-ов.
Важные моменты:
  • Для развертывания Airflow самостоятельно вам потребуются компетенции DevOps.
Jupyter Notebook

Jupyter Notebook

Удобный инструмент интерактивной аналитики

Плюсы:
  • Среда позволяет в удобной форме сочетать, объединять различные сниппеты кода, в процессе интерактивного анализа или исследования данных, например, при работе с несколькими API одновременно.
  • Позволяет удобно комментировать все шаги и сниппеты кода, например для пояснения коллегам или, как техническое описание.
  • Данные можно получать из разных источников, например из BigQuery, Google Analytics Reporting API или же просто из csv файла и помещать их в Pandas DataFrame для дальнейшего анализа или визуализации.
Важные моменты:
  • Есть варианты использования, как на своем компьютере, так и в облачных сервисах, например, Yandex DataSphere и Google Colab.
  • Есть возможность конвертировать и сохранять файлы ноутбуков в удобные для демонстрации или размещения на сторонних ресурсах форматы, например, в html, markdown, pdf.