Analytic Workspace или Yandex DataLens: какое BI-решение оптимально для ваших задач?


По оценке Tadviser Российский рынок BI ежегодно растет на 16−17% - все больше коммерческих компаний прибегают к помощи BI-систем. BI — это не только подспорье для бизнес-анализа и принятия управленческих решений, но и мощный способ снизить практически до нуля ошибки при подготовке данных для анализа. Выбрать правильную систему под задачи бизнеса поможет наш обзор: сравним два популярных российских аналитических сервиса — Yandex DataLens и Analytic Workspace.
Analytic Workspace — это многопользовательский инструмент интерактивного сбора, анализа и визуализации данных. Yandex DataLens — сервис визуализации данных в составе платформы Yandex Cloud, разработанной компанией Яндекс. Облачная платформа Yandex Cloud предлагает индивидуальным и корпоративным пользователям более 50 инфраструктур, платформ и бизнес-сервисов.

Мы выделили Топ-10 критериев для выбора BI-системы и сравним выбранные ИТ-продукты по этим ключевым пунктам — от бесшовного подключения к источникам данных и кастомной визуализации до импортозамещающего потенциала и стоимости.

Подключение источников и хранение данных

Yandex DataLens не хранит в себе данные (кроме загружаемых .csv файлов), а генерирует “на лету” запросы в БД-источник под каждый чарт (виджет). В сервисе доступны следующие типы подключений: ClickHouse, File (.csv), Google Sheets, PostgreSQL, MySQL, MS SQL Server, BigQuery, Oracle Database, YDB, Greenplum, Prometheus, Metrica, AppMetrica, Yandex Cloud Billing, Подкасты Аналитика, Yandex Monitoring, Битрикс24. Подключаться к иным источникам, в том числе к web-сервисам, не получится. Рекомендуется подключаться к web-сервисам (API) сторонними средствами, складывать данные в БД и уже после этого использовать их в Yandex DataLens.

Analytic Workspace допускает возможность одновременной работы с несколькими различными источниками данных:
  • СУБД: Oracle, Clickhouse, MySQL, Microsoft SQL,Greenplum, PostgreSQL, Vertica, MariaDB, MongoDB. Доступно добавление своих JDBC-коннекторов;
  • Файлы или архивы с файлами: .xlsx, .csv, .xml, .json;
  • Web-сервисы (API)

В части хранения данных Analytic Workspace работает в двух режимах:
  • Основной – данные после трансформации хранятся в собственном хранилище на базе Clickhouse;
  • Для готовых витрин – может подключаться к готовой витрине данных с СУБД Clickhouse. В этом случае данные не хранятся дополнительно в хранилище Analytic Workspace.

Построение моделей данных

Моделирование данных — один из важнейших этапов работы с большими массивами информации. Он позволяет структурировать типы хранящихся в системе данных, задать отношения между ними, способы группировки этих данных, их форматы и атрибуты.

Как в Analytic Workspace, так и в Yandex DataLens построение моделей данных осуществляется drag-and-drop способом (захват и перенос элемента курсором), что не требует углубленных навыков программирования.

Расчетные (вычисляемые) поля

Чтобы получать уже обработанную информацию из отдельных разрозненных фрагментов, находящихся в базах данных, применяются расчетные (или вычисляемые) поля. Они автоматически создаются при выполнении запроса, имеют вид и свойства обычных столбцов, которые уже имеются в таблице.

В Yandex Data Lens, также, как и в Analytic Workspace вычисляемые поля заполняются с помощью SQL-запросов. Стоит отметить, что обе аналитические системы используют одинаковый синтаксис при построении формул.
Разграничение доступа к данным
В Analytic Workspace ролевая модель доступа к данным реализована вплоть до уровня отдельных виджетов с возможностью расширения полномочий. Разграничение доступа к данным осуществляется по принципу ABAC (доступ к атрибутам). Если пользователю закрыть доступ на уровне данных (это делается при подготовке модели), то в какой бы виджет эти данные ни были добавлены – пользователь их не увидит.

В Yandex DataLens наряду со стандартной процедурой аутентификации на уровне аккаунта можно настроить разграничение доступа к данным на уровне строк в датасете или в источнике при помощи инструмента RLS (Row-level-security). Для этого необходимо написание нескольких строк программного кода.

ETL

В Analytic Workspace для задач обработки и трансформации данных реализован полноценный Extract-Transform-Load (ETL)-слой. За функционирование ETL в Analytic Workspace отвечает связка сервисов, бесшовно встроенных в интерфейс и процесс: Apache Airflow, Apache Spark, Apache Drill. Также можно предварительно просмотреть результаты моделирования, что ускоряет работу с большими объемами данных.

В Yandex Data Lens ETL-слой отсутствует. Задачи трансформации данных можно решить с помощью интеграции других инструментов — Yandex Data Transfer, Yandex DataProc, Yandex DataSphere.

Поскольку Analytic Workspace может быть развернута в Yandex Cloud и на базе Analytic Workspace можно сформировать витрины данных в Clickhouse, то возможен вариант комплексного решения: подготовка данных реализуется через Analytic Workspace, а визуализация - через Yandex DataLens.

Виджеты и выгрузка данных

Одни и те же данные, представленные в различных форматах визуализации, могут восприниматься по-разному. Прогнав данные через различные виджеты, можно понять, что наиболее наглядно отражает аналитику в проекте: столбчатая, линейная, круговая, точечная или пузырьковая диаграмма, древовидная карта или более экзотические типы визуализации.

В Analytic Workspace представлены более 20 видов визуализации, удобные дашборды. Кроме того, можно создавать собственные виджеты с использованием HTML, CSS и JS благодаря встроенной интеграции с Echarts, где доступно 400 видов визуализации. Экспорт данных возможен в форматы: png, pdf, csv, формируется индивидуальный доступ по ссылке для каждого виджета.

В Yandex DataLens насчитывается более 30 видов визуальных элементов. В частности, на высоком уровне проработан виджет “карта” за счет неограниченного доступа к “семейному” ресурсу Яндекс Карт. Предустановлены удобные шаблоны дашбордов. Экспортировать данные можно в форматы xls, csv, markdown.

Внедрение и установка

Важным конкурентным преимуществом ИТ-продуктов является наличие комьюнити, обучающих материалов, развитой партнерской сети. Клиентам выгодно выбирать BI-решения в составе экосистем, объединяющих технологии и специализированные сервисы с возможностью бесшовной интеграции, а также коммуникации между заказчиками, интеграторами, экспертами и вендорами.

Yandex DataLens предоставляется только на облачных серверах Yandex Cloud. Однако экосистема Yandex Cloud насчитывает десятки разнообразных управляемых сервисов от контейнерной разработки до инфраструктуры (например, распознавания речи). Быстрый time-to-market - одно из самых сильных преимуществ Yandex DataLens.

В Analytic Workspace у пользователей есть выбор: сервис может быть развернут как на собственных серверах заказчика, так и в облачной версии (в Yandex Cloud, Сбер Cloud). Получать реальные результаты работы системы уже можно в первый день использования. Комплектация системы может быть кастомизирована под заказчика.

Обе BI-системы могут внедряться как самостоятельно заказчиком, так и с помощью специализированного партнера. Кроме того, Analytic Workspace может быть внедрена непосредственно вендором с возможностью кастомизации под требования бизнеса (дополнительные коннекторы, интеграции, виджеты и прочее).

Простота освоения и обучение

Как Yandex DataLens, так и Analytic Workspace относятся к классу self-service BI-систем, то есть отличаются простотой освоения и не требуют от пользователя высоких навыков программирования. Обе системы имеют интуитивно понятный интерфейс и по этому критерию занимают высокие позиции в рейтингах.

Оба BI-продукта предоставляют бесплатный пошаговый курс обучения и имеют активные телеграм-сообщества, где пользователи могут получить ответы на тематические вопросы.

Импортозамещающий потенциал

Оба рассматриваемых продукта входят в реестр российского программного обеспечения и отвечают критериям импортозамещения. Analytic Workspace может выступать полноценной технологической заменой Power BI, Qlick и Tableau. Yandex DataLens доступна только в облачной платформе (SaaS) и не может быть развернута на собственных серверах заказчика. Этот факт несколько ограничивает использование Yandex DataLens государственными органами и организациями, которые предъявляют повышенные требования к безопасности данных.
Таблица 1 — Сходства и различия функциональности BI-систем Analytic Workspace и Yandex DataLens
yandex datalens обзор

Yandex DataLens или Analytic Workspace: выбор диктуют задачи

Итак, резюмируем: Analytic Workspace — self-service BI-инструмент для интерактивного анализа и визуализации, закрывающее полный цикл аналитики данных. Данное решение подходит для простого и быстрого получения статистической информации и проверки аналитических гипотез. Система поддерживает совместное управление процессом получения информации из разных источников. Также есть опции построения моделей данных, проведения исследований, анализа и интерпретации. Результаты анализа можно визуализировать, а также обмениваться ими. Что касается стоимости — условия более чем демократичные. Так, лицензия разработчика предлагается от 5 000 рублей в месяц.

Очевидным достоинством Yandex DataLens является принадлежность к экосистеме сервисов Yandex Cloud, что означает взаимодействие с 50+ инфраструктур и платформ в едином контуре безопасности. Yandex DataLens безусловно полезен широкому кругу специалистов как удобный, бесплатный и простой в освоении сервис для быстрой базовой аналитики и визуализации данных.
Таблица 2 — Предпочтительность использования BI-систем Analytic Workspace и Yandex DataLens для различных бизнес-сценариев
даталенс яндекс
Юлия Хорошутина
Руководитель направления развития Analytic Workspace
Эксперт Фонда Развития Интернет Инициатив (ФРИИ), кандидат наук. Маркетолог, специалист в области вывода на рынок B2B-продуктов ИТ-сферы
15 мая 2023
Хотите узнать стоимость BI-системы под ваш бизнес? Закажите бесплатную консультацию от наших экспертов.