Анализ чата Telegram в Google Таблицах

Один из вариантов, как можно экспортировать из Телеграм-чата всю историю сообщений, конвертировать ее в табличную форму и провести некий Data Analyze

Нужно было получить статистику по активности пользователей в одном специфическом чате Telegram. Расскажу, как я экспортировал, конвертировал и анализировал данные.

Экспорт данных из Telegram-чата

Выгрузить все сообщения из чата Телеграма проще всего в официальном приложении для Windows или Mac. Откройте тот чат, в котором у вас есть права администратора, и нажмите на три точки меню в верхнем правом углу. Странно, но под macOS эта функция доступна только в Lite-версии приложения.

Конвертируем историю Телеграм-чата в табличный формат

Выбрать формат экспорта чата Telegram нельзя. Выгружаются сообщения в HTML. Преобразуем файл экспорта в CSV-формат. Дальше уже можно будет выбрать инструмент анализа по душе.

Габриэль Канега написал и выложил на Github парсер на Python, который конвертирует HTML-выгрузку Telegram в Comma Separated Values. Просто положите скрипт в папку выгрузки рядом со всеми файлами message.html и выполните команду:

python3 telegram-export-converter.py

После завершения процесса обработки в той же папке вы обнаружите csv-файл.

Анализ сообщений Телеграм-чата

В рамках данного материала я решил обойтись возможностями Google-таблиц. Объем сообщений моей тест-образца небольшой. Функционала вполне хватит.

Создаем новую таблицу, меню Файл — Импорт и загружаем csv-файл в автоматическом режиме. Получаем таблицу со столбцами: номер сообщения, дата и время, имя пользователя и его сообщение.

Дальше можно только ваша фантазия влияет на то, что отсюда можно вытянуть. Так как я анализировал данные небольшой экспериментальной группы с отчетами о проведенных испытаниях, мне было интересно посмотреть продуктивность участников эксперимента в целом и по месяцам.

Каждое сообщение в чате — это отчет об отдельном эксперименте. Функционала сводных таблиц с группировкой для анализа хватило за глаза.

Сводная таблица с группировкой по месяцам. Просто щелкните по датам в сводной таблице и выберите «Группировать по месяцам» 😎
Аналогичная картина, но добавлена сегментация по пользователям в столбцах. Пользователей всего трое, поэтому можно обойтись столбчатой диаграммой.

Такие дела ¯\_(ツ)_/¯ Больше ничего не придумал. Хотя в принципе можно еще по времени суток посмотреть распределение, например.