Notebook

Визуализация моделей ArtmModel прямо в ноутбуке¶

Постановка проблемы¶

Основная идея нового Python API — интерактивная работа с тематическими моделями. При интерактивной работе пользователь (исследователь) может последовательно выполнять различные действия с тематической моделью:

делать итерации EM-алгоритма,
менять параметры модели и обучения,
оценивать метрики качества,
смотреть на внутренности модели.

Пользователь может повторять эти действия в любом порядке несколько раз, размышляя в промежутках о существе мира и неполноценности человеческого языка.

Здесь мы акцентируем внимание на пункте смотреть на внутренности модели. Как можно посмотреть на тематическую модель? Один из способов — интерактивная визуализация LDAvis.

Давайте добавим в новое API функции для немедленной визуализации тематической модели при помощи LDAvis, чтобы это стало неотъемлемой частью инструментария исследователя.

Решение: метод `ArtmModel.visualize()`¶

ArtmModel — изюминка нового Python API, напоминает класс модели из SciKit-Learn, позволяет работать с моделью как с изменяющимся объектом, выполняя основные операции в одну строчку.

В каждый момент времени объект класса ArtmModel содержит в себе текущее состояние тематической модели. Добавим метод для построения визуализации:

  model.visualize()

Далее будет описан прототип этого метода (proof-of-concept).

Реализация¶

Для того чтобы все работало требуется:

поставить Python-библиотеку Jinja2
в одном каталоге с ноутбуком лежал файл ldavis.js (эту необходимость нужно устранить в будущем)

In [1]:

from visualization_ldavis import TopicModelVisualization

class ArtmModel(object):
    
    def visualize(self):
        import json
        with open('lda.json') as f:
            data = json.load(f)
        return TopicModelVisualization(data)

Пример работы¶

In [2]:

model = ArtmModel()
# ... дальше мы типо работаем с моделью ...

В какой-то момент необходимо посмотреть на модель:

In [3]:

vis = model.visualize()
vis

Out[3]:

А затем сохранить эту визуализацию в отдельный файл и отправить коллегам по почте:

In [4]:

vis.to_file('model_visualization.html', title='My Cool Model')

Новый файл model_visualization.html не зависит от файла ldavis.js и его можно просто открыть в браузере.

Визуализация моделей ArtmModel прямо в ноутбуке¶

Постановка проблемы¶

Решение: метод ArtmModel.visualize()¶

Реализация¶

Пример работы¶

Решение: метод `ArtmModel.visualize()`¶