Тренды: как DJ Блокнот оживляет поэзию Серебряного века при помощи нейросетей

Редакция «ВФокусе Mail.ru» записала интервью с Никитой Глуховым — он же DJ Блокнот. Популярность пришла к нейрорежиссёру после клипа на стихотворение Александра Блока «Ночь, улица, фонарь, аптека». Никите пишут учителя и рассказывают, что такие фильмы пом
Источник: DJ Блокнот

Блиц
Место рождения: Казахстан
Образование: специалист по менеджменту IT, Южно-ральский государственный университет (ЮУрГУ)
В Сети: создал целую серию нейрофильмов на стихи поэтов Серебряного века и ряд других проектов
Любимый поэт: Сергей Есенин
Блюдо: бабушкина картошка с грибами
Город: Сеул
Книга: Умберто Эко, «Имя розы»

Поэты Серебряного века под бит: как родился DJ Блокнот

— Как появилась идея заставить поэтов Серебряного века «петь» свои стихи?

— Еще в 2018 году мы с другом запустили проект, связанный с реставрацией исторических материалов. Мы тогда жили в Челябинске: он озвучивал тексты, а я занимался восстановлением старых видео с помощью нейросетей. Мы воссоздавали образы прошлого Челябинска, и проект действительно получил популярность. С тех пор я постоянно использую ИИ для разных форм работы с историей.

Постепенно начал экспериментировать с форматами. И вот однажды решил оживить исторических личностей: обучал нейросети на записях голосов — Есенина, Маяковского. Сначала они «говорили» своими голосами, потом появилась новая модель для создания музыки — это было весной. Я протестировал её и сделал три видео: «Пушкин. Если жизнь тебя обманет», «Лермонтов. Скучно и грустно» и «Блок. Ночь, улица, фонарь, аптека».

Когда я закончил Блока и показал видео семье, понял, что в этом есть что-то особенное — более глубокий уровень смысла, чем во всём, что делал раньше. Как будто всё — опыт, музыка, поэзия, технологии — сошлось в одной точке.

В школе я активно участвовал в литературных конкурсах, олимпиадах. В университете у меня был большой YouTube-канал про гитару — один из крупнейших в русскоязычном сегменте. Учился я на IT-специальности — Management of IT. И вот теперь всё это объединилось: музыка, поэзия, технологии и 15 лет опыта в видео.

Ролик с «Блоком» быстро набрал просмотры — с него и начался интерес к проекту.

Источник: DJ БлокNote

— Кто ты по профессии, диджей?

— Совершенно не диджей. Я гитарист, немного играю на пианино. Перед публикацией ролика я подумал: это ведь не совсем Блок — это интерпретация, современное прочтение, созданное мной и ИИ. Значит, ему нужен сценический псевдоним. Так появилось имя «Диджей Блокнот» — как сочетание слов «Блок» и «нот», и как метафора тетради, где записаны мысли и стихи.

Сначала это был просто тест, но проект начал набирать обороты именно с этой песней. Когда лейбл DFM предложил подписать контракт, они настояли, чтобы я оставил название «Диджей Блокнот». Тогда у меня уже существовала «Академия нейросетей», я преподавал использование ИИ в визуале под именем «Дженейра». Теперь всё объединено под единым направлением — Диджей Блокнот.

— Эксперты говорят, что «русская начинка» в нейросетях необходима для развития отечественных моделей. Что об этом думаешь?

— Абсолютно согласен. Недавно выступал в Белоруссии и показывал, как современные модели удерживают контекст — например, по GPS-координатам и времени суток они создают реалистичные сцены.

Я вводил: «Минск, 31 декабря 1999 года, 23:59, центр города» — и модель выдала изображение с точным ощущением эпохи: одежда, освещение, новогодние плакаты на белорусском. Полгода назад такое было невозможно. Сейчас нейросети действительно понимают контекст, а не просто «рисуют».

Но проблема в том, что русские модели развиваются медленнее. Русский язык долгое время корректно поддерживался только западными системами вроде GPT. Нам нужно создавать свои базы, свои контекстные модели — с глубокой связью с русской культурой, историей и языком. Пока мы сильно отстаем, и приходится работать на иностранных моделях, которые, что иронично, знают о России больше, чем отечественные.

Как устроена «кухня» проекта DJ Блокнот

— С какими нейросетями работаешь?

— Их около пятнадцати. Многие думают, что можно просто ввести текст — и получить готовый ролик, но это далеко не так. Каждый этап требует отдельной системы. Например:

  1. Цветокоррекция старого фото — одна нейросеть.

  2. Реставрация качества — вторая.

  3. Создание нового изображения на основе старого — третья.

  4. Оживление видео — ещё одна.

  5. Добавление музыки и голосов — отдельные системы.

Сейчас я использую Nano-Banana для изображений, Kling или Veo для видео, Suno для музыки, Elevenlabs — для голосов. Это базовый комплект, который постоянно обновляется.

— Как реагирует публика и официальные структуры?

— Учителя активно показывают мои видео в школах — дети поют «Лукоморье» в новом звучании. Это очень трогательно. Но никакой поддержки нет — всё происходит по личной инициативе.

Например, предприниматели из Самары хотели сделать серию роликов о хлебной истории региона, юристы — об учебных кейсах через исторические сцены. То есть возможности огромные, но пока всё держится на энтузиастах и небольших коммерческих заказах.

Мы могли бы создать полноценный мюзикл «Руслан и Людмила» — трёхчасовую постановку. Но это полгода непрерывной работы. Такие проекты требуют системной поддержки, которой сейчас, к сожалению, нет.

— В такой работе важно знание истории и культуры. Помогают ли профессиональные историки, художники?

— Пока я делаю всё сам. Нейросети помогают держать контекст. Достаточно задать: «дом на Руси» — и она создаст визуал, близкий к историческому облику. Перед этим я провожу глубокий поиск по теме: собираю весь контекст, биографии, детали эпохи — и модель обращается к ним при генерации.

Если бы был полноценный коллектив, конечно, результат стал бы ещё глубже, но точность уже сейчас довольно высокая — современные ИИ знают, что, скажем, в 1920 году машин почти не было, и не добавят их в кадр.

Серебряный век ближе, чем кажется

— Тебе ближе Серебряный век. Почему именно он?

— Наверное, потому что это время перехода. Пушкин и Лермонтов — величественные, «небесные» фигуры. А Есенин и Маяковский — более человеческие, земные. Их язык нам понятнее.

Я писал стихи с подросткового возраста, есть и собственные песни. В школе для меня Маяковский был откровением, сейчас ближе Есенин. Серебряный век мне кажется более естественным, чем Золотой.

— Какие исторические эпохи наиболее интересны?

— Поначалу я думал, что людям интересен период СССР, но оказалось — царская Россия более восстребованна, особенно эпоха Николая II. Она вызывает больший отклик. Делал ролики с Романовыми — и на них реагирует весь мир.

Да и в самой России сейчас ощущается возвращение интереса к «досоветской» идентичности. Тогда было предпринимательство, ремесло, хлеб пекли на заквасках — мы во многом к этому возвращаемся.

— Хотел бы жить в то время?

— Нет. (Смеётся.) Достаточно вспомнить стоматологию того времени — без анестезии! Даже советская была страшной. Сейчас всё иначе — светло, чисто, комфортно. После таких сравнений точно понимаешь, что XXI век лучше.

Жизнь в реальности или в шлеме: технооптимизм без побега из мира

Источник: DJ БлокNote

— Каким видишь будущее этой технологии?

— Думаю, мы идём к тому, что сможем не только «слышать» поэтов, но и разговаривать с ними — ведь можно собрать все данные о человеке: тексты, портреты, воспоминания современников. И нейросеть сможет воссоздать личность максимально близко.

Уже скоро мы сможем оказаться в своём прошлом — например, «пройтись» по комнате детства, восстановленной по старым VHS-записям. Это не фантазия — технологии почти готовы.

Да, многие боятся виртуальной реальности, но всё зависит от того, как мы ею воспользуемся. Я технооптимист. Верю, что ИИ можно использовать во благо — в образовании, терапевтических практиках.

Мне, например, близка идея создания виртуальной «встречи» с человеком, которому вы не успели что-то сказать. Это может быть мощной психологической практикой. Если технологии способны помочь людям преодолеть боль — почему нет?

— Получается, будущее не в побеге от реальности, а в её улучшении?

— Да. Я думаю: если человеку нравится то, что он видит за окном — он не захочет уходить в виртуальность. Но если вокруг бетон и серость, тогда люди начнут искать замену. Природа, города, комфортная жизнь — всё это остаётся важнее любого VR. Нам нужно строить города, где хочется гулять, а не прятаться в шлеме виртуальной реальности.