Генеративная модель Сбера Kandinsky подводит итоги прошлого года. По данным разработчиков, нейросеть создала более 200 млн генераций по текстовым запросам, а ее аудитория превысила 12 млн уникальных пользователей. Модель заняла первое место по темпу роста и стала второй после Stable Diffusion по популярности среди разработчиков по версии AI-ресурса Hugging Face, где собраны лучшие open source-решения.
Kandinsky понимает запросы из широкого списка тем более чем на 100 языках, пользователи могут создавать фотореалистичные изображения в неограниченном количестве, применяя самые разные стили. Модель также умеет менять отдельные объекты и целые области на картинке, смешивать несколько рисунков, дорисовывать изображение, создавать картины в режиме бесконечного полотна (inpainting/outpainting). Нейросеть хорошо знает отечественный культурный код: архитектурные достопримечательности, объекты и элементы народного искусства.
Кроме того, пользователи Kandinsky могут создавать четырёхсекундные анимационные ролики и полноценные видео длиной до восьми секунд. Таким образом, генеративная модель Сбера помогает реализовать практически любую творческую задумку.