Обзор российских AI-сервисов и приложений: знай наших!

Последние несколько лет ознаменовались для IT-отрасли небывалым прорывом в развитии технологий машинного обучения и систем искусственного интеллекта (Artificial Intelligence, AI) на базе нейронных сетей. Значительного прогресса в этой области удалось добиться OpenAI, Microsoft, Google, Meta*, Baidu и прочим иностранным компаниям. Не отстают от современных тенденций и российские разработчики, решения которых зачастую остаются в тени раскрученных зарубежных брендов. Мы сочли такое положение дел несправедливым и составили свою подборку отечественных AI-сервисов — все они открыты для широкой аудитории, а оценить заложенный в них потенциал можно здесь и сейчас, без всяких записей в списки ожидания, получений пригласительных ссылок и прочих ограничений.

 Источник изображения: pikisuperstar / freepik.com

Источник изображения: pikisuperstar / freepik.com

Генератор пьес «НейроСтаниславский»

Разработчик: НИТУ «МИСиС».
Сайт проекта: itatmisis.ru/theatre.

Разработка студентов Национального исследовательского технологического университета «МИСиС», построенная на базе общедоступной нейросети ruGPT-3, которая была дополнительно обучена на произведениях русских классиков — Островского, Чехова, Горького и других. Молодые инженеры написали алгоритм, который изучил десятки пьес и выделил из них 14 тысяч диалогов. Созданная таким образом база данных легла в основу «НейроСтаниславского». «Мы живём в такое время, когда важно искать новые и даже неожиданные возможности для применения искусственного интеллекта. В будущем нейронные сети смогут внести огромный вклад в развитие театрального искусства, а сегодня мы делаем значительный шаг на пути к этому», — убеждены авторы проекта.

 Коллектив разработчиков генератора пьес «НейроСтаниславский» (источник фото: пресс-служба НИТУ «МИСиС»)

Коллектив разработчиков генератора пьес «НейроСтаниславский» (источник фото: пресс-служба НИТУ «МИСиС»)

Голосовой помощник «Алиса»

Разработчик: «Яндекс».
Сайт сервиса: yandex.ru/alice.

Отечественная альтернатива виртуальным ассистентам Apple Siri, Google Assistant и Amazon Alexa, впервые представленная широкой публике в октябре 2017 года. За время своего развития «Алиса» научилась многим вещам и приобрела новые навыки: она отлично владеет русским языком, умеет давать быстрые ответы на вопросы и прокладывать маршруты, рассказывать сказки детям, вызывать такси, совершать покупки в интернет-магазинах, играть в различные игры, распознавать фотографии, рисовать картины, управлять «умным» домом, а также выполнять прочие действия. Отличительными особенностями «Алисы» являются умение общаться на отвлечённые темы и возможность встраивания голосового помощника в различные системы. Кроме того, сервис может запоминать голоса пользователей и автоматически подстраиваться под интересы конкретного собеседника.

«Алиса» представлена в составе программных решений «Яндекса» для различных операционных систем. Голосовой ассистент является ключевым элементом «умных» колонок «Яндекс.Станция», а также интегрирован в медиаустройства на базе платформ «Яндекс.ТВ» и «Яндекс.Авто».

 «Яндекс.Алиса»

«Яндекс.Алиса»

Голосовой помощник «Маруся»

Разработчик: VK.
Сайт сервиса: marusia.vk.com.

Интеллектуальная голосовая система в исполнении интернет-холдинга VK (бывшего Mail.ru Group). «Маруся» может выполнять различные голосовые команды, умеет отвечать на вопросы, переводить любые фразы с русского на иностранные языки, управлять устройствами «умного» дома и многое другое. Значительный акцент сделан разработчиками на поддержке ассистентом так называемых детских навыков, позволяющих родителям занять ребёнка. Голосовой помощник может развлечь маленьких пользователей развивающими играми, загадками, викторинами, сказками (в том числе с дополненной аудиореальностью), стихами и музыкой из специальных плейлистов. «Маруся» сама определяет по голосу ребёнка и автоматически активирует детский режим. Воспользоваться сервисом можно в одноимённом приложении для iOS и Android, почте Mail.ru, браузере «Атом», социальной сети «ВКонтакте», фирменных колонках «Капсула» и российской версии Mi Smart Speaker от Xiaomi.

 «Маруся»

«Маруся»

Голосовой помощник «Салют»

Разработчик: «Сбер».
Сайт сервиса: salute.sber.ru.

Голосовой помощник, интегрированный в экосистему продуктов «Сбера» и умеющий вести диалог с пользователем от лица трёх виртуальных персонажей с разными голосами, характерами и стилем общения. «Салют» доступен в одноименном мобильном клиенте, банковском приложении «Сбербанк Онлайн», на смарт-устройствах Sber, а также на телевизорах под управлением «Салют ТВ». Помимо базовых возможностей (сообщить погоду, установить будильник, ответить на вопрос, включить музыку) ассистент умеет управлять умным домом, переводить деньги, оплачивать мобильную связь, заказывать продукты в интернет-маркетах, записывать пользователя в салон красоты или к врачу и решать прочие повседневные задачи. Поддерживаются детский режим с возрастными ограничениями и возможность использования голосового помощника в качестве продвинутого автоответчика на смартфонах.

 «Салют»

«Салют»

Инструмент Colorize для раскрашивания чёрно-белых фото и видео

Разработчик: Александр Кожевин.
Сайт сервиса: colorize.cc.

Сервис, использующий технологии искусственного интеллекта для раскрашивания чёрно-белых фотографий и видеороликов, а также реставрации старых снимков, улучшения изображений и их масштабирования без потери качества. Работа с Colorize реализована по принципу «проще не бывает»: загружаем требующий обработки файл и спустя некоторое время получаем результат. В бесплатной версии системы возможности AI-движка существенно урезаны и имеются многочисленные ограничения. Для активации всех функций сервиса разработчиком предлагается три тарифа, самый дешёвый из которых стоит 600 рублей и имеет лимит в 50 снимков. Обработка видео оплачивается по отдельному прейскуранту и оценивается минимум в 60 долларов США.

 Colorize

Colorize

Инструмент для реставрации старых фотографий

Разработчик: VK.
Сайт сервиса: 9may.mail.ru/restoration.

Бесплатный AI-сервис, позволяющий за считаные секунды привнести яркие краски в старые монохромные фотографии и вдохнуть в них новую жизнь. В основу разработки положены технологии компьютерного зрения Vision от VK Cloud, которые не только раскрашивают чёрно-белые снимки, но и производят их реставрацию — удаляют мелкие царапины, устраняют дефекты и повышают качество изображения.

 AI-разработка компании VK

AI-разработка компании VK

Инструмент перефразирования текстов ReText.AI

Разработчик: ИП Шкряба О.С.
Сайт сервиса: retext.ai.

Система на базе искусственного интеллекта, предназначенная для работы с текстовыми документами. ReText.AI позволяет перефразировать текст с подбором синонимов, а также сокращать либо увеличивать его объем без потери смысловой составляющей. Поддерживаются русский, английский, украинский и белорусский языки. По заверениям разработчиков, сервис может пригодиться школьникам и студентам при написании рефератов, сочинений, курсовых и дипломных работ. Также ReText.AI может выступить в роли полноценного ассистента для писателей, журналистов, редакторов, блогеров, копирайтеров, рерайтеров и SMM-специалистов. Для рядовых пользователей в системе установлено множество ограничений, оформившим платную подписку (от 250 рублей в месяц) предлагается полный набор функций.

 ReText.AI

ReText.AI

Нейросетевой сервис генерации текстов «Балабоба»

Разработчик: «Яндекс».
Сайт сервиса: yandex.ru/lab/yalm.

Инструмент, способный на основе введённых пользователем фраз сочинять связные тексты на любую тему в разных стилях, будь то народные мудрости, телевизионные репортажи, предсказания и др. В основу «Балабобы» положена облегчённая версия нейросети YaLM 100B для генерации и обработки текстов на русском и английском языках. Программисты «Яндекса» честно признают, что у разработанного ими AI-сервиса нет своего мнения или знания. Он умеет только подражать — составлять фразы так, чтобы они были максимально похожи на реальные тексты из интернета. Именно по этой причине «Балабоба» порой может выдавать очень странные тексты, а сам сервис подходит лишь для развлечения.

 «Балабоба»

«Балабоба»

Нейросеть «Шедеврум» для генерации картинок по текстовому описанию

Разработчик: «Яндекс».
Скачать приложение: Google PlayApp Store.

Прототип нейросети «Яндекса» для генерации изображений по текстовым запросам пользователей. «Шедеврум» понимает русский и английский языки, очень любит конкретику, способен подражать известным живописцам и творить в заданных художественных стилях. Для доступа к системе необходимо установить мобильную программу, представленную в версиях для Android и iOS.

Нейронная сеть «Шедеврума» формирует иллюстрации по методу каскадной диффузии: сначала создаёт картинки в соответствии с запросом, а затем поэтапно увеличивает их разрешение, насыщая деталями. Первую версию генеративной модели разработчики обучили на 240 миллионах примеров изображений с текстовыми описаниями. На подходе — следующее обновление системы, которая в настоящий момент проходит обучение на наборе данных из 500 млн примеров и существенно повысит качество генерируемой искусственным интеллектом графики.

 «Шедеврум»

«Шедеврум»

Нейросеть Kandinsky 2.1 для генерации картинок по текстовому описанию

Разработчик: «Сбер».
Сайт проекта: sberbank.com/promo/kandinsky.

Новая генеративная модель «Сбера», способная создавать высококачественные изображения по их текстовому описанию на естественном языке. Она также может смешивать несколько рисунков, изменять их по текстовому описанию, генерировать иллюстрации, похожие на заданное, дорисовывать недостающие части картинки и формировать изображения в режиме бесконечного полотна. Сервис понимает запросы на 101 языке (включая русский и английский) и умеет рисовать в различных стилях (3D-рендер, картина маслом, рисунок карандашом, студийное фото, хохлома, ренессанс, классицизм, аниме, мозаика и многие другие).

 Kandinsky 2.1

Kandinsky 2.1

Kandinsky 2.1 представляет собой развитие предыдущей версии AI-системы, обученной на одном миллиарде пар «текст — изображение». Обновлённая модель дополнительно обучена на 170 млн иллюстраций высокого разрешения с текстовыми описаниями и на отдельно собранном датасете из двух миллионов примеров, содержащих тексты, лица людей и прочие сложные для генеративных нейросетей графические элементы. В основу сервиса также легла новая модель автоэнкодера, которая задействована в том числе в качестве декодера векторных представлений изображений. По словам представителей «Сбера», перечисленные доработки позволили кардинально улучшить генерацию иллюстраций в высоком разрешении.

Сервис закадрового перевода видео

Разработчик: «Яндекс».
Сайт проекта: yandex.ru/company/technologies.

Система машинного перевода видео, которая позволяет смотреть с русской многоголосой озвучкой ролики на английском, немецком, французском, испанском и китайском языках. Синхронный закадровый перевод доступен в «Яндекс.Браузере» для Windows, macOS, Linux и Android, а также в фирменном приложении «Яндекса» для iOS и Android. Чтобы запустить перевод, нужно нажать на кнопку с логотипом «Яндекс.Переводчика». Поддерживается перевод роликов, размещённых на YouTube, Vimeo, Twitch и ещё нескольких популярных платформах. Главное, чтобы видео находилось в общем доступе, а его продолжительность не превышала 4 часов.

 Система закадрового перевода «Яндекса»

Система закадрового перевода «Яндекса»

В основу сервиса положены несколько технологий «Яндекса» — это распознавание речи, синтез речи, биометрия и машинный перевод, использующие сложные нейросетевые модели. Сначала система распознавания речи преобразует сказанное в кадре в текст, расставляет знаки препинания и распределяет слова по смысловым сегментам. Затем технология машинного перевода переводит полученный текст на русский язык, а модуль синтеза речи озвучивает результат, который накладывается на видео таким образом, чтобы фразы в оригинале и в переводе совпадали друг с другом по длине. Для распознавания голосов разных людей на видео применяется ещё одна нейросеть, которая анализирует спектрограмму звуковой дорожки и отмечает фрагменты, сказанные разными людьми. Таким образом становится ясно, кто из спикеров что произнёс, и воспринимать перевод с большим количеством действующих лиц становится намного легче.

Система синтеза речи SteosVoice

Разработчик: Mind Simulation.
Сайт сервиса: cybervoice.io.

AI-платформа для преобразования текста в аудиофайлы. Может использоваться для озвучивания YouTube-роликов, персонажей в игровых приложениях, создания подкастов и голосовых систем. В библиотеке SteosVoice представлено более полусотни уникальных голосов, говорящих на русском и английском языках, также имеется возможность загрузки в систему собственных голосов и настройки ритмо-интонационных характеристик синтезируемой речи. Для оценки функциональных возможностей сервиса предусмотрен бесплатный Telegram-бот. Полный набор включённых в систему синтеза речи инструментов предоставляется по подписке (от 100 рублей в месяц).

 SteosVoice

SteosVoice

Умная камера «Яндекса»

Разработчик: «Яндекс».
Скачать приложение: Google PlayApp Store.

Интеллектуальная камера, представленная в приложениях «Яндекса» для мобильных устройств. В режиме реального времени распознаёт предметы, рассказывает, что видит, и советует, где купить. А ещё — сканирует документы, переводит надписи и решает математические уравнения.

Камера использует технологии искусственного интеллекта и компьютерного зрения: специальные нейронные сети обучены на огромном числе примеров, благодаря чему могут идентифицировать самые разные попадающие в объектив объекты. С помощью умной камеры «Яндекса» можно за считаные секунды перевести вывеску, меню или этикетку на иностранном языке, узнать породу животного, вид растения или название достопримечательности, а также найти магазин, где можно купить рюкзак как у прохожего или похожий. Кроме того, она позволяет увидеть прекрасное в самых обычных вещах, будь то цветок на окне или лавочка в парке: стоит навести на них камеру — и «Яндекс» попробует найти поэтические строки с их упоминанием.

 Умная камера «Яндекса»

Умная камера «Яндекса»

Заключение

Рынок программных решений на базе искусственного интеллекта — как мировой, так и российский — развивается семимильными шагами. Если пять лет назад «умные» сервисы воспринимались как экзотика, то сейчас ими уже никого не удивишь: электронная техника понимает нас с полуслова, отвечает на вопросы, общается с нами, с лёгкостью справляется с различными повседневными задачами — и это лишь верхушка огромного айсберга возможностей, которые таят в себе AI-технологии.

Прогресс не остановить. И нет никаких сомнений в том, что в перспективе ближайших десятилетий, c совершенствованием квантовых и фотонных вычислений, интернета вещей и робототехники, нас ждёт качественный скачок в развитии систем искусственного интеллекта, способных кардинально изменить жизнь человека. Самое главное — чтобы эти перемены были только к лучшему.

* Внесена в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности».

Источник:

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Переводчик »