Браузер Microsoft Edge научился автоматически генерировать описания изображений и озвучивать их
Microsoft анонсировала новую функцию браузера Edge, которая сделает проще процесс взаимодействия с веб-контентом для людей с нарушениями зрения. Речь идёт об автоматической генерации описания изображений, что будет полезно для слабовидящих людей, использующих для работы на компьютере программы чтения с экрана.
Проще говоря, Edge теперь может в автоматическом режиме генерировать описание открытого изображения, а программа чтения с экрана будет воспроизводить этот текст пользователю. В процессе анализа и генерации описания изображения используется облачная служба Azure Cognitive Services. Когда браузер находит немаркированное изображение, он перемещает его на сервер Microsoft для обработки с помощью соответствующего алгоритма. Пользователю не требуется прикладывать каких-либо усилий, чтобы сгенерировать описания для изображений.
Новая функция работает со многими распространёнными форматами, включая JPEG, PNG, GIF и WEBP. На данный момент поддерживается создание описания на пяти языках. Вместе с этим, применяемый для генерации описания алгоритм способен распознавать текст с изображений на более чем 120 языках. Microsoft предупреждает, что на данном этапе генерация описаний может работать не идеально, поэтому в некоторых случаях текст получается не слишком качественным. Кроме того, описания не будут создаваться для изображений размером менее 50 × 50 пикселей, огромных картинок, а также контент некоторых других категорий.
Согласно имеющимся данным, новая функция появилась в последней версии Edge. Для её активации достаточно в меню «Параметры» перейти в раздел «Специальные возможности» и активировать опцию «Получать описания изображений от Microsoft для средств чтения с экрана». Функция поддерживается в Edge для Windows, Linux и macOS.
Источник: Neowin