Intel представила огромные наборы данных, которые обучение ИИ распознаванию речи

На проходящей в эти дни ежегодной конференции Neural Information Processing Systems (NeurIPS), которая посвящена искусственному интеллекту и машинному обучению, компания Intel представила два проекта, которые связаны с распознаванием и транскрибированием разговорного языка. Проект The People’s Speech нацелен на решение задач «автоматического распознавания речи», тогда как проект Multilingual Spoken Words Corpus (MSWC) предназначен для «поиска ключевых слов».

Источник изображения: Intel

В рамках каждого из проектов были созданы наборы данных, содержащие значительный объём аудиоданных и входящие в число крупнейших коллекций в своём классе. Обе инициативы были запущены в 2018 году, чтобы определить и свести в единый набор данных 50 наиболее используемых языков мира, а затем найти применение этой информации. В рамках The People’s Speech и MSWC инженеры Intel сотрудничали с коллегами из Alibaba, Oracle, Google, Baidu и др.

В рамках проекта People’s Speech разработчики создали набор данных, включающий в себя десятки тысяч часов контролируемого разговорного аудио. В настоящее время это один из крупнейших в своём классе наборов данных на английском языке, лицензированный для академического и коммерческого использования и доступный для бесплатного скачивания.

В это же время MSWC — это набор аудиоречевых данных, содержащий более 300 тыс. ключевых слов на десятках языках и доступный для интеллектуальных устройств. Набор данных MSWC охватывает языки, на которых разговаривают более 5 млрд человек и способствует разработке голосовых приложений для широкой аудитории. Оба набора данных будут доступны разработчикам.

Источник: Intel

Лента

Спецслужбы удаленно взрывают пейджеры и рации. Могут ли они уничтожить обычные смартфоны россиян?

Трудности майнинга. Почему новички рискуют стать банкротами?

Думаете, VPN спасает вас от слежки? Это не так

«Я не хочу суетиться» Россияне все чаще увольняются одним днем. Что заставляет их менять работу в такой спешке?

Программы для оценки производительности Windows

Stuxnet: Вирус, изменивший правила кибервойн

30 лет назад главного криминального авторитета Москвы взорвали в его машине. Кто и почему убил знаменитого Сильвестра?

Tails: гарантия анонимности или иллюзия безопасности?

Как обезопасить ваш веб-сайт? 13 эффективных советов

DDoS L4 vs L7: Что вам нужно знать

Код, пароли, уязвимости: «Газинформсервис» в лабиринтах Standoff

Open XDR vs Native XDR: особенности интеграции в IT-среду

Fortis CyberRoom: Узнайте, как за 24 часа защитить компанию от кибератак

Плаваете в ИИ-терминологии? Исправим это за 5 минут

Децентрализованные мессенджеры: выбираем самый безопасный способ общения

В российских регионах массово развивается майнинг. Как он изменит экономику страны?

Страх и ненависть в Алжире (Секретная вооружённая организация OAS)

«Хозяин будет доволен» 75 лет назад в СССР взорвали первую атомную бомбу. Как это было?

Intel представила огромные наборы данных, которые обучение ИИ распознаванию речи

Понравилось это:

Добавить комментарий Отменить ответ

Лента

Поделиться ссылкой:

Понравилось это:

Добавить комментарий Отменить ответ