Активити распознавание звукового файла через Яндекс

Дата публикации: 16 сентября 2022

Описание

Новое приложение от IT-Solution работает с API Яндекс и позволяет распознавать звуковые файлы. Получите расшифровку аудиофайла со звонком в текстовом виде!
Транскрибация аудио в текст — перевод человеческой речи в текстовый формат. Она позволяет решать множество задач, связанных с обучением персонала, созданием контента, расшифровки интервью и при создании субтитров.

С помощью транскрибации можно создавать статьи на основе информационного материала, предоставленного экспертом в устной форме. Она позволяет быстрее и эффективнее ставить задачи для персонала, а кроме того, ее можно использовать в качестве каркаса для создания обучающих материалов.

Дополнительно транскрибация аудио позволяет изучить процесс работы сотрудника с клиентом, выделить слабые стороны работы с возражениями, соблюдения последовательности, презентации, закрытия сделки и т. д. Она помогает повысить эффективность каждого сотрудника и уменьшить количество отказов со стороны потенциальных покупателей.

Что такое транскрибация

Расчет расходов на транскрибацию текста можно подсчитать в зависимости от его типа, использования специфических для отрасли терминов и, главное, скорости печати.

Средний темп разговорной речи русскоговорящего человека составляет около 120 слов в минуту и чтобы вести транскрибацию аудио в текст, необходимо набирать по меньшей мере 700 символов за этот же промежуток времени. Средняя скорость набора текста у специалистов — около 400–500 ударов по клавишам ежеминутно. При этом транскрибированный текст — для упрощения его восприятия — должен содержать знаки препинания и не иметь грамматических ошибок. Получается, что самостоятельно можно провести транскрибацию 1 минуты аудио в текст за 4–5 минут. Часовая запись отнимает не менее 5 часов рабочего времени. Супервайзер, готовящий обучающие материала для своей команды или любой другой сотрудник, могли бы потратить на выполнение своих прямых обязанностей — увеличение прибыли компании.

Существует другой вариант — наем специалиста, занимающегося транскрибацией онлайн. Средняя стоимость на такую услугу колеблется от 20 до 50 рублей за минуту. Расход бюджета на перевод часового аудио в текстовый формат может быть сопоставим с оплатой труда штатного сотрудника и даже превышать ее. При этом сотрудники на аутсорсинге имеют свойства нарушать дедлайны, отношения между ними и компанией может регулироваться посредством всевозможных бирж. И даже в этом случае, рассчитывать на что-то кроме возврата средств и упущенного времени не приходится.

Себестоимость транскрибации одной минуты записи

Альтернативный способ перевода аудио в текст — использование ИИ, который не только быстрее, но и дешевле выполнит эту работу. Yandex SpeechKit переводит 1 минуту записи в текст всего за 60 копеек. Часовой монолог обойдется дешевле, чем возьмет профессионал за 1–2 минуты. Конечно, искусственный интеллект не подготовит полноценную статью. Но и работа транскрибатора не подразумевает ничего больше, чем дословный перевод аудиофайла в текстовый формат. Редактирование и форматирование текста все же потребуется делать самостоятельно. Только вместо 5 часов нужно будет потратить 10 минут.

Автоматизация работы по транскрибации и распознаванию текста

Активити «Распознавание звукового файла» — решение, совмещающее функциональность автоматизированной транскрибации аудиофайлов и интеграцию полученного результата в Битрикс24. С ее помощью можно быстрее и эффективнее просматривать результаты работы сотрудников, находить эффективные примеры скриптов и использовать их для работы с клиентами на корпоративном уровне.

Благодаря возможности получать готовый текстовый файл, можно легко и быстро отмечать слабые стороны в работе сотрудников или, наоборот, выделять положительные моменты, с которыми можно и нужно работать. Это не только ускоряет процесс обучения сотрудников из отдела продаж, но и позволяет избавиться от неправильных формулировок и неэффективных скриптов. Использование расширения активити «Распознавание звукового файла» позволяет решить комплексные задачи по построению эффективного отдела продаж, взаимодействия с клиентом. Среди преимуществ софта:

  • Быстрое распознавание речи;

  • Формирование текстового отчета внутри Битрикс24;

  • Низкая стоимость транскрибации;

  • Автоматизация контроля работы сотрудников;

  • Возможность быстрого анализа скриптов, их корректировки и улучшения.

Интеграция «Распознавания звукового файла» позволяет сэкономить не только время ключевых сотрудников и администрации, но и снизить расходы на создание эффективных, продающих скриптов и обучение сотрудников.

Чем расширение активити «Распознавание звукового файла» поможет вам

Использование активити «Распознавание звукового файла» позволяет всесторонне усовершенствовать бизнес-процессы. Она затрагивает контроль, повышение качества работы с клиентами, а кроме того — обеспечивает быстрый анализ звонков, доступ к которому всегда есть в Битрикс24. Среди преимуществ нашего приложения:

  • быстрая интеграция в Битрикс24;

  • использование API Яндекс;

  • работа с форматами LPCM, OggOpus;

  • добавление отчетности к каждому звонку;

  • быстрая выгрузка текстовых документов и распространение их внутри коллектива, даже если у них нет прав на прослушивание звонков;

  • доступная цена на транскрибацию;

  • бесплатная установка при оформлении подписки Битрикс24.Маркет плюс.


Совокупность плюсов нашего приложения позволяет эффективно работать с сотрудниками, улучшать клиентский сервис и повышать лояльность потребителя благодаря быстрому анализу и ускорению обучения всех сотрудников сразу или в индивидуальном порядке. Она упрощает контроль за действиями работников компании.

В чем преимущество нашей программы перед конкурентами

Интегрируйте активити «Распознавание звукового файла» в работу Битрикс24, и мы поможем вам снизить количество отказов, эффективно обучать персонал и ускорить процесс обучения сотрудников.

Внимание! Для работы с приложением требуется иметь оплаченное API Яндекс. Приложение работает с роботами и бизнес-процессами, убедитесь, что они доступны на вашем тарифе Битрикс24.

Ссылка на установку приложения

Настройки на стороне портала Битрикс24

Сервисный аккаунт Яндекс

Для работы с приложением понадобится:

  • сервисный аккаунт Яндекс. Инструкция здесь. У сервисного аккаунта должна быть роль администратора.
Выставьте роль администратора для распознования речи и загрузки файлов

  • API-ключ, создается внутри сервисного аккаунта. Инструкция здесь
  • для работы с роботом "Распознавание длинного звукового файла" кроме апи-ключа нужен статический ключ для работы с хранилищем и бакет
Внутри приложения вы найдете 2 вида тестера роботов (соответственно, эти же 2 типа добавляются в роботы и бизнес-процессы на портале.

API

Для работы с обоими типами вам нужен API-ключ.

Настройки на стороне Яндекс

Следуйте инструкции, чтобы его создать. Когда ключ создан, вы увидите окно, где будут коды ID и самого ключа. Сохраните их себе в безопасное место, прежде, чем закрывать окно, потому что они показываются только один раз!

Значение из поля Ключ вам понадобится для соответствующего поля в роботах, которые добавляет приложение.
Для работы с длинными звуковыми файлами в формате .mp3 вам потребуется создать еще один API-ключ - статический
Когда ключ создан, вы увидите окно, где будут коды ID и самого ключа. Сохраните их себе в безопасное место, прежде, чем закрывать окно, потому что они показываются только один раз!

ID и статический ключ понадобятся, чтобы заполнять вот эти поля робота для работы с длинными звуковыми файлами:
Бакет (Bucket)

Для работы с длинными файлами, в вашем сервисном аккаунте также потребуется создать бакет. Следуйте инструкции, чтобы его создать.

Скопируйте название вашего бакета и вставьте в соответствующее поле робота на портале
Роботы и действия БП

Приложение добавляет 2 робота и соответственно 2 действия бизнес-процессов:

  • "Распазнование звукового файла"
  • "Распознавание длинного звукового файла"
Распознание звукового файла НЕ РАБОТАЕТ С ФОРМАТОМ .MP3

Поддерживаемые форматы можно посмотреть здесь.

Распознание длинного звукового файла поддерживает .mp3, воспользуйтесь данным роботом/действием бп, если вам нужно работать с этим типом файлов.

Тестер

Чтобы проверить работу ваших роботов/действий бп, воспользуйтесь тестером внутри приложения.
    Как получить ссылку на аудиофайл с помощью бизнес-процесса

    Приложение работает с файлами, которые залиты на какой-либо хостинг с открытым доступом. Вы можете попробовать различные варианты, но в целом, чаще всего вам скорее всего понадобится работать с фалами, которые находятся на вашем портале. Ссылки на них легко можно получить, если сохранить файл в пользовательское поле.

    Рассмотрим это на примере сделок. Создадим пользовательское поле с типом Файл и сохраним туда наше аудио:

    Настройки на стороне портала Битрикс24

    Теперь создадим БП для сделок, пусть администратор получает уведомление со ссылкой на файл из этого поля:
    Внутри уведомления найдем наше поле и пропишем вот так:
    {{Имя поля > publink}}

    В нашем случае это будет:
    Выставим у шаблона запуск на изменение, поменяем что-либо внутри сделки и получим админом ссылку на файл в колокольчик:
    Скопируйте эту ссылку и используйте ее внутри роботов/действий бп приложения
    Альтернативно, вы можете прописать
    {{Имя поля > publink}}

    сразу в поле робота/действия бп

    Пример использования

    Теперь, когда все нужные значения получены, вы можете выполнить преобразование звукового файла в текст с помощью нашего приложения. На скриншоте ниже пример с длинным .mp3 аудиофайлом с записью телефонного звонка.
    Сохраните полученный текст телефонного разговора в сделку, чтобы коллеги могли увидеть, о чем был диалог с клиентом, даже если у них нет возможности прослушивать записи звонков.

    Упростите ведение бизнеса для себя и своих сотрудников

    Отправьте заявку, мы свяжемся
    с вами в ближайшее время и обсудим детали вашего вопроса.

    Смотрите также