Синтезаторы речи и Системы распознавания речи, Говорилки, Понятия, перечень, Виды, классификация |
Здравствуйте, гость ( Вход | Регистрация )
Here You Can Support Our Work and .:LavTeaM:. Services |
Синтезаторы речи и Системы распознавания речи, Говорилки, Понятия, перечень, Виды, классификация |
16.03.2024 - 16:39
Сообщение
#1
|
|
Живущий здесь Группа: Модераторы Пользователь №: 101003 Сообщений: 1833 Регистрация: 23.11.2008 Загружено: байт Скачано: байт Коэффициент: --- Спасибо сказали: 381 раз(а) |
Лучшие синтезаторы и распознаватели речи для озвучки текста 2023
Синтезаторы речи — это программы, которые преобразовывают письменный текст в аудиозапись. Они позволяют озвучивать целые текстовые документы, электронные книги или веб-страницы, создавать аудиокниги и подкасты. Говорилки – это очень удобные и практичные программы, которые используются для прочтения любого текста. Обычно такие программы поддерживают много языков, форматов текста, в них встроенных несколько вариантов голосов прочтения. Системы распознавания речи — это технология, с помощью которой речь человека возможно трансформировать в текст. Она может работать автономно, а может обучаться особенностям произношения конкретного пользователя. Распознавание голоса — часть технологии распознавания речи. Идентификацию говорящего используют при биометрической проверке, для ограничения доступа к личным файлам. Система запоминает голос человека и отличает его от других голосов. Сообщение отредактировал samsony1 - 23.04.2024 - 17:59 |
|
|
17.03.2024 - 13:06
Сообщение
#2
|
|
Живущий здесь Группа: Модераторы Пользователь №: 101003 Сообщений: 1833 Регистрация: 23.11.2008 Загружено: байт Скачано: байт Коэффициент: --- Спасибо сказали: 381 раз(а) |
Программы для чтения текста голосом на Windows
26 штук разных скачать - https://freesoft.ru/windows/reading/text/voice |
|
|
18.03.2024 - 12:15
Сообщение
#3
|
|
Живущий здесь Группа: Модераторы Пользователь №: 101003 Сообщений: 1833 Регистрация: 23.11.2008 Загружено: байт Скачано: байт Коэффициент: --- Спасибо сказали: 381 раз(а) |
программы Говорилки
ТОП 20 лучших Подробнее - https://free-video-editors.ru/luchshiye-sintezatory-rechi.php |
|
|
22.03.2024 - 12:12
Сообщение
#4
|
|
Живущий здесь Группа: Модераторы Пользователь №: 101003 Сообщений: 1833 Регистрация: 23.11.2008 Загружено: байт Скачано: байт Коэффициент: --- Спасибо сказали: 381 раз(а) |
еще одна подборка говорилок ТОП-20
1. AiMyVoice - недавно созданный и уникальный в своем роде сервис синтеза речи, который позволяет озвучить текст различными голосами высокого качества. На данный момент это самая качественная озвучка на русском языке, которую доводилось встречать. 2. Yandex SpeechKit - технология синтеза речи от компании Яндекс. Услуга синтезирования платная, но есть демо в котором можно озвучивать небольшие куски текста. 3. Синтез речи от ЦРТ - это реалистичный синтез русской речи на основе нейросетей. 4. Синтез речи VSrobotics - это синтезатор от компании которая занимается разработкой решений в области бизнеса и IT. 5. Синтез речи от Tinkoff - синтез речи от Тинькофф, который был разработан для банка. Присутствует два голоса - мужской и женский. Но в демо-версии можно протестировать только женский голос. 6. Синтез речи от Mail.ru - это голосовой помощник Маруся с навыками синтеза речи, TTS для озвучки текста на данный момент нет, но этот голосовой движок пригодится для озвучки новостей из раздела Mail.News. 7. Озвучка при помощи Яндекс Алисы - Алиса это голосовой помощник, который недавно наделили возможностью озвучивать веб-страницы. Функционал уже встроен в Яндекс браузер. 8. Texttospeech - веб-ресурс с подборкой голосовых движков для разных стран мира. В базе имеется 145 голосов и она постоянно пополняется. 9. ApiHost - сервис занимающийся синтезом речи на основе существующих движков, записью голоса и искажением, а также анализом текста. 10. TexttoSpeechRobot - ресурс с множеством TTS под разные страны. Каждый tts'ник имеет много голосов на выбор, например русский имеет 23 голоса. 11. Zvukogram - сервис озвучки текста который в своих базах имеет реалистичные голоса на основе нейросетей, есть премиальные голоса, они имеют пометку *pro. 12. Unitools.Tech - качественная озвучка текста онлайн, сервис очень похож на предыдущий из нашего списка. Есть поддержка 6 языков, в наличии 13 голосов, но после регистрации будет доступно больше качественных голосов. 13. OddCast - сервис синтеза речи с голосами Vocalware, а также голосами Nuance, такими как Daniel (голос MLG) и Samantha (старый голос Siri). Поддерживаются 24 языка, русского к сожалению нет. 14. NaturalReaders - сервис синтеза речи на основе голосов из Acapela, AT&T, Nuance и других, есть бесплатная пробная версия, но в ней нет PRO-версий голосов. Подойдет для озвучивания англоязычной информации. 15. Acapela-box - tts от разработчиков голосовых движков acapela. Синтезатор устаревший и главное пользоваться им можно только имея платный аккаунт. При тестировании демо-версии звук сопровождается мелодией. 16. TTSmp3 - простенький mp3 блокнот для перевода текст в звук. В базе имеется несколько десятков языковых пакетов, в том числе и русский, правда русские голоса самые простые, взятые с балаболки. 17. Google Cloud Text-to-Speech - синтез речи от компании Google, голоса используются WaveNet. Сервис платный, но демка дает возможность оценить возможности и даже озвучивать бесплатно небольшие куски текста. 18. VoiceMaker - название сервиса говорит само за себя. Инструментарий позволяет синтезировать аудио из текста и применять звуковые эффекты. В базе имеются хорошие голоса для синтеза английской речи, в том числе на основе нейросетей. 19. MelroseLabs TTS - синтезатор от компании, которая занимается решением IT задач для бизнеса. 20. IBM Watson Text to Speech - синтезатор от компании IBM, очень похожий на синтез от Google. От недавнего времени чтобы пользовать демкой нужно регистрировать аккаунт. 21. Nuance TTS - синтезатор от американской компании-разработчика ПО. Многие голоса повторяются, но есть все же уникальные, которые встречаются только в этом tts'нике. 22. Wideo TTS - десятки голосов с поддержкой разных языков мира. Подойдет для озвучки англоязычных текстов. Поддержка русского есть, но голосовые движки устаревшие. 23. Azure TTS - синтезатор от Microsoft. подробнее - https://dzen.ru/a/YF5AR8Wec2Ha715R Сообщение отредактировал samsony1 - 26.03.2024 - 14:09 |
|
|
23.03.2024 - 14:05
Сообщение
#5
|
|
Живущий здесь Группа: Модераторы Пользователь №: 101003 Сообщений: 1833 Регистрация: 23.11.2008 Загружено: байт Скачано: байт Коэффициент: --- Спасибо сказали: 381 раз(а) |
Системы распознавания речи
1. Описание Это приложение обычно используется блоггерами, YouTubерами и подкастерами для транскрибирования их аудио и голоса в письменный формат. Он выполняет работу по распознаванию речи, превращая ваш звук и голос в текст. Помимо транскрипции, вы можете редактировать видео или легко записывать свой экран. 2. Dragon Professional Это платная, но профессиональная программа для распознавания речи. Одна из удивительных особенностей этого приложения заключается в том, что оно позволяет управлять всей системой с помощью одного только голоса. Вы можете открывать любые приложения, запускать любые программы, отправлять сообщения кому угодно и писать все, что захотите. Но для управления им нужен ваш голос. Вы можете приобрести его за $150, $300 или $500 в зависимости от продаваемой версии, а также оплачивать ежемесячно или ежегодно. 3. Писец экспресс Среди лучших программ для распознавания речи эта - одна из них. Она бесплатна для всех и может быть обновлена за небольшую плату. Это распознавание речи, которое ускорит скорость вашего письма, потому что вам больше не придется набирать текст. Просто говорите, и текст будет готов в вашем текстовом документе! 4. Sonix.ai Это онлайн-платформа для преобразования речи в текст. Он может преобразовать вашу аудиозапись или запись в текстовый документ. Вы также можете попробовать его бесплатно, чтобы понять, подходит ли он для вашей профессиональной работы. Программа распознавания речи Sonix.ai - это быстрая и интересная платформа для выполнения работы в режиме онлайн. За продвинутые функции вы будете платить около 10 долларов США в час. 5. Диктант.io Это бесплатная программа распознавания речи, которая поможет вам легко писать документы, электронные письма и проекты без необходимости их печатать. Это бесплатная онлайн-платформа, которая работает как система преобразования речи в текст на сайте. 6. Happy Scribe Happy Scribe также входит в состав бесплатного программного обеспечения для распознавания речи. Она позволяет конвертировать аудиофайлы в текст в режиме онлайн в Google. Он может быть переведен на более чем 110+ языков. Программа может сократить ваши усилия по написанию чего-либо путем набора текста, поскольку она работает в режиме онлайн и является бесплатной, не требуя оплаты. 7. Текстер речи Это бесплатная, широко известная и простая в использовании программа для распознавания речи. Speech Texter имеет быстрые онлайн функции, которые улучшат скорость написания заметок. В основном он известен как программное обеспечение Speech-to-Text (STT). 8. IBM Watson Speech to Text Наконец, в очередной раз создание этой бесплатной онлайн-программы для распознавания речи поразит вас. С его помощью можно очень быстро превратить ваш голос или аудиозапись в письменный документ. Эта программа преобразования текста в речь доступна в демонстрационной, бесплатной и платной версиях. Вы можете попробовать его бесплатно, чтобы проанализировать его и улучшить свое профессиональное развитие. Его демо-версия также доступна на сайте. источник - https://filmora.wondershare.com.ru/audio/best-voice-recognition-software.html Сообщение отредактировал samsony1 - 23.03.2024 - 14:06 |
|
|
28.03.2024 - 13:42
Сообщение
#6
|
|
Живущий здесь Группа: Модераторы Пользователь №: 101003 Сообщений: 1833 Регистрация: 23.11.2008 Загружено: байт Скачано: байт Коэффициент: --- Спасибо сказали: 381 раз(а) |
Классификация систем распознавания речи
Каждая такая система имеет некоторые задачи, которые она призвана решать и комплекс подходов, которые применяются для решения поставленных задач. Рассмотрим основные признаки, по которым можно классифицировать системы распознавания человеческой речи и то, как этот признак может влиять на работу системы. Размер словаря. Очевидно, что чем больше размер словаря, который заложен в систему распознавания, тем больше частота ошибок при распознавании слов системой. Например, словарь из 10 цифр может быть распознан практически безошибочно, тогда как частота ошибок при распознавании словаря в 100000 слов может достигать 45%. С другой стороны, даже распознавание небольшого словаря может давать большое количество ошибок распознавания, если слова в этом словаре очень похожи друг на друга. Дикторозависимость или дикторонезависимость системы. По определению, дикторозависимая система предназначена для использования одним пользователем, в то время как дикторонезависимая система предназначена для работы с любым диктором. Дикторонезависимость – труднодостижимая цель, так как при обучении системы, она настраивается на параметры того диктора, на примере которого обучается. Частота ошибок распознавания таких систем обычно в 3-5 раз больше, чем частота ошибок дикторозависимых систем. Раздельная или слитная речь. Если в речи каждое слово разделяется от другого участком тишины, то говорят, что эта речь – раздельная. Слитная речь – это естественно произнесенные предложения. Распознавание слитной речи намного труднее в связи с тем, что границы отдельных слов не четко определены и их произношение сильно искажено смазыванием произносимых звуков. Назначение. Назначение системы определяет требуемый уровень абстракции, на котором будет происходить распознавание произнесенной речи. В командной системе (например, голосовой набор в сотовом телефоне) скорее всего, распознавание слова или фразы будет происходить как распознавание единого речевого элемента. А система диктовки текста потребует большей точности распознавания и, скорее всего, при интерпретации произнесенной фразы будет полагаться не только на то, что было произнесено в текущий момент, но и на то, как оно соотносится с тем, что было произнесено до этого. Также, в системе должен быть встроен набор грамматических правил, которым должен удовлетворять произносимый и распознаваемый текст. Чем строже эти правила, тем проще реализовать систему распознавания и тем ограниченней будет набор предложений, которые она сможет распознать. Различия методов распознавания речи При создании системы распознавания речи требуется выбрать, какой уровень абстракции адекватен поставленной задаче, какие параметры звуковой волны будут использоваться для распознавания и методы распознавания этих параметров. Рассмотрим основные различия в структуре и процессе работы различных систем распознавания речи. По типу структурной единицы. При анализе речи, в качестве базовой единицы могут быть выбраны отдельные слова или части произнесенных слов, такие как фонемы, ди- или трифоны, аллофоны. В зависимости от того, какая структурная часть выбрана, изменяется структура, универсальность и сложность словаря распознаваемых элементов. По выделению признаков. Сама последовательность отсчетов давления звуковой волны – чрезмерно избыточна для систем распознавания звуков и содержит много лишней информации, которая при распознавании не нужна, либо даже вредна. Таким образом, для представления речевого сигнала из него требуется выделить какие-либо параметры, адекватно представляющие этот сигнал для распознавания. По механизму функционирования. В современных системах широко используются различные подходы к механизму функционирования распознающих систем. Вероятностно-сетевой подход состоит в том, что речевой сигнал разбивается на определенные части (кадры, либо по фонетическому признаку), после чего происходит вероятностная оценка того, к какому именно элементу распознаваемого словаря имеет отношение данная часть и (или) весь входной сигнал. Подход, основанный на решении обратной задачи синтеза звука, состоит в том, что по входному сигналу определяется характер движения артикуляторов речевого тракта и, по специальному словарю происходит определение произнесенных фонем. источник - https://habr.com/ru/articles/64572/ Сообщение отредактировал samsony1 - 28.03.2024 - 13:44 |
|
|
27.06.2024 - 17:12
Сообщение
#7
|
|
Живущий здесь Группа: Модераторы Пользователь №: 101003 Сообщений: 1833 Регистрация: 23.11.2008 Загружено: байт Скачано: байт Коэффициент: --- Спасибо сказали: 381 раз(а) |
Сегодня много кто решает повседневные задачи на ходу — с телефона. С его помощью можно проверить почту, отправить документы и фотографии, найти ближайший банкомат или построить автомобильный маршрут. Не для всех подобных задач удобно пользоваться клавиатурой, поэтому сейчас одно из самых актуальных направлений мобильной разработки — это управление голосом.
В основе голосового управления лежит технология распознавания речи. В ней задействованы достижения различных областей: от компьютерной лингвистики до цифровой обработки сигналов. На конференции YaC 2013 в начале октября Яндекс представил свою технологию распознавания речи, и сегодня мы хотели бы рассказать о том, как она работает. Акустическая модель Если сказать голосовому поиску «Лев Толстой», смартфон услышит не имя и фамилию, не два слова, а звуковой сигнал, в котором звуки плавно перетекают друг в друга, не имея чётких границ. Задача системы распознавания речи — восстановить по этому сигналу, что было сказано. Ситуацию осложняет то, что одна и та же фраза, произнесённая разными людьми в разной обстановке, будет давать совершенно непохожие друг на друга сигналы. Правильно интерпретировать их помогает система акустического моделирования. Когда вы произносите голосовой запрос, например, в Яндекс.Навигаторе, смартфон записывает его и отправляет на сервер Яндекса. На сервере запись разделяется на много маленьких фрагментов (фреймов) длиной 25 миллисекунд, внахлёст, с шагом 10 миллисекунд. То есть из одной секунды вашей речи получается сто фреймов. Дальше каждый из них пропускают через акустическую модель — функцию, которая определяет, какие звуки вы произнесли. На основе этих данных система, натренированная методами машинного обучения, определяет варианты слов, которые вы видите в результатах поиска. Мобильный Браузер в ответ на запрос «Лев Толстой» найдёт сайты о великом писателе, а Навигатор и Карты предложат улицу Льва Толстого. Точность результатов напрямую зависит от того, насколько хорошо система определяет произнесённые звуки. Для этого достаточно точным и полным должен быть фонетический алфавит, с которым она работает. Фонетический алфавит Яндекса В русском языке, по разным теориям, около 40 фонем (звуковых единиц). Наша система распознавания речи сопоставляет входящий речевой сигнал с фонемами, а потом уже из них собирает слова. Например, слово «Яндекс» состоит из семи фонем — [й][а][н][д][э][к][с]. Фонемы могут обладать различной длительностью, и в разбивке по фреймам слово «Яндекс» может выглядеть, например, так — [й][й][а][а][а][а][а][а][а][а][а][а][н][н][д][д][э][к][с]. Произношение любой фонемы зависит от её соседей и позиции в слове. То есть звук [а] в начале, в середине и в конце слова — это три разных [а], а звук [а] между двумя гласными в сочетании «на аудиозаписи» отличается от [а] между согласными в слове «бак». Поэтому для хорошего распознавания фонема — слишком грубая единица. Чтобы точнее смоделировать произношение фонемы, мы, во-первых, делим каждую фонему на три части: условные начало, середину и конец. Во-вторых, мы разработали свой фонетический алфавит, который учитывает позицию и контекст фонем. Брать в работу все возможные варианты контекстно-зависимых фонем было бы неблагоразумно, так как многие из них не встречаются в реальной жизни. Поэтому мы научили нашу программу рассматривать похожие звуки вместе. В результате мы получили набор из 4000 элементарных единиц — сенонов. Это и есть фонетический алфавит Яндекса, с которым работает наша технология распознавания речи. Вероятности В идеальном мире программа безошибочно определяет, какая фонема соответствует каждому фрагменту голосового запроса. Но даже человек иногда может не понять или не расслышать все звуки и достраивает слово исходя из контекста. И если человек опирается на собственный речевой опыт, то наша система оперирует вероятностями. Во-первых, каждый фрагмент голосового запроса (фрейм) сопоставляется не с одной фонемой, а с несколькими, подходящими с разной степенью вероятности. Во-вторых, есть таблица вероятностей переходов, которая указывает, что после «а» с одной вероятностью будет тоже «а», с другой — «б» и так далее. Это позволяет определить варианты последовательности фонем, а потом, по имеющимся у программы данным о произношении, морфологии и семантике — варианты слов, которые вы могли сказать. Программа также умеет восстанавливать слова по смыслу. Если вы находитесь в шумном месте, говорите не очень чётко или используете неоднозначные слова, она достроит ваш запрос исходя из контекста и статистики. Например, фразу «мама мыла…» программа с большей вероятностью продолжит как «мама мыла раму», а не как «мама мыла рану». Благодаря машинному обучению на множестве данных наша программа устойчива к шуму, хорошо распознаёт речь с акцентом, качество распознавания практически не зависит от пола и возраста говорящего. источник - https://yandex.ru/blog/company/72171?ysclid=lvc9lk36wi474474157 Сообщение отредактировал samsony1 - 27.06.2024 - 17:15 |
|
|
6.07.2024 - 10:45
Сообщение
#8
|
|
Живущий здесь Группа: Модераторы Пользователь №: 101003 Сообщений: 1833 Регистрация: 23.11.2008 Загружено: байт Скачано: байт Коэффициент: --- Спасибо сказали: 381 раз(а) |
За последнее десятилетие методы ML позволили алгоритмам обучаться на больших объемах речевых данных и усовершенствовать распознавание акцентов. Во многом это заслуга Google, создавших приложение Google Voice Search для iPhone. Миллиарды поисковых запросов позволили провести крупнейший анализ данных В 2010 году «персонализированное распознавание» появилось в голосовом поиске на телефонах Android, а потом — и в браузере Chrome. В Apple создали Siri, а в Microsoft — Cortana.
В 2012 году голосовой поиск Google стал использовать глубокие нейросети. Корпорация инвестирует $6 млрд в построение собственного Центра речевых технологий. В 2016 она открыла доступ к программным интерфейсам Cloud Speech API. Это дало возможность интегрировать голосовое управление от Google в любые программы. До разработок Google монополистом на рынке была компания Nuance, чья технология применялась в пользовательских интерфейсах (например, телевизоров и автомобилей). Именно к этой компании Apple обратились в первые дни существования Siri. Технология Nuance основана на методах статистического анализа; для распознавания слова сервис обращается к фонемам и контексту. Сегодня компания сосредоточена на разработке чат-ботов для корпоративных клиентов. С помощью ML в Nuance автоматизируют создание диалоговых моделей. Решение от Nuance Dragon Professional остается одним из лучших на рынке. Оно способно обрабатывать 160 слов в минуту с точностью 99% (сразу после завершения обучения). Сначала программа адаптируется к голосу и словам, которые обычно используете спикер. Следующий скачок стоит ожидать с появлением систем, понимающих слитную человеческую речь. Скорее всего, их авторами станут инженеры и математики из корпорации Google. Александр: «Беда Google в том, что они делают сразу все языки, а каждый из них имеет свою специфику, структура речи, акценты, диалекты. Да и сами люди говорят по-разному. Поэтому понадобится еще лет 10, чтобы технология распознавания речи speech-to-text работала совершенно. Есть и другой вопрос — а используют ли нейросети на самом деле те, кто об этом заявляет? Тот же Apple говорит, что в основе Siri — нейросети, но сама компания размещала множество вакансий на должность редактора диалогов для Siri». Автоматическое распознавание речи по-прежнему работает хуже, чем человеческое ухо. Но теперь проблема технологии — не данные, а модели. Нужно решить задачи, связанные с морфологией, акцентами, высотой звука, темпом, громкостью, сливающимися словами, артикуляцией, лингвистической информацией. Этим заняты Facebook, Amazon, Microsoft, Google и Apple. источник - https://robotdreams.cc/blog/38-raspoznavanie-rechi |
|
|
8.07.2024 - 06:38
Сообщение
#9
|
|
Живущий здесь Группа: Модераторы Пользователь №: 101003 Сообщений: 1833 Регистрация: 23.11.2008 Загружено: байт Скачано: байт Коэффициент: --- Спасибо сказали: 381 раз(а) |
Алиса - это голосовой помощник от российской компании Яндекс, который завоевал огромную популярность на территории России. Во-первых, потому что Алиса идет в комплекте с фирменным браузером, который занимает второе место среди всех веб-браузеров рунета (на первом месте Google Chrome с 41% пользователей, у Яндекса их 25% и замыкает тройку лидеров Opera с 13% интернет-пользователей). При желании Алису можно установить на ваш смартфон, недавно начался старт продаж умных телевизоров, где голосовой помощник Алиса позволяет управлять ТВ посредством голоса. Я, кстати, написал обзор про эту версию Android (да-да! в основе Яндекс.ТВ используется AOSP | ссылка на обзор будет в самом конце публикации). А еще раньше Яндекс представил миру свою умную колонку под названием Яндекс.Станция, куда и поселил Алису. И, честно говоря, первое время голосовой помощник мало что умел, часто тупил, и не сказать, что органично вписывался в жизнь пользователей - многие вещи было намного проще сделать самому. Но первые обзоры не остановили энтузиастов, и уже через 5 месяцев с момента старта продаж гаджет приобрели свыше 40 тысяч человек... а в марте этого года Яндекс отчитался об общих продажах своей умной колонки - и всего по миру их было продано более 1,3 млн экземпляров. Имейте в виду, что речь идет только об устройстве от самого Яндекса (производством умных колонок c Алисой занимаются еще и другие производители).
источник - https://dzen.ru/a/YauE3oS0ZBF53t8k?ysclid=lya05irsw4729276314 |
|
|
13.07.2024 - 15:32
Сообщение
#10
|
|
Живущий здесь Группа: Модераторы Пользователь №: 101003 Сообщений: 1833 Регистрация: 23.11.2008 Загружено: байт Скачано: байт Коэффициент: --- Спасибо сказали: 381 раз(а) |
Голосовой робот SaluteBot Voice от Сбера
Платформа для автоматизации входящих звонков для вашего бизнеса подробнее - https://developers.sber.ru/portal/products/salutebot-voice |
|
|
18.07.2024 - 12:03
Сообщение
#11
|
|
Живущий здесь Группа: Модераторы Пользователь №: 101003 Сообщений: 1833 Регистрация: 23.11.2008 Загружено: байт Скачано: байт Коэффициент: --- Спасибо сказали: 381 раз(а) |
И.Б.Тампель и А.А.Карпов
Учебное пособие Системы распознавания речи Системы автоматического распознавания речи широко применяются в медицинских исследованиях, требующих ввода информации, когда руки оператора заняты (рентгеновские), или когда требуется управлять автономными аппаратами исследования внутренних органов. читать - https://docs.yandex.ru/docs/view?tm=1721292720&tld=ru&lang=ru&name=1921.pdf&text=системы%20распознавания%20речи&url=https%3A%2F%2Fbooks.ifmo.ru%2Ffile%2Fpdf%2F1921.pdf Сообщение отредактировал samsony1 - 18.07.2024 - 12:06 |
|
|
29.07.2024 - 13:37
Сообщение
#12
|
|
Живущий здесь Группа: Модераторы Пользователь №: 101003 Сообщений: 1833 Регистрация: 23.11.2008 Загружено: байт Скачано: байт Коэффициент: --- Спасибо сказали: 381 раз(а) |
ГОЛОСОВОЙ БОТ С ЧЕЛОВЕЧЕСКИМ ЛИЦОМ: АВИТО ОБНОВИЛ ГОЛОС ПОДДЕРЖКИ
Сотрудники читали стихотворение Корнея Чуковского "У меня зазвонил телефон", чтобы пройти кастинг. Компания обновила голосового бота, сделав его более человечным и персонализированным. Теперь вместо роботизированного голоса клиенты будут слышать приветствия и инструкции от реальных сотрудников Центра клиентского сервиса. Запуск обновленного голоса Авито состоялся 29 июля одновременно во всех регионах России. Центр клиентского сервиса Авито - это более 3500 человек, которые находятся в 90 городах России. Сотрудники работают в одной из трёх команд: поддержка пользователей, ручная модерация и бизнес-процессы. В среднем один пользователь Авито обращается с запросом в поддержку 2 раза в месяц. Интерактивное голосовое меню обновили с целью повышения качества обслуживания клиентов и улучшения их пользовательского опыта. Чтобы определить претендентов на озвучку, был проведён конкурс для всей команды: в отборе могли поучаствовать как линейные сотрудники, так и руководящий состав. Участники должны были подготовить озвучку двух текстов: - Фразы, которая используется в боте сейчас. - Стихотворения К. И. Чуковского "У меня зазвонил телефон". Это стихотворение было выбрано не случайно - оно посвящено телефонной поддержке и отражает суть работы Центра клиентского сервиса. Кастинг длился 30 дней, и за это время было получено более 90 заявок. В итоге были выбраны два победителя: Александр Смирнов и Мария Жилинская - сотрудники петербургского офиса Авито. Победители конкурса озвучили более 1500 фраз из стихотворений и произведений литературы. На их основе синтезируются новые реплики для голосового бота: фразы разрезают пословно, и из нарезанных слов собирают голосовой слепок необходимой реплики. источник - https://m.tsargrad.tv/news/golosovoj-bot-s-chelovecheskim-licom-avito-obnovil-golos-podderzhki_1033667 Сообщение отредактировал samsony1 - 29.07.2024 - 13:42 |
|
|
21.08.2024 - 13:00
Сообщение
#13
|
|
Живущий здесь Группа: Модераторы Пользователь №: 101003 Сообщений: 1833 Регистрация: 23.11.2008 Загружено: байт Скачано: байт Коэффициент: --- Спасибо сказали: 381 раз(а) |
Как работает распознавание речи
...мы поговорим о том, как работает система распознавания речи. видео - https://youtu.be/PF6q8hUdKz8?si=MA5iWqx0ytQg_CY_ |
|
|
Текстовая версия | Сейчас: 16.09.2024 - 18:16 |