Бесплатные нейросети для перевода голоса в текст на мобильном и ПК
Собрали несколько бесплатных сервисов, позволяющих осуществлять транскрибацию - перевод аудио в текстовый формат. Причем, как на лету, то есть непосредственно в процессе начитки текста, так и из аудиофайла.
Некоторые сервисы у вас с большой долей вероятности уже есть, например, самая популярная нейросеть от Google, нужно просто знать, как ими пользоваться. Остальные устанавливаются очень просто и впоследствии сильно облегчат вам жизнь.
#Нейросети #google
Как установить Whisper на ПК: kzread.info/dash/bejne/hGmMuLmChbTIlqw.html
Сервис для транскрибации Silero: audio-v-text.silero.ai
Чат-бот Silero: t.me/silero_audio_bot
Клавиатура SwiftKey: play.google.com/store/apps/details?id=com.touchtype.swiftkey&hl=en_US
Видео Теплицы - это уроки на русском по всем программам, которые могут вам пригодиться.
Теплица социальных технологий: te-st.ru
Теплица социальных технологий в Telegram: t.me/teplitsa
Теплица социальных технологий в facebook: TeplitsaST
Теплица социальных технологий в Instagram: teplitsast
Теплица социальных технологий в vk: TeplitsaST
Подписывайтесь на еженедельную рассылку Теплицы и получайте лучшие видеоуроки, полезные статьи и анонсы возможностей для саморазвития и командной работы:
newsletter.te-st.ru/subscribe/
Музыка: Javier Suarez (jahzzar) "Please Listen Carefully" ©
Пікірлер: 43
Спасибо за видео, часто приходится транскрибировать сессии. Пользуюсь сложной схемой-заливаю на ютуб и оттуда забираю автоматические субтитры. Попробовала Silero, ничуть не хуже сработало и даже быстрее.
Спасибо! Радует еще то, что вы рекомендуете - сами используете, это внушает доверие. К примеру Perplexity и Vivaldi.
Теплица социальных технологий я благодарю Вас :) и обстоятельства, Ваши рекомендации, советы за то, что они притянули мне такого профессионала разбираюшемся в своей сфере. Желаем Вам. Стрессоустойчивости. Океан энергии. Энергичности. Сердечного света. Мира в душе. Радостных эмоций Вдохновения в жизни и Вашем деле. Великое огромное спасибо за Ваше старания, усилие, многолетний опыт. Поддерживаем Вас искренне. Желаем Вам отличного самочувствия, бодрости тела и духа.Побольше бы таких людей как Вы. Благодарны Вам сильно присильно.Спасибо еще еще раз огромное преогромное. :)
Класс! Как раз искал что-то такое. Вот это совпадение 😊
Гугл очень помог в свое время❤ Спасибо за видео) Сервисы топ
Спасибо за видео! Очень полезно. Вспомнила, то что забыла! Успехов всем нам!
Задался вопросом расшифровки голоса, когда начались проблемы со зрением и за экраном почти нереально стало работать. В дополнение к Whisper я нашел нейронки Vosk и NeMo (от Nvidia), последнюю так и не смог развернуть у себя на ПК. Будет отлично, если по каждой из этих сетей вы выпустите небольшой гайд по установке и скриптом для запуска и потом сравните их результаты.также интересен был кейс распознавания спикеров, но решения так и не нашел. Спасибо за ваш труд!
Спасибо. Интересен вопрос конфиденциальности, секретности транскрибации. Оффлайн
Спасибо большое, за информацию.
🎉 поздравляю у вас плюс один подписчик
огромное спасибо!!!
Золото!
Я использую ютуб. Загружаю видео в закрытый доступ. Через пару часов (в зависимости от длительности) залажу в субтитры и забираю готовый текст.
@wnine
11 ай бұрын
Интересное решение. А еще можно загружать белый шум с зашитом файлом. Значит ютюб еще и файлхрагилище.
@user-os5ze7ce4n
9 ай бұрын
Интересно а субтитры сохраняют перевод или есть какой-то механизм?извините я во многом лузер,учусь
@Utrenniystoyak
6 ай бұрын
@@wnineзачем белый шум если есть модемный шум. Раньше на аудиокассетах программы загружали в древний комп типа поиска или спектрума
Добрый день! Подскажите,можно ли Whisper засунуть в UE5,а потом все упаковать в Vr шлем под андройдом 10 и чтоб еще работало и распознавал?)
Не подскажете нейроночку, для перевода моего голоса с русского языка на другие языки (минуя процедуру перевода голоса в текст, а потом текст на другой язык)? Спасибо.
Коллега,подскажите пожалуйста,есть ли сервисы ,которые позволяют с аудио на английском языке делать перевод аудио на русский язык?
@theurs2
11 ай бұрын
Если реально нужно то можно на своем компе это делать. Распознавать в текст с помощью whisper или vosk, переводить гуглом и озвучивать снова. Для всего по отдельности есть утилиты и можно легко соединить их питоном. Но качество такое себе, и у распознавания, и у перевода.
@Freelanser125
11 ай бұрын
@@theurs2 коллега,спасибо за совет,но это очень муторно, а я знаю ,что есть возможность такого аудио перевода.Например ,как это делается с видео в браузере Yandex при просмотре,например роликов на KZread, Я попробовал залить тестовое видео на KZread, но нейросеть не сработала.
От сбербанка есть переводчик. Как на сайте так и в телеге.
На андроиде в стандартной клавиатуре от гугла есть микрофончик. один раз нажимаешь и через секунду можно диктовать текст в любое приложение.
@user-ge1ug7eh4y
10 ай бұрын
Только любая пауза останавливает запись
А под Windows что-нибудь есть? Не транскрибация файлов а перевод речи в текст в реальном времени с микрофона.
Вот лично мне "Гугл документы" вообще не понравились. Т.е. у меня где-то 20-30 % слов распознавались неправильно. При этом неважно, использую я микрофон ноута или гарнитуру. При таком раскладе лично мне проще печатать руками.
Гугл keep не очень работает. Если в речи есть малейшая пауза, то он сразу останавливается.
@gerkmp
11 ай бұрын
От гугл есть специальное решение - "прямая расшифровка". Странно, что вместо него Google Kepp. Может в знаки препинания, предложения, абзацы.
@samsonprof
11 ай бұрын
@@gerkmp где находится прямая расшифровка?
А как загрузить в закрытый доступ
Было 666 лайков Я это Исправил. Спасибо буду пробовать. Запускал этот Whisper через Пиноккио Запускается но ничего не делает выдаёт ошибки сообщение Error: Requested float16 compute type, but the target device or backend do not support efficient float16 computation Или Ошибка: CUDA не удалась с ошибкой вне памяти Вроде и ноутбук Достаточно мощный оЗУ 16 Гб И всё равно...... Нет времени всё пробовать И так убил кучу времени. А где бы найти нормальный экзешник без танцев с бубнами Почему раньше всё работало в экзешниках а теперь приходится докачивать кучу библиотек запускать через терминал. Эпоха искусственного интеллекта...
Интересно обратное - текст в голос.
@AnastasMir
8 ай бұрын
Максиме пжл, если найдёте сервис или приложение🙏
Ещё сам голосовой ввод в гугл клавиатуре
Чел, спасибо, но зачем так метать мышью по экрану, ну за что ты нас так?
У гугл кип - качество звука очень плохое
зачем приписывать фразу "нейронка куда то не попадь))))))))))))))), в док документах google было и есть запись голосом текста БЕЗ нейронки и есть БЕЗ нейронки. минус
Голос в текст не, а вот переводить видео с русского на английский свои я имею в виду в более менее нормальном качестве ни как та же самая алиса было бы неплохо.
Нет переводчика голоса говорящего человека? Обязательно надо в аудио записать....
люди готовы платить 200 - 300 рублей за чашку кофе. Но платить 1-2 рубля за минуту распознавания речи уже жалко. За данными сервисами стоит высокоинтелектуальный труд программистов, работающее высокопроизводительное оборудование , множество других затрат.
А гже ссилки
Silero - отстой. Профессиональную запись двух людей свалила в кучу. Не понятно кто что говорит, да ещё в Эксель. Фтопку! Teamlogs гораздо лучше справился с этой же задачей.
@olgalukyanova8330
6 ай бұрын
а мне как раз понравился Silero, есть таймкоды, бесплатно. А у Teamlog -бесплатно только 15 минут первые и свалил двух спикеров одного. Единственное, что удобно- по слову включает аудио