Распознавание речи: как это работает
Локальное распознавание речи фильтрует клипы перед обработкой ИИ
Прежде чем Bitcut отправит аудио на сервер для транскрибирования с помощью ИИ, приложение сначала выполняет быструю проверку наличия речи прямо на вашем устройстве. Этот локальный анализ определяет, какие клипы содержат речь, а какие являются чисто визуальными (музыка, фоновый звук, тишина). На транскрибирование отправляются только клипы с обнаруженной речью.
Почему анализ выполняется локально
Распознавание речи на устройстве обеспечивает три ключевых преимущества:
- Скорость — локальный анализ занимает всего несколько секунд, даже для нескольких клипов
- Конфиденциальность — аудио из клипов без речи никогда не покидает ваше устройство
- Экономия квоты — клипы без речи полностью пропускаются и не расходуют вашу квоту ИИ-минут
Как это работает
Анализ аудио
Когда вы добавляете клипы через Умное добавление с ИИ или Улучшение клипов, Bitcut анализирует аудиодорожку каждого клипа на вашем устройстве.
Классификация: речь или нет
Каждый клип классифицируется как содержащий речь или нет. Клипы обрабатываются параллельно, поэтому даже пакет из 10 клипов занимает всего несколько секунд.
Маршрутизация
Клипы с речью отправляются на серверное транскрибирование ИИ. Клипы без речи обрабатываются иначе — они проходят через умную обрезку на основе визуального содержания.
Что вы видите
Во время распознавания речи клипы на таймлайне показывают иконку лупы с состоянием «Анализ». Эта фаза быстрая — обычно 1-2 секунды на клип. После завершения анализа клипы либо переходят к фазе транскрибирования, либо сразу обрезаются и отмечаются как завершённые.