Локальное распознавание речи фильтрует клипы перед обработкой ИИ

Прежде чем Bitcut отправит аудио на сервер для транскрибирования с помощью ИИ, приложение сначала выполняет быструю проверку наличия речи прямо на вашем устройстве. Этот локальный анализ определяет, какие клипы содержат речь, а какие являются чисто визуальными (музыка, фоновый звук, тишина). На транскрибирование отправляются только клипы с обнаруженной речью.

Почему анализ выполняется локально

Распознавание речи на устройстве обеспечивает три ключевых преимущества:

  • Скорость — локальный анализ занимает всего несколько секунд, даже для нескольких клипов
  • Конфиденциальность — аудио из клипов без речи никогда не покидает ваше устройство
  • Экономия квоты — клипы без речи полностью пропускаются и не расходуют вашу квоту ИИ-минут

Как это работает

1

Анализ аудио

Когда вы добавляете клипы через Умное добавление с ИИ или Улучшение клипов, Bitcut анализирует аудиодорожку каждого клипа на вашем устройстве.

2

Классификация: речь или нет

Каждый клип классифицируется как содержащий речь или нет. Клипы обрабатываются параллельно, поэтому даже пакет из 10 клипов занимает всего несколько секунд.

3

Маршрутизация

Клипы с речью отправляются на серверное транскрибирование ИИ. Клипы без речи обрабатываются иначе — они проходят через умную обрезку на основе визуального содержания.

Совет: Если у вас есть микс из разговорных клипов и B-roll, распознавание речи гарантирует, что только разговорные клипы расходуют вашу квоту ИИ. B-roll клипы обрезаются с помощью визуального анализа.

Что вы видите

Во время распознавания речи клипы на таймлайне показывают иконку лупы с состоянием «Анализ». Эта фаза быстрая — обычно 1-2 секунды на клип. После завершения анализа клипы либо переходят к фазе транскрибирования, либо сразу обрезаются и отмечаются как завершённые.

Ограничение по длительности: Для обработки ИИ подходят клипы продолжительностью до 3 минут. Более длинные клипы следует обрабатывать с помощью функции Генерация Shorts.