Модуль предобработки речевых видеоданных
Модуль выполняет предобработку речевых видеоданных, в данном случае извлекаются области губ из исходных видеокадров. Команда для запуска предобработки речевых видеоданных:
openav_preprocess_video --config <путь_к_вашему_конфигурационному_файлу>.yaml
Важно
Для запуска команды необходимо обязательно указать путь к конфигурационному файлу. Запускать программу необходимо из директории, где она расположена.
Конфигурационный файл
Конфигурационный файл включает в себя следующие настройки:
Отображение процесса выполнения программы в терминале (командной строке)
Работа с файловой системой
Параметры предобработки речевых видеоданных
Отображение процесса выполнения команды в терминале
Параметр |
Тип |
Значение по умолчанию |
Описание |
---|---|---|---|
hide_metadata |
bool |
|
Включение отображения метаданных |
hide_libs_vers |
bool |
|
Включение отображения версий установленных библиотек в командной строке |
Работа с файловой системой
Параметр |
Тип |
Значение по умолчанию |
Описание |
---|---|---|---|
path_to_dataset |
str |
|
Директория, где находятся данные, которые необходимо загрузить или проверить |
path_to_dataset_video |
str |
|
Директория, в которую будут сохраняться данные после предобработки |
depth |
int |
|
Глубина иерархии для получения данных. Указывается количество подкаталогов в директории |
ext_search_files |
list |
|
Список расширений файлов, которые будут обрабатываться. |
clear_dir_video |
bool |
|
Предварительная очистка директории с предобработанными видеоданными |
save_raw_data |
bool |
|
Сохранение данных в формате numpy |
Параметры предобработки речевых видеоданных
Параметр |
Тип |
Значение по умолчанию |
Описание |
---|---|---|---|
dpi |
int |
|
Качество изображения. Доступные значения |
resize |
bool |
|
Разрешить изменять полученное изображение. Этот параметр активирует следующие параметры: |
resize_resample |
str |
|
Фильтры применяемые для масштабирования конечного изображения. Доступные значения |
width |
int |
|
Ширина изображения извлеченной области губ |
height |
int |
|
Высота изображения извлеченной области губ |
color_mode |
str |
|
Цветовая гамма конечного изображения. Доступные значения: |