Экспорт

JSONL

Все одобренные чанки с массивом сегментов segments[]. Одна строка = один чанк.

{
  "audio": "uuid.wav",
  "duration": 18.2,
  "chunk_type": "vad_chunk",
  "segments": [...]
}

ASR плоский

Конкатенация текста всех речевых сегментов без временны́х меток. Один файл = одна строка.

{
  "audio": "uuid.wav",
  "text": "добрый день...",
  "language": "rus"
}

JSON

Полный диалог из чанков одного источника с абсолютными временны́ми метками. Требует NDA.

Source UUID

Экспорт датасета