Prompt-driven Target Speech Diarization

Untitled

2. Target Speech Diarization

Untitled

2.1 Task Formulation

두 가지 핵심 개념인 "semantic attribute"와 "semantic value"가 소개

<aside> 💡 논문은 이러한 "semantic attributes"와 "semantic values"를 사용함으로써, 사용자들이 오디오에서 특정 음성 세그먼트를 더 정확하고 유연하게 식별할 수 있다고 강조 이는 다양한 실용적 응용 분야가 존재

</aside>

2.2 Proposed framework: Prompt-driven Target Speech Diarization (PTSD)