|
Données vocales téléphoniques en Français Canadien |
|
Nü Echo a collecté et transcrit un corpus considérable de données vocales téléphoniques en Français Canadien. Voici une présentation rapide de ce corpus et du type de licence qui peut être octroyé.
Volume de données:
- plus de 1,000 locuteurs différents
- adultes seulement
- hommes et femmes
Utilisations possibles du corpus:
- Entraînement et test de modèles acoustiques
- Optimisation de seuils de reconnaissance et de rejet, etc.
Environment:
Type de données:
- Codes postaux canadiens
- Villes canadiennes
- Adresses canadiennes
- Nombres
- Montants d'argent
- Numéros de téléphones
- Épellation
- Dates
- Heures
- Oui / Non
- Noms de compagnies
- Noms de personnes
Format:
- Fichiers audio : muLaw, 8 bits
- Transcriptions et annotations : fichiers XML, autres formats possibles.
- Dictionnaire phonétique : de nombreux phone sets sont possibles incluant SAMPA, UPS, etc.
Type de licence:
- Droit d'utilisation, sans royautés, monde entier, pas de droit de sous-licence.
|