GlobalPhone
GlobalPhone (seit 1995)
Forschung im Bereich multilinguale Spracherkennung ist nicht ohne eine Datenbasis möglich, die ausreichendes Sprach- und Textmaterial von einheitlicher Qualität in vielen Sprachen bereitstellt. In den frühen 90er Jahren gab es noch keine Sammlung von ausreichender Größenordnung. Daher wurde das Projekt GlobalPhone initiiert, um eine eigene multilinguale Datenbasis zu erstellen. Im Rahmen von GlobalPhone werden seit 1995 große Korpora von gelesener Sprache in (bislang) 19 Sprachen gesammelt. Für diese Sprachen stellen wir mittlerweile die Audio und Textdaten von jeweils mehr als 100 Muttersprachlern zur Verfügung. Diese Daten werden vor allem eingesetzt für Forschung in den Bereichen Spracherkennung, Sprachsynthese, Sprachenidentifizierung, Sprecheridentifizierung, und anderes mehr.
Momentan enthält GlobalPhone die folgenden 19 Sprachen:
- Arabisch (Tunesien und Palästina)
- Bulgarisch
- Chinesisch (Mandarin und Shanghai Dialekt)
- Deutsch
- Französisch
- Hausa
- Japanisch
- Koreanisch
- Kroatisch
- Portugiesisch (Brasilien)
- Polnisch
- Russisch
- Schwedisch
- Spanisch (Costa Rica)
- Tamil
- Thai
- Tschechisch
- Türkisch
- Vietnamesisch
Mehr Informationen gibt es auf unseren Publikationsseiten und auf der GlobalPhone webpage (Englisch!)