Fallstudie: Aussoensammlung
7M+ Aussoe geliwwert fir Multi-lingual digital Assistenten an 13 Sproochen ze bauen

Real World Léisung
Donnéeën déi global Gespréicher Muecht
De Besoin fir Utterance Training entsteet well net all Clienten déi exakt Wierder oder Ausdréck benotzen wärend se interagéieren oder Froen un hir Stëmmassistenten an engem scripted Format stellen. Dofir musse spezifesch Stëmmapplikatiounen op spontan Rieddaten trainéiert ginn. Zum Beispill, "Wou ass dat nootste Spidol?" "Fannt e Spidol bei mir" oder "Gëtt et e Spidol an der Géigend?" all uginn déi selwecht Sich Absicht awer sinn anescht fraséiert.

Problem
Fir dem Client säin Digital Assistant seng Ried Fahrplang fir weltwäit Sproochen auszeféieren, huet d'Team grouss Volumen vun Trainingsdaten fir de Riederkennungs AI Modell gebraucht. Déi kritesch Ufuerderunge vum Client waren:
- Kaaft grouss Volumen vun Trainingsdaten (Single Spriecher Aussoe vun net méi wéi 3-30 Sekonnen laang) fir Riederkennungsservicer an 13 global Sproochen
- Fir all Sprooch generéiert de Fournisseur Text Ufroe fir Spriecher opzehuelen (ausser de
Client Ëmgeréits) an de resultéierende Audio transkribéieren. - Bitt Audiodaten an Transkriptioun vun opgehollen Aussoen mat entspriechende JSON Dateien
déi Metadaten fir all Opzeechnunge enthalen. - Vergewëssert Iech eng divers Mëschung vu Spriecher no Alter, Geschlecht, Ausbildung & Dialekt
- Assuréiert eng divers Mëschung vun Opnamëmfeld wéi pro Spezifikatioune.
- All Audioopnam soll op d'mannst 16kHz sinn, awer am léifsten 44kHz
"Nodeems vill Ubidder evaluéiert gouf, huet de Client Shaip gewielt wéinst hirer Expertise an konversational AI Projeten. Mir ware beandrockt mat dem Shaip seng Kompetenz fir d'Ausféierung vun de Projeten, hir Expertise fir déi erfuerderlech Aussoe vun Expert Linguisten an 13 Sproochen an XNUMX Sproochen an strikt Zäitlinnen a mat der erfuerderter Qualitéit ze Quellen, ze transkriéieren an ze liwweren.
Léisung
Mat eisem déiwe Verständnis vu konversativen AI, hu mir dem Client gehollef d'Donnéeën mat engem Team vun Expert Linguisten an Annotateuren ze sammelen, transkriberen an annotéieren fir hir AI-powered Speech Processing Multilingual Voice Suite ze trainéieren.
Den Ëmfang vun der Aarbecht fir Shaip abegraff awer war net limitéiert op grouss Volumen vun Audio Trainingsdaten fir Riederkennung ze kréien, Audioopnamen a verschidde Sproochen fir all Sproochen op eiser Tier 1 an Tier 2 Sprooche Fahrplang ze transkriéieren, an entspriechend liwweren Language Dateien déi Metadaten enthalen. De Shaip huet Aussoe vun 3-30 Sekonnen op Skala gesammelt, wärend de gewënschte Qualitéitsniveau erhale bleift fir ML Modeller fir komplex Projeten ze trainéieren.
- Audio gesammelt, transkribéiert & annotéiert: 22,250 Stonnen
- Ënnerstëtzt Sproochen: 13 (Dänesch, Koreanesch, Saudi Arabesch Arabesch, Hollännesch, Festland & Taiwan Chinesesch, Franséisch Kanadesch, Mexikanesch Spuenesch, Tierkesch, Hindi, Polnesch, Japanesch, Russesch)
- Zuel vun Aussoen: 7M +
- Timeline: 7-8 Méint
Wärend Audio Aussoe bei 16 kHz gesammelt hunn, hu mir e gesonde Mix vu Spriecher no Alter, Geschlecht, Ausbildung an Dialekter a verschiddenen Opnamëmfeld gesuergt.
Resultat
Déi qualitativ héichwäerteg Aussprooch Audiodaten vun Expert Linguisten hunn de Client ermächtegt hire méisproochege Speech Recognition Modell an 13 Global Tier 1 & 2 Sproochen präzis ze trainéieren. Mat Gold-Standard Training Datesets kann de Client intelligent a robust digital Hëllef ubidden fir zukünfteg Real-Welt Problemer ze léisen.
Eis Expertise
Recommandéiert Ressourcen
Keefer Guide
Buyer's Guide: Conversational AI
Den Chatbot mat deem Dir geschwat hutt leeft op engem fortgeschrattene Gespréich AI System deen trainéiert, getest a gebaut gëtt mat Tonne vu Riederkennungsdatesets.
Blog
The State of Conversational AI 2021
D'Conversational AI 2021 Infografik schwätzt iwwer wat Conversational AI ass, seng Evolutioun, Typen, Conversational AI Maart no Regioun, Benotzungsfäll, Erausfuerderungen, etc.
Blog
3 Hindernisser fir d'Evolutioun vu Conversational AI
Shaip spréngt d'Evolutioun vu Gespréichs-AI als Client Engagement-Tool un andeems se déi néideg annotéiert Audiodaten a 50+ Sproochen ubidden.
Sot eis wéi mir mat Ärer nächster AI Initiativ hëllefe kënnen.