Fallstudie: Aussoensammlung

7M+ Aussoe geliwwert fir Multi-lingual digital Assistenten an 13 Sproochen ze bauen

Ausso Sammlung

Real World Léisung

Donnéeën déi global Gespréicher Muecht

De Besoin fir Utterance Training entsteet well net all Clienten déi exakt Wierder oder Ausdréck benotzen wärend se interagéieren oder Froen un hir Stëmmassistenten an engem scripted Format stellen. Dofir musse spezifesch Stëmmapplikatiounen op spontan Rieddaten trainéiert ginn. Zum Beispill, "Wou ass dat nootste Spidol?" "Fannt e Spidol bei mir" oder "Gëtt et e Spidol an der Géigend?" all uginn déi selwecht Sich Absicht awer sinn anescht fraséiert.

Aussosammlung 1

Problem

Fir dem Client säin Digital Assistant seng Ried Fahrplang fir weltwäit Sproochen auszeféieren, huet d'Team grouss Volumen vun Trainingsdaten fir de Riederkennungs AI Modell gebraucht. Déi kritesch Ufuerderunge vum Client waren:

  • Kaaft grouss Volumen vun Trainingsdaten (Single Spriecher Aussoe vun net méi wéi 3-30 Sekonnen laang) fir Riederkennungsservicer an 13 global Sproochen
  • Fir all Sprooch generéiert de Fournisseur Text Ufroe fir Spriecher opzehuelen (ausser de
    Client Ëmgeréits) an de resultéierende Audio transkribéieren.
  • Bitt Audiodaten an Transkriptioun vun opgehollen Aussoen mat entspriechende JSON Dateien
    déi Metadaten fir all Opzeechnunge enthalen.
  • Vergewëssert Iech eng divers Mëschung vu Spriecher no Alter, Geschlecht, Ausbildung & Dialekt
  • Assuréiert eng divers Mëschung vun Opnamëmfeld wéi pro Spezifikatioune.
  • All Audioopnam soll op d'mannst 16kHz sinn, awer am léifsten 44kHz

Beschleunegt Är Conversational AI
Applikatioun Entwécklung vun 100%

"Nodeems vill Ubidder evaluéiert gouf, huet de Client Shaip gewielt wéinst hirer Expertise an konversational AI Projeten. Mir ware beandrockt mat dem Shaip seng Kompetenz fir d'Ausféierung vun de Projeten, hir Expertise fir déi erfuerderlech Aussoe vun Expert Linguisten an 13 Sproochen an XNUMX Sproochen an strikt Zäitlinnen a mat der erfuerderter Qualitéit ze Quellen, ze transkriéieren an ze liwweren.

Léisung

Mat eisem déiwe Verständnis vu konversativen AI, hu mir dem Client gehollef d'Donnéeën mat engem Team vun Expert Linguisten an Annotateuren ze sammelen, transkriberen an annotéieren fir hir AI-powered Speech Processing Multilingual Voice Suite ze trainéieren.

Den Ëmfang vun der Aarbecht fir Shaip abegraff awer war net limitéiert op grouss Volumen vun Audio Trainingsdaten fir Riederkennung ze kréien, Audioopnamen a verschidde Sproochen fir all Sproochen op eiser Tier 1 an Tier 2 Sprooche Fahrplang ze transkriéieren, an entspriechend liwweren Language Dateien déi Metadaten enthalen. De Shaip huet Aussoe vun 3-30 Sekonnen op Skala gesammelt, wärend de gewënschte Qualitéitsniveau erhale bleift fir ML Modeller fir komplex Projeten ze trainéieren.

  • Audio gesammelt, transkribéiert & annotéiert: 22,250 Stonnen
  • Ënnerstëtzt Sproochen: 13 (Dänesch, Koreanesch, Saudi Arabesch Arabesch, Hollännesch, Festland & Taiwan Chinesesch, Franséisch Kanadesch, Mexikanesch Spuenesch, Tierkesch, Hindi, Polnesch, Japanesch, Russesch)
  • Zuel vun Aussoen: 7M +
  • Timeline: 7-8 Méint

Ai-ugedriwwen Ried Veraarbechtung méisproocheg Stëmm Suite

Wärend Audio Aussoe bei 16 kHz gesammelt hunn, hu mir e gesonde Mix vu Spriecher no Alter, Geschlecht, Ausbildung an Dialekter a verschiddenen Opnamëmfeld gesuergt.

Resultat

Déi qualitativ héichwäerteg Aussprooch Audiodaten vun Expert Linguisten hunn de Client ermächtegt hire méisproochege Speech Recognition Modell an 13 Global Tier 1 & 2 Sproochen präzis ze trainéieren. Mat Gold-Standard Training Datesets kann de Client intelligent a robust digital Hëllef ubidden fir zukünfteg Real-Welt Problemer ze léisen.

Héich Qualitéit Aussoen Audiodaten

Eis Expertise

Stonnen Ried gesammelt
0 +
Team vun Voice Data Collectors
0
PII kompatibel
0 %
Cool Zuel
0 +
Donnéeën Akzeptanz & Genauegkeet
> 0
Fortune 500 Clientèle
0 +

Sot eis wéi mir mat Ärer nächster AI Initiativ hëllefe kënnen.