In-car voice data collection

Case Study: Key Phrase Collection for In-car voice-activated systems

Schlëssel Ausdrock Kollektioun

Et gëtt eng ëmmer méi Nofro fir Stëmm-aktivéiert Systemer am Auto an der Autoindustrie, nei definéieren wéi mir eis mat eise Mobilitéitsautoen engagéieren.

D'Automobilindustrie huet séier Stëmm-aktivéiert Systemer ugeholl, mat grousse Spiller wéi Ford, Tesla a BMW déi fortgeschratt Stëmmerkennung an hire Gefierer integréiert hunn. Bis 2022 gouf geschat datt iwwer 50% vun neien Autoen Stëmmerkennungsfäegkeeten hunn. Dës Integratiounen zielen d'Sécherheet ze verbesseren, et erlaabt Chauffeuren Navigatioun, Ënnerhalung a Kommunikatiounsfunktiounen ouni Oflenkungen ze bedreiwen.

De Maartwäert fir Stëmmerkennung an Autoen gouf virgesinn fir $ 1 Milliard bis 2023 ze iwwerschreiden, wat eng wuessend Nofro fir handsfree, intelligent Interaktiounen am Auto beweist.

Automotive

Fuerschung hindeit datt bis 2022, 73% vun de Chauffeuren en Auto Stëmmassistent benotzen.

Den Automotive Voice Recognition System Maart gouf op USD 2.01 Milliarde am Joer 2021 geschätzt, a gëtt erwaart $ 3.51 Milliarde bis 2027 z'erreechen, en CAGR vu ronn 8.07% registréiert.

Real World Léisung

Donnéeën déi Stëmm-aktivéiert Systemer Muecht

Stëmm-aktivéiert Systemer an Autoen verbesseren Sécherheet a Komfort. Si erlaben Chauffeuren Zougang zu Navigatioun, Uriff maachen, Texter schécken a Musek kontrolléieren ouni d'Hänn vum Rad oder d'Aen vun der Strooss ze huelen. Andeems Dir op verbale Befehle reagéiert, reduzéieren dës Systemer Oflenkung, förderen Multitasking a suergen kontinuéierlech Fokus op Fuere. 

De Client ass e weltwäite Leader an der Gespréichsintelligenz, déi Stëmm AI-Léisungen ubitt, déi Geschäfter onheemlech Gespréichserfarungen un hire Clienten ubidden. Si hu mat führenden Autosfirmen geschafft fir hir Stëmm-aktivéiert Systemer mat markéierte Schlësselsätz ze trainéieren an hunn dem Shaip seng Expertise an der Audiodatensammlung gebraucht.

Real Welt Léisung
Erausfuerderunge

Erausfuerderunge

  • Crowd Sourcing: Rekrutéiert 2800+ Mammesproochler pro Sprooch weltwäit.
  • Datensammlung: Séchert 200k+ Ufroen an 12 Sproochen bannent festgeluechten Zäitframe.
  • Kontext & Absichtserkennung: Fir d'Benotzer Ufroe richteg ze verstoen, musse Systemer op verschiddene Variatiounen fir déiselwecht Schlësselphrase trainéiert ginn.
  • Background Noise Handling: Adress real-Welt Hannergrond Kaméidi fir ML Modell Genauegkeet.
  • Reduktioun Bias: Kaaft Stëmmproben aus diversen Demographie fir Inklusivitéit ze garantéieren.
  • Audio Spezifikatioune: 16khz 16bits PCM, Mono, Single-Channel, WAV; keng Veraarbechtung.
  • Enregistrement Ëmfeld: Opzeechnunge soll propper Audio ouni Hannergrond Kaméidi oder Stéierungen hunn. Schlëssel Sätze fir mat normaler Ried opzehuelen.
  • Qualitéitskontroll:  All Ried Opzeechnunge wäert Qualitéit Bewäertung a Validatioun ënnerleien, nëmmen validéiert Ried Opzeechnunge ginn geliwwert. Wann de Shaip net den ausgemaachte Qualitéitsnormen entsprécht, liwwert Shaip Daten ouni zousätzlech Käschten

Léisung

Shaip mat senger Expertise am Conversational AI Raum huet dem Client erlaabt:

  • Datensammlung: 208k Schlëssel Sätze / Mark Ufuerderunge gesammelt an 12 global Sprooche vun 2800 Spriecher am virgeschriwwenen Zäitframe
  • Verschidde Akzenter & Dialekter: Rekrutéiert Spezialisten aus der ganzer Welt, beherrscht an de gewënschten Akzenter an Dialekter.
  • Kontext & Absichtserkennung: All Spriecher gouf opgefuerdert d'Schlëssel Sätze an 20 ënnerschiddleche Variatiounen opzehuelen, wat d'ML Modeller erméigleche fir d'Benotzerfuerderunge präzis a punkto Kontext an Intent ze begräifen.
  • Hannergrond Kaméidi Handling: Fir eng uerdentlech Audioqualitéit ze garantéieren, hu mir sécher gemaach datt d'Schlëssel Sätze an engem rouegen Ëmfeld mat Kaméidiniveauen ënner 40dB ageholl goufen, ouni Hannergrondstéierunge wéi Fernseh, Radio, Musek, Ried oder Stroossekläng.
  • Reduktioun Bias: Fir Bias ze minimiséieren, hu mir Individuen aus diversen Regiounen engagéiert an eng equilibréiert demographesch Representatioun mat 50% Männercher a 50% Weibercher behalen, iwwer Altersgruppen vun 18 bis 60 Joer.
  • Opnam Richtlinnen: D'Schlëssel Sätze goufen an engem konsequent, normalen Riedsmuster ageholl, ouni Variatiounen wéi séier oder lues Tempo. 2-Sekonne Rou souwuel am Ufank wéi um Enn fir ze garantéieren datt keen Deel vun der Ried onbedéngt ofgeschnidden ass.
  • Recording Format: Den Audio gouf op 16kHz, 16-Bit PCM am Mono opgeholl, mat engem eenzege Kanal, an am WAV Dateiformat gespäichert. Den Audio bleift onveraarbecht, dat heescht datt et keng Applikatioun vu Kompressioun, Reverb oder EQ gouf.
  • Qualitéit: All Riedopnam gouf u strenge Qualitéitskontrollen a Validatioun ënnerworf. Nëmmen Opzeechnungen déi dës Bewäertung passéiert goufen geliwwert. All Dateien, déi net un den ausgemaachte Qualitéitsnormen gefall sinn, goufen nei opgeholl an ouni zousätzlech Käschten geliwwert
Léisung
Resultat

Resultat

Déi héichqualitativ Mark Schlëssel Phrase Audiodaten oder Stëmmprompts erlaben d'Automobilfirmen an hir Clienten mat:

  1. Branding an Identitéit: Stëmm Prompts mat spezifesche, Mark Phrase hëlleft Firmen eng direkt & onvergiesslech Verbindung tëscht Benotzer an der Mark ze kreéieren déi d'Markerënnerung verbessert.
  2. Einfachheet vun der Notzung: Stëmmbefehl maachen et méi einfach fir Chauffeuren mat Gefierer ze interagéieren ouni hir Hänn vum Rad ze huelen oder d'Aen vun der Strooss ze halen an doduerch d'Stroosssécherheet ze verbesseren.
  3. Funktionalitéit: Stëmmbefehle maachen den Zougang an d'Kontroll vun Autosfeatures méi intuitiv. Ob seng Navigatioun, Medien Playback, oder Klima Kontroll.
  4. Integratioun mat anere Systemer: Vill Stëmm-aktivéiert Systemer sinn integréiert mat Smartphones, Smart Home Apparater, an aner IoT Apparater. Zum Beispill kann e Benotzer fäeg sinn hiren Auto ze froen d'Luuchten doheem opzemaachen wann se heem kommen.
  5. Kompetitiv Virdeel: Fortgeschratt Stëmm-aktivéiert Systemer ubidden kann e Verkafspunkt & en Differenzéierer sinn. Keefer sichen no der leschter Technologie wann se en neien Auto kafen.
  6. Future-Proofing: Wéi Tech evoluéiert & IoT gëtt méi an den Alldag integréiert, mat engem robuste Stëmm-aktivéierte System positionéiert Automobilfirmen fir méi adaptiv un zukünfteg Tech ze sinn.
  7. Akommes Méiglechkeeten: Zousätzlech Monetiséierungsméiglechkeeten dh Stëmmsystemer bidden Empfehlungen oder integréiert E-Commerce Erfahrungen (wéi Liewensmëttel bestellen oder Emgéigend Servicer fannen) déi Affiliate Recetten ubidden.
Golden-5-Stär

Wéi mir ugefaang hunn Stëmmprompts fir den Autosektor ze sichen, waren d'Erausfuerderunge vill. D'Diversitéit a Ried, Akzenter an Téin erfaassen war vital fir d'global Clientèle vun eisem Client ze representéieren. Shaip stoung net nëmmen als Verkeefer, mee als richtege Partner. Hiren Engagement fir eng divers Gamme vu Stëmmen aus verschiddene Regiounen ze sécheren war luewenswäert. Si sinn doriwwer eraus nëmmen d'Stëmmen sammelen; si hunn d'Nuancen vun eise Projetsbedürfnisser begräifen, a garantéiert Top-Notch Opzeechnungen. Hir flawless Anhale vun Audio Sammlung Standarden huet hir Professionalitéit an Engagement fir de Projet gewisen.

Beschleunegt Är Conversational AI
Applikatioun Entwécklung vun 100%