Déi meescht vertraut Speech Data Collection Services fir Är AI

Trainéiert Är NLP Modeller, VAs, TTS Prototypen, a méi mat Qualitéitskonversatiounsdaten, mat eisen Audio- a Rieddatensammlungsservicer

Sammlung vun Audiodaten

Entdeckt Audiodatenpipelines ouni Flaschenhals

Featured Clienten

Professionelle Audio / Voice Data Collection Services

All Sujet. All Szenario.

Bei Shaip läit eis Expertise bei der Schafung vun qualitativ héichwäertege Riedsdatesätze fir variéiert AI / ML Ufuerderungen. Mir bidden eng erweidert Gamme vu Sproochen a Rekord a verschiddenen Astellungen déi eis Datesätz ëmfaassend an adaptéierbar maachen. OÄre Fokus ass op Modeller ze fidderen mat dem héchste Volumen vu personaliséierte Rieddaten, an der mannst méiglecher Zäit. Mat eis u Bord kënnt Dir erwaarden: 

Ried Kollektioun
  • Curated héichqualitativ méisproocheg Audio / Stëmmdaten fir d'Genauegkeet ze verbesseren
  • Héchsten méiglech Niveau vun Domain Spezifizitéit ze target divers Szenario ageriicht
  •  Skala Äre ML Modell fir verschidde Demografie a Vertikal ze passen
  • Enregistrement Ëmfeld: Studio Qualitéit, mat glaskloerem Audio mat minimalem Hannergrondgeräischer, & Natierlech Ëmfeld, wou Opzeechnunge ambient Kläng integréieren fir real-Welt Situatiounen ze mimikéieren.

100 +

Länner

55K +

Stonnen vun Speech Data

250 +

Projeten

60 +

Sproochen (100+ Dialekter)

8 / 16 / 44 / 48 kHz

Samplingtemperatur

Eis Expertise

Alignéiert Audiodaten op fir méi intelligent NLP Modeller

Shaip bitt End-to-End Ried-/Audiodatensammlungsservicer an iwwer 100+ Sproochen fir Stëmm-aktivéiert Technologien z'erméiglechen fir eng diverse Set vu Publikum weltwäit ze këmmeren. Mir kënnen op Projeten vun all Ëmfang a Gréisst schaffen; vun der Lizenzéierung vun existéierende off-the-shelf Audiodatesets, fir d'Gestioun vun personaliséierten Audiodatensammlung, bis Audio Transkriptioun an Annotatioun. Egal wéi grouss Äre Sproochdatensammlungsprojet ass, kënne mir d'Audiosammlungsservicer personaliséiere fir Äre Besoinen ze passen fir qualitativ héichwäerteg NLP Datesätz ze bauen déi Dialekter, Téin a Sproochen zielen. Wielt aus eiser breet Palette vu Ried Datesets an Audiodaten Sammlung Ressourcen, fir Stëmm-aktivéiert intelligent Setups.

Monolog Ried

Monolog Scripted & Spontan Speech

Et konzentréiert sech op d'Veraarbechtung vun Ried vun engem eenzege Spriecher. Benotzt scripted Prompts fir an Single-Channel Audiodateien ze fidderen, a garantéiert d'Erfaassung vun eenzegaartege Riedsmuster, Téin an Nuancen spezifesch fir dësen Individuum.

Dialog Ried

Dialog Scripted & Spontan Speech

Zwee-Persoun Interaktioun, replizéiert Real-Welt Gespréicher an Dialoger mat méisproocheger Belaaschtung iwwer Dual-Channel Dateien an transkribéiert Ressourcen.

Multi-Partei Gespréicher

Grupp / Muti-Party
Gespréicher

Multi-Persoun Diskussiounen, Gruppdynamik erfaassen, Iwwerlappungen a variéiert Téin fir präzis Riedmodeller ze trainéieren.

Wake-Wuert Aussoen Kollektioun

Wake-word / Schlëssel Phrase / Aussoen Sammlung

Trainéiert AIs fir Schlëssel Sätze z'identifizéieren oder Wierder oder Aussoe mat ähnleche Bedeitungen z'identifizéieren mat diversen, räichen an authenteschen Aussoe fir fortgeschratt natierlech Sproochveraarbechtung a Verständnis.

Akustesch Ried

Akustesch Daten
Kollektioun

Mir kënne professionell Audiodaten a Studioqualitéit ophuelen, sief et Restauranten, Büroen oder Haiser oder aus verschiddenen Ëmfeld a Sproochen, wärend e méi breet akustesch Gamme (Comprehensive Sound Datasets) ofdecken.

Automatesch Riederkennung

Automatesch Speech Recognition (ASR)

Verbessert d'Genauegkeet vun Ären automateschen Speech Recognition (ASR) Systemer andeems Dir Zougang zu modernsten diversifizéierte Ried-/Audiodatesätz hutt, aus enger breeder Palette vun Demographie.

Natierlech Sprooch Ausso

Multilingual Speech/Audio Trainingsdaten

Eis qualifizéiert Sproochfachleit, weltwäit bidden méisproocheg Audio-/Rieddaten a verschiddene Sproochen an Dialekter. Dësen Effort fördert d'global Kommunikatioun an iwwerbréckt Sproochebarrièren, dréit zu méi inklusiven an effektiven AI Léisungen bäi.

Digital virtuell Assistenten

Text-ze-Speech
(TTS)

Baut e Text-to-Speech (TTS) méisproochege Modell mat der Hëllef vun eiser globaler Aarbechtskräft, déi Iech hëllefen, Rieddaten an 150+ Sproochen & Dialekter ze sammelen fir Är AI Modeller vun In-Car Kontrollen bis Chatbots a Léierléisungen mat héich- Qualitéit Audio Daten.

Call Center Opzeechnunge

Call Center
Gespréicher

Echt Austausch tëscht Agenten a Clienten, ënnerstëtzen vill Sproochen wéi Spuenesch, Däitsch, Amerikanesch Englesch, Bengalesch, Japanesch, Chinesesch an Hindi.

Success Stories

Conversational AI Datesätz mat iwwer 3k Stonnen Daten iwwer 8 Sproochen

Op der Sich no enger méisproocheger Plattform fir indesch Sproochen ze bauen, huet de Client sech mam Shaip zesummegeschafft fir grouss Datesätz a multiple indesche Sproochen ze sammelen, segmentéieren an ze transkriéieren. Dëst géif hëllefen effikass Ried Modeller z'entwéckelen, déi dem Client seng innovativ nei Plattform kéinte maachen.

Problem: Iwwer 3,000 Stonnen Audiodaten gesammelt an 8 indesche Sproochen, segmentéiert an transkribéiert fir automatesch Riederkennung z'entwéckelen.

Léisung: Mir hunn Datensammlung, Segmentatioun, Transkriptioun geliwwert a JSON Dateie mat Metadaten geliwwert. Mir hunn 3000 Stonnen Audiodaten an 8 indesche Sproochen op Skala gesammelt fir de Sproochtechnologieprojet vum Client.

Speech Datensammlung Fallstudie

Grënn fir Shaip als Äre Vertrauenswierdege Speech Data Collection Partner ze wielen

Leit

Leit

Engagéiert an trainéiert Teams:

  • 30,000+ Kollaborateure fir Dateschafung, Label & QA
  • Credential Project Management Team
  • Erlieft Produkt Entwécklung Team
  • Talent Pool Sourcing & Onboarding Team
Prozess

Prozess

Déi héchste Prozesseffizienz gëtt geséchert mat:

  • Robust 6 Sigma Stage-Gate Prozess
  • En engagéierten Team vu 6 Sigma Schwaarze Gürtel - Schlësselprozessbesëtzer & Qualitéitskonformitéit
  • Kontinuéierlech Verbesserung & Feedback Loop
Plattform

Plattform

Déi patentéiert Plattform bitt Virdeeler:

  • Web-baséiert Enn-zu-Enn Plattform
  • Impeccable Qualitéit
  • Méi séier TAT
  • Nahtlos Liwwerung

Off-the-Shelf Speech / Audio Datesets

DetailerSprooch DatensetSample TauxDataset TypTotal Audio Stonnenkuerz BeschreiwungDataset BeschreiwungAudio KanalRecording PlattformWER (%)Audio FormatTranskriptiounsformatBenotzt CaseZuel vu Spriechercta
SpeechNew York Englesch_GC_8New York EngleschNew York Engleschen_US8 kHzAllgemeng Gespréich107New York Englesch Allgemeng Gespréich datenUnscripted telefonesch Gespréich tëscht zwee Leit. ca. Audio Dauer (Gamme) - 15-60 Minutten, DualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 118, Männlech 114, Onbekannt 0
SpeechRussesch_SM_48russeschrusseschru-ru48 kHzSchrëftlech Monolog2,398Russesch Schrëftlech MonologEenzegaarteg Opzeechnunge, déi éischter am 5 bis 30 Sekonne Beräich falenMonoMobile App5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 1689 Männlech 1937 Onbekannt 214
SpeechPunjabi_MAPanjabi-Punjabi (In Pipeline) Panjabi- Media Audio40Punjabi (In Pipeline) Medien AudiodatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechPunjabi_GCPanjabi-Punjabi (In Pipeline) Panjabi-Allgemeng Gespréich100Punjabi (In Pipeline) Allgemeng GespréichsdatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,Desktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechPunjabi_CC_8Panjabi-Punjabi (In Pipeline) Panjabi-Call Center60Punjabi (In Pipeline) Call-Center DatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,Desktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechPolnesche Polen_SM_48Polnesch (Polen)Polnesch (Polen)pl-PL dir48 kHzSchrëftlech Monolog1,482Polnesch Polen - Scripted MonologEenzegaarteg Opzeechnunge, déi éischter am 5 bis 30 Sekonne Beräich falenMonoMobile App5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 1324 Männlech 701 Onbekannt 24
SpeechPolnesch_MA_16polneschpolneschpl_PL16 kHzMedia Audio269Polnesch Medien AudioLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenMonoWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 173 Männlech 354 Onbekannt 6
SpeechOriya_MAOriyaOriya (In Pipeline) oder_INMedia Audio40Oriya (In Pipeline) Media AudiodatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechOriya_GCOriyaOriya (In Pipeline) oder_INAllgemeng Gespréich100Oriya (In Pipeline) Allgemeng GespréichsdatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,Desktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechOriya_CC_8OriyaOriya (In Pipeline) oder_INCall Center60Oriya (In Pipeline) Call-Center DatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,Desktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechNeuseeland_MA_16Neuseeland Englesch Neuseeland Englesch en_NZ16 kHzMedia Audio400Neiséiland Englesch Medien AudioLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenMonoWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 367, männlech 678, Onbekannt 26
SpeechNeuseeland_GC_8Neuseeland Englesch Neuseeland Englesch en_NZ8 kHzAllgemeng Gespréich148Neuseeland Englesch Allgemeng Gespréich datenUnscripted telefonesch Gespréich tëscht zwee Leit. ca. Audio Dauer (Gamme) - 15-60 Minutten, DualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 167, männlech 121, Onbekannt 4
SpeechNew York Englesch_MA_16New York EngleschNew York Engleschen_US16 kHzMedia Audio140New York Englesch Media Audio DatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenMonoWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 66, Männlech 230, Onbekannt 11
SpeechSchottesch_GC_8Schottesch (Englesch Akzent)Schottesch (Englesch Akzent)en_AB8 kHzAllgemeng Gespréich292Schottesch General Gespréich datenUnscripted telefonesch Gespréich tëscht zwee Leit. ca. Audio Dauer (Gamme) - 15-60 Minutten, DualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 285, Männlech 260, Onbekannt 3
SpeechNew York Englesch_CC_8New York EngleschNew York Engleschen_US8 kHzCall Center103New York Englesch Call-Center datenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,DualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 610, Männlech 532, Unbekannt 0
SpeechHolland_SM_48hollänneschhollänneschnl-NL48 kHzSchrëftlech Monolog1,205Hollännesch Schrëftlech MonologEenzegaarteg Opzeechnunge, déi éischter am 5 bis 30 Sekonne Beräich falenMonoMobile App5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 1285 Männlech 531 Onbekannt 3
SpeechMexikanesch_SM_48Spuenesch (Mexiko)Spuenesch (Mexiko)en-MX48 kHzSchrëftlech Monolog1,492Mexikanesch Spuenesch Schrëft MonologEenzegaarteg Opzeechnunge, déi éischter am 5 bis 30 Sekonne Beräich falenMonoMobile App5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 1016 Männlech 1069 Onbekannt 95
SpeechMarathi_MAMarathiMarathi (In Pipeline) mr_INMedia Audio40Marathi (In Pipeline) Media AudiodatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechMarathi_GCMarathiMarathi (In Pipeline) mr_INAllgemeng Gespréich100Marathi (In Pipeline) Allgemeng GespréichsdatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,Desktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechMarathi_CC_8MarathiMarathi (In Pipeline) mr_INCall Center60Marathi (In Pipeline) Call-Center DatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,Desktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechMalayalam_MAMalajalamMalayalam (In Pipeline) ml_ENGMedia Audio40Malayalam (In Pipeline) Medien AudiodatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechMalayalam_GCMalajalamMalayalam (In Pipeline) ml_ENGAllgemeng Gespréich100Malayalam (In Pipeline) Allgemeng GespréichsdatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,Desktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechMalayalam_CC_8MalajalamMalayalam (In Pipeline) ml_ENGCall Center60Malayalam (In Pipeline) Call-Center DatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,Desktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechMalay_MA_16MalaieschMalaieschms_MENG16 kHzMedia Audio344Malay Media Audio DatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenMonoWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 236, Männlech 626, Onbekannt 47
SpeechMalay_GC_8MalaieschMalaieschms_MENG8 kHzAllgemeng Gespréich266Malayesch Allgemeng GespréichsdatenUnscripted telefonesch Gespréich tëscht zwee Leit. ca. Audio Dauer (Gamme) - 15-60 Minutten, Malayesch a MalaysiaDualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 316, Männlech 176, Onbekannt 0
SpeechTelugu_GC_8TeluguTelugute_IN8 kHzAllgemeng Gespréich553Telugu Allgemeng GespréichsdatenUnscripted telefonesch Gespréich tëscht zwee Leit. ca. Audio Dauer (Gamme) - 15-60 Minutten, DualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 574, Männlech 564, Onbekannt 0
SpeechUK Englesch_WW_16UK EngleschUK Engleschen_uk16 kHzWake Word200 SpriecherWake Word UK Engleschkeyphrases Sammlung vun Donnéeën
  • 200 Spriecher
  • 4 eenzegaarteg Schlësselwierder pro Lautsprecher
  • 25-30 widderholl Keyphrasen Opzeechnunge pro eenzegaarteg Keyphrase
  • 25-30 Audiodateien pro eenzegaarteg Schlësselphrase
  • 120 total opgeholl Aussoen pro Spriecher
1 KanalMobile App5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingGeschlecht: 50% männlech, 50% weiblech, +/- 10%.
SpeechWelsh_GC_8Waliser (Englesch Akzent)Waliser (Englesch Akzent)en_WL8 kHzAllgemeng Gespréich278Waliser Allgemeng GespréichsdatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,DualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 270, Männlech 324, Onbekannt 0
SpeechVietnamesesch_MA_16VietnameseschVietnameseschvi_VN16 kHzMedia Audio257Vietnamesesch Media Audio DatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenMonoWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 249, männlech 200, Onbekannt 45
SpeechVietnamesesch_GC_8VietnameseschVietnameseschvi_VN8 kHzAllgemeng Gespréich295Vietnamesesch Allgemeng GespréichsdatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Beräich) 5-15 Minutten, Norden (zB Hanoi), Zentral a Süd (zB Ho Chi Minh City).DualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 400, männlech 380, Onbekannt 2
SpeechTierkesch Tierkei_SM_48Tierkesch TierkeiTierkesch Tierkeitr-TR48 kHzSchrëftlech Monolog2,027Tierkesch TierkeiEenzegaarteg Opzeechnunge, déi éischter am 5 bis 30 Sekonne Beräich falenMonoMobile App5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 1561 Männlech 1241 Onbekannt 31
SpeechThai_MA_8ThaiThaiden_TH16 kHzMedia Audio173Thai Media AudioLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenMonoWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 143, Männlech 502, Onbekannt 26
SpeechThai_GC_8ThaiThaiden_TH8 kHzAllgemeng Gespréich183Thai Allgemeng GespréichUnscripted telefonesch Gespréich tëscht zwee Leit. ca. Audio Dauer (Gamme) - 15-60 Minutten, En informelle Register tëscht Frënn benotztDualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 338, Männlech 96, Onbekannt 8
SpeechTelugu_MATeluguTelugu (In Pipeline) te_INMedia Audio20Telugu (In Pipeline) Media AudiodatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechTelugu_GCTeluguTelugu (In Pipeline) te_INAllgemeng Gespréich50Telugu (In Pipeline) Allgemeng GespréichsdatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,Desktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechTelugu_CC_8TeluguTelugu (In Pipeline) te_INCall Center30Telugu (In Pipeline) Call-Center DatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,Desktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechTelugu_MA_16TeluguTelugute_IN16 kHzMedia Audio648Telugu Media AudiodatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenMonoWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 207, Männlech 963, Onbekannt 2
SpeechKoreanesch_SM_48koreaneschkoreaneschko-KR48 kHzSchrëftlech Monolog1,955Koreanesch Scripted MonologEenzegaarteg Opzeechnunge, déi éischter am 5 bis 30 Sekonne Beräich falenMonoMobile App5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 1195 Männlech 1134 Onbekannt 122
SpeechTamil_MATamil Tamil (an der Pipeline) ta_INMedia Audio40Tamil (In Pipeline) Medien AudiodatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechTamil_GCTamilTamil (an der Pipeline) ta_INAllgemeng Gespréich100Tamil (An Pipeline) Allgemeng GespréichsdatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,Desktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechTamil_CC_8TamilTamil (an der Pipeline) ta_INCall Center60Tamil (In Pipeline) Call-Center DatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,Desktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechSchwedesch_MA_16schwedeschschwedeschsv_SE16 kHzMedia Audio278Schwedesch Media Audio DatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenMonoWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 195, männlech 500, Onbekannt 21
SpeechSchwedesch_CC_8schwedeschschwedeschsv_SE8 kHzCall Center250Schwedesch Call-Center DatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,DualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 1581, männlech 727, Onbekannt 2
SpeechSwahili_MA_16SwahiliSwahilisw_KE16 kHzMedia Audio265Swahili Media Audio DatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenMonoWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 118, Männlech 493, Onbekannt 25
SpeechSwahili_CC_8SwahiliSwahilisw_KE8 kHzCall Center230Swahili Call-Center DatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,DualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 611, Männlech 833, Onbekannt 0
SpeechSüdafrikanesch Englesch_MA_16Südafrikanesch EngleschSüdafrikanesch Engleschen_ZA16 kHzMedia Audio251South African Englesch Media Audio DatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenMonoWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 235, Männlech 432, Onbekannt 36
SpeechSüdafrikanesch Englesch_CC_8Südafrikanesch EngleschSüdafrikanesch Engleschen_ZA8 kHzCall Center261South African Englesch Call-Center datenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,DualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 1274 , Männlech 935 , Onbekannt 1
SpeechSingapur_MA_16Singapur EngleschSingapur Engleschen_SG16 kHzMedia Audio247Singapur Media Audio DatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenMonoWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 160, Männlech 455, Onbekannt 37
SpeechSingapur_CC_8Singapur EngleschSingapur Engleschen_SG8 kHzCall Center218Singapur Call-Center DatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,DualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 2139, Männlech 884, Onbekannt 21
SpeechBoston_CC_8Boston EngleschBoston Engleschen_US8 kHzCall Center177Boston Call-Center DatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,DualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech: 605, Männlech: 711, an Onbekannt: 0
SpeechEnglesch Deep South_CC_8Englesch Deep SouthEnglesch Deep Southen_US8 kHzCall Center151Englesch Deep South Call-Center datenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,DualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 221 , Männlech 1004 , Onbekannt 7
SpeechDänesch_SM_48däneschdäneschda-DK48 kHzSchrëftlech Monolog2,579Dänesch SchrëftmonologEenzegaarteg Opzeechnunge, déi éischter am 5 ze falen ze 30 zweet Beräich, Dänesch aus DänemarkMonoMobile App5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 1551 Männlech 1233 Onbekannt 42
SpeechDänesch_MA_16däneschdäneschda_DK16 kHzMedia Audio664Dänesch Media Audio DatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenMonoWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech: 369, Männlech: 864, Onbekannt: 27
SpeechDänesch_GC_8däneschdäneschda_DK8 kHzAllgemeng Gespréich372Dänesch Allgemeng Gespréich datenUnscripted telefonesch Gespréich tëscht zwee Leit. ca. Audio Dauer (Gamme) - 15-60 Minutten, DualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech: 311, Männlech: 417, Onbekannt: 0
SpeechChinesesch Traditionell_SM_48Chinesesch TraditiounChinesesch Traditiounzh-TW48 kHzSchrëftlech Monolog1,028Chinesesch TraditiounEenzegaarteg Opzeechnunge, déi éischter am 5 bis 30 Sekonne Beräich falenMonoMobile App5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 1069 Männlech 262 Onbekannt 3
SpeechChinesesch vereinfacht_SM_48Chinesesch SimplifizéiertChinesesch SimplifizéiertZH-CN48 kHzSchrëftlech Monolog2,762Chinesesch SimplifizéiertEenzegaarteg Opzeechnunge, déi éischter am 5 bis 30 Sekonne Beräich falenMonoMobile App5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 1920 Männlech 1535 Onbekannt 270
SpeechChinesesch_MA_16Chinesesch EngleschChinesesch Engleschen_US16 kHzMedia Audio249Chinesesch Medien AudiodatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenMonoWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech: 126, Männlech: 346 an Onbekannt: 6
SpeechChinesesch_CC_8Chinesesch EngleschChinesesch Engleschen_US8 kHzCall Center169Chinese Call-Center DatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,DualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech: 1790, Männlech: 523 an Onbekannt: 13
SpeechKanadesch_SM_48Kanadesch FranséischKanadesch Franséischfr-CA48 kHzSchrëftlech Monolog1,222Kanadesch FranséischEenzegaarteg Opzeechnunge, déi éischter am 5 bis 30 Sekonne Beräich falenMonoMobile App5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 974 Männlech 631 Onbekannt 1
SpeechBoston_MA_16Boston EngleschBoston Engleschen_US16 kHzMedia Audio93Boston Media Audio DatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenMonoWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech: 43, Männlech: 181, an Onbekannt: 2
SpeechBoston_GC_8Boston EngleschBoston Engleschen_US8 kHzAllgemeng Gespréich32Boston General Gespréich datenUnscripted telefonesch Gespréich tëscht zwee Leit. ca. Audio Dauer (Gamme) - 15-60 Minutten, DualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech: 53, Männlech: 83, an Onbekannt: 0
SpeechEnglesch Deep South_GC_8Englesch Deep SouthEnglesch Deep Southen_US8 kHzAllgemeng Gespréich56Englesch Deep South Allgemeng Gespréich datenUnscripted telefonesch Gespréich tëscht zwee Leit. ca. Audio Dauer (Gamme) - 15-60 Minutten, DualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 99, Männlech 31, Onbekannt 0
SpeechBengalesch_MABengaleschBengalesch (In Pipeline) bn_INMedia Audio40Bengalesch (In Pipeline) Medien AudiodatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechBengalesch_GCBengaleschBengalesch (In Pipeline) bn_INAllgemeng Gespréich100Bengalesch (In Pipeline) Allgemeng GespréichsdatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,Desktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechBengalesch_CC_8BengaleschBengalesch (In Pipeline) bn_INCall Center60Bengalesch (In Pipeline) Call-Center DatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,Desktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechAssamese_MAAssameschAssamese (In Pipeline) wéi anMedia Audio40Assamese (In Pipeline) Medien AudiodatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechAssamese_GCAssameschAssamese (In Pipeline) wéi anAllgemeng Gespréich100Assamese (In Pipeline) Allgemeng GespréichsdatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,Desktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechAssamese_CC_8AssameschAssamese (In Pipeline) wéi anCall Center60Assamese (In Pipeline) Call-Center DatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,Desktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechArabesch_SM_48arabescharabeschar-SA48 kHzSchrëftlech Monolog1,947Arabesch Schrëft MonologEenzegaarteg Opzeechnunge, déi éischter am 5 bis 30 Sekonne Beräich falenMonoMobile App5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 838 Männlech 1209 Onbekannt 78
SpeechArabesch_GC_8arabescharabeschar_AE8 kHzAllgemeng Gespréich292Arabesch Allgemeng GespréichsdatenUnscripted telefonesch Gespréich tëscht zwee Leit. ca. Audio Dauer (Gamme) - 15-60 Minutten, Arabesch aus GolflännerDualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech: 171, Männlech: 534, an Onbekannt: 1
SpeechAfrikaans_MA_16AfrikaansAfrikaansaf_ZA16 kHzMedia Audio658Afrikaans Media DateienLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenMonoWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech: 750, Männlech: 1278, an Onbekannt: 52
SpeechAfrikaans_GC_8AfrikaansAfrikaansaf_ZA8 kHzAllgemeng Gespréich368Afrikaans Allgemeng Gespréich datenUnscripted telefonesch Gespréich tëscht zwee Leit. ca. Audio Dauer (Range) - 15-60 Minutten, Afrikaans geschwat an AfrikaDualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech: 502, Männlech: 390, an Onbekannt: 2
Speechen_US_MA_16African American VernacularAfrican American Vernacularen_US16 kHzMedia Audio154African American Vernacular Media datenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenMonoWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech: 151, Männlech: 150, an Onbekannt: 10
SpeechHINGLISH_MA_16HinglishHinglishhg_ENG16 kHzMedia Audio216HINGLISH Media Audio DatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenMonoWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 75, Männlech 380, Onbekannt 0
SpeechKoreanesch_MA_16koreaneschkoreaneschko_KR16 kHzMedia Audio204Koreanesch Medien AudiodatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenMonoWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 70 Männlech 303, Onbekannt 25
SpeechKoreanesch_CC_8koreaneschkoreaneschko_KR8 kHzCall Center107Koreanesch Call-Center DatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,DualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 1086, Männlech 210, Onbekannt 4
SpeechKannada_MAKannadaKannada (In Pipeline) kn_INMedia Audio40Kannada (In Pipeline) Medien AudiodatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechKannada_GCKannadaKannada (In Pipeline) kn_INAllgemeng Gespréich100Kannada (An Pipeline) Allgemeng GespréichsdatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,Desktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechKannada_CC_8KannadaKannada (In Pipeline) kn_INCall Center60Kannada (In Pipeline) Call-Center DatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,Desktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechJapanesch_SM_48japaneschjapaneschjo-JP48 kHzSchrëftlech Monolog2,335Japanesch Scripted MonologEenzegaarteg Opzeechnunge, déi éischter am 5 bis 30 Sekonne Beräich falenMonoMobile App5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 1460 Männlech 1221 Onbekannt 194
SpeechIrish_GC_8lëtzebuergeschlëtzebuergeschen_IE8 kHzAllgemeng Gespréich192Irish General Gespréich datenUnscripted telefonesch Gespréich tëscht zwee Leit. ca. Audio Dauer (Gamme) - 15-60 Minutten, DualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 213 , Männlech 153 , Onbekannt 0
SpeechIndonesesch_MA_16IndoneseschIndoneseschech hu gemaach16 kHzMedia Audio643Indonesesch Medien Audio DatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenMonoWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 746, Männlech 1507, Onbekannt 129
SpeechIndonesesch_GC_8IndoneseschIndoneseschech hu gemaach8 kHzAllgemeng Gespréich496Indonesesch Allgemeng GespréichsdatenUnscripted telefonesch Gespréich tëscht zwee Leit. ca. Audio Dauer (Gamme) - 15-60 Minutten, Bahasa indoneseschDualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 524, Männlech 454, Onbekannt 2
SpeechHispanic_MA_16Hispanesch EngleschHispanesch Engleschen_US16 kHzMedia Audio155Hispanic Call Media AudioLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenMonoWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 140, Männlech 219, Onbekannt 5
SpeechHispanic_CC_8Hispanesch EngleschHispanesch Engleschen_US8 kHzCall Center212Hispanic Call-Center DatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,DualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 822, Männlech 1262, Onbekannt 0
Speechen_US_CC_8African American VernacularAfrican American Vernacularen_US8 kHzCall-Center211African American Vernacular Call-Center datenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,DualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech: 612, Männlech: 1242, an Onbekannt: 12
SpeechHINGLISH_CC_8HinglishHinglishhg_ENG8 kHzCall Center208HINGLISH Call-Center DatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,DualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 822, Männlech 1262, Onbekannt 0
SpeechHindi_SM_48HindiHindiSalut-IN48 kHzSchrëftlech Monolog2,867Hindi Scripted MonologEenzegaarteg Opzeechnunge, déi éischter am 5 bis 30 Sekonne Beräich falenMonoMobile App5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 1977 Männlech 1864 Onbekannt 147
SpeechHindi_MA_16HindiHindihi_IN16 kHzMedia Audio219Hindi Media Audio DatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenMonoWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 83, Männlech 309, Onbekannt 0
SpeechHebräesch_MA_16HebräeschHebräeschhien_IL16 kHzMedia Audio427Hebräesch Media AudiodatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenMonoWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 361, Männlech 513, Onbekannt 13
SpeechHebräesch_Allgemeng Gespréich_8HebräeschHebräeschhien_IL8 kHzAllgemeng Gespréich399Hebräesch Allgemeng GespréichsdatenUnscripted telefonesch Gespréich tëscht zwee Leit. ca. Audio Dauer (Gamme) - 15-60 Minutten, Hebräesch an IsraelDualDesktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 414 , Männlech 399 , Onbekannt 1
SpeechGujarati_MAGujaratiGujarati (In Pipeline) gu_INMedia Audio40Gujarati (In Pipeline) Medien AudiodatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechGujarati_GCGujaratiGujarati (In Pipeline) gu_INAllgemeng Gespréich100Gujarati (An Pipeline) Allgemeng GespréichsdatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,Desktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechGujarati_CC_8GujaratiGujarati (In Pipeline) gu_INCall Center60Gujarati (In Pipeline) Call-Center DatenUnscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,Desktop5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpeechDäitsch_IVR_8däitschdäitschde-De8 kHz IVR200Däitsch IVR DatenMënsch zu Maschinn. En IVR Typ vu Flux wou et eng TTS Prompt ass (zB "Wéi kann ech Iech hëllefen") gefollegt vun enger spontaner mënschlecher ÄntwertMonoDesktop.wav .jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling Weiblech 10115 Männlech 8750 Onbekannt 0
SpeechDäitsch_CC_8däitschdäitschde-De8 kHzCall Center64Däitsch Call-Center Daten Unscripted, synthetescht telefonescht Gespréich tëscht "Agent" an "Client", Ca. Audio Dauer (Gamme) 5-15 Minutten,MonoDesktop.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 478 Männlech 1440 Onbekannt 0
SpeechEnglesch Deep South_MA_16Englesch Deep SouthEnglesch Deep Southen_US16 kHzMedia Audio266Englesch Deep South Media Audio DatenLizenzierbar Public Domain Audio / Video Dateien wéi Interviewen, Podcasts etc - 1 bis 5 Leit. ca. Audio Dauer (Gamme) 15-60 MinuttenMonoWeb Sourcing5.0.wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingWeiblech 204, Männlech 356, Onbekannt 21

Servicer ugebueden

Expert Audiodatensammlung ass net all Hand-on-Deck fir ëmfaassend AI Setups. Bei Shaip kënnt Dir souguer déi folgend Servicer betruechten fir Modeller méi verbreet ze maachen wéi soss:

Text Datensammlung

Text Daten Kollektioun
Servicer

De richtege Wäert vu Shaip kognitiven Datesammlungsservicer ass datt et Organisatiounen de Schlëssel gëtt fir kritesch Informatioun ze spären, déi an onstrukturéierten Daten fonnt gëtt.

Bilddatensammlung

Image Data Collection Services

Gitt sécher datt Äre Computervisiounsmodell all Bild präzis identifizéiert, fir nahtlos nächst Generatioun AI Modeller vun der Zukunft ze trainéieren

Video Daten Kollektioun

Video Data Collection Services

Fokusséiert elo op Computervisioun zesumme mat NLP fir Är Modeller ze trainéieren fir Objeten, Eenzelpersounen, Ofschreckungen an aner visuell Elementer zu Perfektioun ze identifizéieren

Shaip kontaktéiert eis

Wëllt Dir Ären eegene Audiodates bauen?

Connectéiert mat eisem internen Speechdatensammlungsexpert fir en Audiorepository opzestellen deen am Beschten Är Ufuerderung entsprécht

  • Andeems Dir Iech registréiert, sinn ech mam Shaip averstanen Gréisst vun der Datei an Konditioune vum Service a gitt meng Zoustëmmung fir B2B Marketing Kommunikatioun vu Shaip ze kréien.

Speech Data Collection fir en ML Model bezitt sech op de Prozess fir Audioopname vu geschwate Sprooch ze sammelen. Dës Sammlung hëlleft bei der Ausbildung an der Verfeinerung vun Maschinnléieralgorithmen, besonnesch déi, déi sech op d'Versteesdemech an d'Veraarbechtung vu mënschleche Stëmmen konzentréieren.

Wann Dir zielt fir Audiodaten fir Automatesch Speech Recognition (ASR) ze sammelen, sollt Dir ufänken mat Äre spezifesche Bedierfnesser vun Ärem Projet ze definéieren, dorënner déi gewënscht Sprooch, Akzent an Aart vu Ried. Nodeems Dir dës Parameteren agestallt hutt, gitt sécher datt Dir all néideg Permissiounen kritt fir d'Privatsphär vum Benotzer ze respektéieren. Dann benotzt entspriechend Opnamapparater oder Software fir kloer Audioproben z'erreechen. All Opzeechnung soll virsiichteg mat senger Transkriptioun oder aner pertinent Metadaten annotéiert ginn a systematesch gespäichert ginn fir einfach Zougang.

E Riedsdatenset am Maschinnléieren ass pivotal fir Training, Testen a Validéiere vu Modeller, déi geschnidde sinn fir geschwat Sprooch ze erkennen, ze transkriberen oder ze interpretéieren. Esou Datesätz bannen de Wee fir eng Onmass vun Uwendungen, vu Stëmmassistenten an Transkriptiounsservicer bis Stëmmbiometrie.

Fir präzis Daten aus verschiddene Sproochen an Akzenter ze sammelen, ass d'Zesummenaarbecht mat Mammesproochler vun de gewënschten sproochlechen Hannergrënn vital. Zil fir eng variéiert a representativ Probe fir e breet Spektrum vun demographeschen Nuancen ze decken. Benotzt standardiséierter Opnamausrüstung an eenheetlechen Ëmfeld fir Audiokonsistenz ze garantéieren. A Wichteg, annotéiert all Datenstéck mat detailléierte Transkriptiounen a Metadaten, déi spezifesch Sprooch an Akzent bezeechnen.