Datesammlung Fir Conversational AI

Wéi Approche Datensammlung fir Conversational AI

Haut hu mir e puer schwätzt Roboteren als Chatbots, virtuelle Assistenten, a méi an eisen Haiser, Autosystemer, portable Geräter, Heemautomatiséierungsléisungen, etc. Dës Apparater lauschteren präzis op wat mir soen a wéi mir soen a Resultater recuperéieren oder spezifesch Aufgaben ausféieren .

A wann Dir en Assistent benotzt hutt wéi Siri oder Alexa, Dir géift och mierken datt se vum Dag méi quirkier ginn. Hir Äntwerte si witzeg, si schwätzen zréck, si snub, ginn Komplimenter zréck a behuelen méi mënschlech wéi e puer vun de Kollegen, déi Dir kennt. Mir maachen kee Geck. Laut PwC, 27% vun de Benotzer, déi mat hirem rezenten Client Service Associé interagéiert hunn, woussten net ob se mat engem Mënsch oder engem Chatbot geschwat hunn.

Esou komplizéiert Gespréichssystemer an Apparater entwéckelen ass héich komplex an beängschtegend. Et ass en anert Ballspill ganz mat ënnerschiddlechen Entwécklungs Approche. Dofir hu mir geduecht datt mir et fir Iech sollten ofbriechen fir méi einfach ze verstoen. Also, wann Dir sicht e Gespréichs-AI-Motor oder e virtuellen Assistent z'entwéckelen, wäert dëse Guide Iech hëllefen Kloerheet ze kréien.

Bedeitung vun Conversational AI

Wéi d'Technologie e méi integralen Aspekt vun eisem Liewen gëtt a Form vun méi neien Apparater a Systemer, entsteet e Besoin fir Barrièren ze drécken, Konventiounen ze briechen an nei Weeër ze kommen fir mat hinnen ze interagéieren. Vun einfach mat verbonne Peripheriegeräter wéi Maus a Tastatur, hu mir op Mauspads gewiesselt, déi méi Komfort ubidden. Mir sinn dunn op Touchscreens migréiert déi weider Komfort ubidden fir Inputen ze fidderen an Aufgaben auszeféieren.

Mat Geräter déi Extensiounen vun eis selwer ginn, späre mir elo en neit Medium op fir duerch Stëmm ze commandéieren. Mir brauchen net emol bei engem Apparat ze sinn fir en ze bedreiwen. Alles wat mir maache mussen ass eis Stëmm benotzen fir se opzemaachen an eis Inputen ze commandéieren. Aus engem Emgéigend Raum, wann Dir fuert, wärend en aneren Apparat gläichzäiteg benotzt, konversativ AI mécht eis virgesinn Aufgaben nahtlos aus. Also wou fänken mir un - et fänkt alles mat héichqualitativen Rieddaten un fir ML Modeller ze trainéieren.

D'Grondlage fir Speech Training Daten ze sammelen

AI Trainingsdaten sammelen an annotéieren fir konversativ AI ass ganz anescht. Et gi Tonne Komplikatiounen a mënschleche Kommandoen involvéiert a verschidde Moossname musse implementéiert ginn fir sécherzestellen datt all Aspekt fir Impakt Resultater ënnerbruecht ass. Loosst eis kucken wat e puer vun de Fundamenter vu Rieddaten sinn.

Natural Language Understanding (NLU)

Fir Chatbots a virtuell Assistenten ze verstoen an ze reagéieren op wat mir Text oder Kommando, e Prozess genannt NLU ëmgesat gëtt. Et steet fir Natierlech Sprooch verstoen an involvéiert dräi Tech Konzepter fir verschidden Inputtypen ze interpretéieren an ze veraarbechten.

  • Absicht

    Et fänkt alles mat Absicht un. Wat probéiert e bestëmmte Benotzer duerch e Kommando ze vermëttelen, ze kommunizéieren oder z'erreechen? Sicht de Benotzer no Informatioun? Waarde se op Updates fir eng Aktioun? Sinn se eng Instruktioun fir de System auszeféieren? Wéi commandéieren se et? Ass et duerch eng Fro oder eng Ufro? All dës Aspekter hëllefen Maschinnen ze verstoen an ze klassifizéieren Intent an Zwecker fir mat loftdichte Äntwerten ze kommen.

  • Ausso Sammlung

    Et gëtt en Ënnerscheed tëscht dem Kommando "Wou ass den noosten Geldautomaten?" an de Kommando "Fannt mir en nooste Geldautomaten." Elo géifen d'Mënschen unerkennen datt béid datselwecht bedeiten awer Maschinnen musse mat dësem Ënnerscheed erkläert ginn. Si sinn d'selwecht wat d'Intent ugeet, awer wéi d'Intent geformt gouf ass komplett anescht.

    Aussproochsammlung ass alles ëm d'Definitioun an d'Kaart vun verschiddenen Aussoen a Sätze Richtung spezifesch Ziler fir déi präzis Ausféierung vun Aufgaben an Äntwerten. Technesch schaffen Datenannotatiounsspezialisten op Rieddaten oder Textdaten fir Maschinnen ze hëllefen dëst z'ënnerscheeden.

  • Entitéit Extraktioun

    All Saz huet spezifesch Wierder oder Ausdréck déi d'Gewiicht betount hunn an et ass dëse Schwéierpunkt deen zu enger Interpretatioun vum Kontext an Zweck féiert. Maschinnen, wéi déi steiwe Systemer déi se sinn, mussen esou Entitéite mat Läffel gefüttert ginn. Zum Beispill, "Wou kann ech Strings vu menger Gittar bei der 6th Avenue fannen?"

    Wann Dir de Saz raffinéiert, fannen ass Entitéit eent, Strings sinn zwee, d'Gittar ass dräi an déi 6. Avenue ass 4. Dës Entitéite gi vu Maschinnen zesummegefaasst fir entspriechend Resultater ze recuperéieren a fir dëst ze geschéien, schaffen Experten um Backend.

Off-the-shelf Voice / Speech / Audio Datasets fir Äre Gespréich AI Modell méi séier ze trainéieren

Design Dialogue Fir Conversational AI

D'Zil vun AI ass haaptsächlech mënschlecht Verhalen duerch Gesten, Handlungen an Äntwerten replizéiert. De bewosst mënschleche Geescht huet déi gebierteg Fäegkeet Kontext, Absicht, Toun, Emotiounen an aner Faktoren ze verstoen an deementspriechend z'äntwerten. Awer wéi kënnen Maschinnen dës Aspekter ënnerscheeden? 

Design Dialogen fir konversativ AI ass ganz komplex a méi wichteg, ganz onméiglech fir en universelle Modell auszerollen. Jiddereen huet eng aner Manéier fir ze denken, ze schwätzen an ze reagéieren. Och an Äntwerte artikuléiere mir all eis Gedanken eenzegaarteg. Also, Maschinnen mussen nolauschteren an deementspriechend reagéieren. 

Dëst ass awer och net glat. Wann d'Mënsche schwätzen, kommen Faktore wéi Akzenter, Aussprooch, Ethnie, Sprooch a méi eran an et ass net einfach fir Maschinnen Wierder falsch ze verstoen an z'interpretéieren an zréck ze reagéieren. E bestëmmte Wuert ka vu Maschinnen op eng Onmass vu Weeër verstane ginn wann se vun engem Indianer diktéiert ginn, eng Brit, en Amerikaner an engem Mexikanesch. Et ginn Tonne Sproochebarrièren déi an d'Spill kommen an de prakteschste Wee fir mat engem Äntwertsystem ze kommen ass duerch visuell Programméierung déi Flowchart-baséiert ass. 

Duerch engagéierten Blocks fir Gesten, Äntwerten an Ausléiser, Auteuren an Experten kënnen Maschinnen hëllefen e Charakter z'entwéckelen. Dëst ass méi wéi eng Algorithmus Maschinn ka benotze fir mat de richtege Äntwerten ze kommen. Wann en Input gefüttert gëtt, fléisst d'Informatioun duerch entspriechend Faktoren, wat zu der richteger Äntwert féiert fir Maschinnen ze liwweren. 

Wielt D Fir Diversitéit

Wéi mir ernimmt, mënschlech Interaktiounen si ganz eenzegaarteg. Leit ronderëm d'Welt kommen aus verschiddene Spazéieren vum Liewen, Hannergrënn, Nationalitéiten, Demographie, Ethnie, Akzenter, Diktioun, Aussprooch, a méi. 

Fir e Gespréichsbot oder e System universell operabel ze sinn, muss et mat sou divers Trainingsdaten wéi méiglech trainéiert ginn. Wann zum Beispill e Modell nëmme mat Rieddaten vun enger bestëmmter Sprooch oder Ethnie trainéiert gouf, géif en neien Akzent de System duercherneen bréngen an zwéngen falsch Resultater ze liwweren. Dëst ass net nëmme peinlech fir Geschäftsbesëtzer, awer och beleidegend fir Benotzer. 

Dofir sollt d'Entwécklungsphase AI Trainingsdaten aus engem räiche Pool vu verschiddenen Datesätz involvéieren, besteet aus Leit aus all méiglechen Hannergrënn. Der méi Akzenter an ethnicities Äre System versteet, der méi universell wier et. Ausserdeem, wat d'Benotzer méi generéiere géif ass net falsch Erhuelung vun Informatioun, awer Versoen hir Input an der éischter Plaz ze verstoen. 

D'Eliminatioun vun Bias soll eng Schlësselprioritéit sinn an ee Wee fir Firmen dëst maache kënnen ass andeems se fir crowdsourced Daten entscheeden. Wann Dir Är Rieddaten oder Textdaten crowdsourcet, erlaabt Dir Leit aus der ganzer Welt un Är Ufuerderunge bäizedroen, sou datt Ären Datepool nëmme gesond ass (Lies eis Blog fir d'Virdeeler an d'Feele vun der Outsourcing vun Daten un d'Crowdsource Aarbechter ze verstoen). Elo wäert Äre Modell verschidden Akzenter an Aussoen verstoen an deementspriechend reagéieren. 

De Wee Forward

Konversativ AI z'entwéckelen ass sou schwéier wéi e Puppelchen z'erhiewen. Deen eenzegen Ënnerscheed ass datt d'Kand schlussendlech wäert wuessen fir Saachen ze verstoen a besser ze ginn autonom ze kommunizéieren. Et sinn d'Maschinnen déi konsequent gedréckt musse ginn. Et gi verschidde Erausfuerderungen an dësem Raum de Moment a mir sollten d'Tatsaach unerkennen datt mir e puer vun de revolutionärsten konversativen AI Systemer hunn, déi trotz dësen Erausfuerderunge kommen. Loosst eis waarden a kucken wat d'Zukunft fir eis frëndlech Quartier Chatbots a virtuell Assistenten hält. Mëttlerweil, wann Dir wëlles Gespréichs-AI wéi Google Home fir Äert Geschäft entwéckelt, kontaktéiert eis fir Är AI Trainingsdaten an Annotatiounsbedürfnisser.

Sozial Share