De Schlëssel fir AI Entwécklung Hindernisser ze iwwerwannen
Méi zouverlässeg Donnéeën
Introduktioun
Kënschtlech Intelligenz huet ugefaang Phantasie z'erreechen, wéi den Tin Man aus "The Wizard of Oz" am Joer 1939 de Sëlwerbildschierm getraff huet, an et huet zënterhier nëmmen e méi feste Fouss an der Zeitgeist kritt. An der Applikatioun sinn awer AI Produkter duerch reegelméisseg Boom-a-Bust-Zyklen gaang, déi bis elo déi beaflosst Adoptioune gestoppt hunn.
Wärend de Bommen hunn d'Ingenieuren a Fuerscher enorm Schrëtt gemaach, awer wann hir Striewe onweigerlech d'Informatikfäegkeeten déi zu där Zäit verfügbar sinn iwwerschreiden, ass eng Period vun der Dormanz gefollegt. Glécklecherweis ass déi exponentiell Erhéijung vun der Rechenkraaft, déi vum Moore säi Gesetz am Joer 1965 profetéiert gouf, zum gréissten Deel richteg bewisen, an d'Bedeitung vun dëser Erhéijung ass schwéier ze iwwerschätzen.

Liest d'eBook: De Schlëssel fir d'AI Entwécklung Hindernisser ze iwwerwannen, oder download eng PDF Versioun vum eBook.
De Schlëssel fir AI Entwécklung Hindernisser ze iwwerwannen: Méi zouverlässeg Donnéeën
Haut huet déi duerchschnëttlech Persoun elo Millioune Mol méi Rechenkraaft an hirer Täsch wéi d'NASA d'Moundlandung am Joer 1969 huet missen ofzéien. Deeselwechten ubiquitären Apparat, dee bequem eng Iwwerfloss vu Rechenkraaft weist, erfëllt och eng aner Viraussetzung fir dem AI säi gëllenen Zäitalter: en Iwwerfloss vun Daten. Laut Abléck vum Information Overload Research Group sinn 90% vun den Daten vun der Welt an de leschten zwee Joer erstallt ginn. Elo datt den exponentielle Wuesstum vun der Rechenkraaft endlech mam gläiche meteoresche Wuesstum an der Generatioun vun Daten konvergéiert ass, explodéieren AI Dateninnovatiounen sou vill datt e puer Experten mengen datt eng véiert Industriell Revolutioun sprangen.
Date vun der National Venture Capital Association weisen datt den AI Secteur e Rekord $6.9 Milliarden an Investitiounen am éischte Véierel vun 2020 gesinn huet. E puer vun de méi sichtbare Benotzungsfäll fir AI Produkter sinn d'Empfehlungsmotoren hannert eise Liiblingsapplikatiounen wéi Spotify an Netflix. Och wann et lëschteg ass en neie Kënschtler ze entdecken fir no ze lauschteren oder eng nei Fernsehsendung fir ze kucken, sinn dës Implementatiounen zimlech niddereg. Aner Algorithmen bewäerten Tester Scores - deelweis bestëmmen wou d'Studenten an d'Uni akzeptéiert ginn - an nach anerer sift duerch Kandidate-CVS, entscheede wéi eng Bewerber eng bestëmmte Aarbecht kréien. E puer AI Tools kënne souguer Liewen-oder-Doud Implikatioune hunn, sou wéi den AI Modell deen op Broschtkriibs screent (wat d'Dokteren besser mécht).
Trotz stännege Wuesstum a béid real-Welt Beispiller vun der AI Entwécklung an der Unzuel vun Startups, déi sech streiden fir déi nächst Generatioun vun Transformatiounsinstrumenter ze kreéieren, bleiwen Erausfuerderunge fir effektiv Entwécklung an Implementatioun. Besonnesch AI Output ass nëmmen esou korrekt wéi den Input erlaabt, dat heescht Qualitéit ass wichteg.
D'Erausfuerderung vun inkonsistenter Datequalitéit an AI Léisungen
Et gëtt wierklech eng onheemlech Quantitéit un Daten déi all Dag generéiert ginn: 2.5 Quintillion Bytes, laut Social Media Today. Awer dat heescht net datt et alles wäert ass Ären Algorithmus ze trainéieren. E puer Donnéeën sinn onkomplett, e puer sinn niddereg-Qualitéit, an e puer sinn einfach ongenau, sou datt eng vun dëser falscher Informatioun benotzt gëtt déiselwecht Charakteristiken aus Ärer (deierer) AI Dateninnovatioun. Geméiss der Fuerschung vu Gartner, wäerten ongeféier 85% vun AI Projeten, déi bis 2022 erstallt goufen, ongenau Resultater produzéieren wéinst partizipativen oder ongenauen Donnéeën. Och wann Dir e Song Empfehlung einfach iwwerspréngt, deen Äre Goût net passt, kommen aner ongenau Algorithmen op bedeitend finanziell a renomméiert Käschte.
Am Joer 2018 huet Amazon ugefaang en AI-ugedriwwenen Hiring-Tool ze benotzen, a Produktioun zënter 2014, deen eng staark an onverkennbar Viraussetzung géint Fraen hat. Et stellt sech eraus datt d'Computermodeller, déi d'Tool ënnersträichen, trainéiert goufen mat Resuméen, déi der Firma iwwer e Jorzéngt presentéiert goufen. Well déi meescht Tech Bewerber Männer waren (a sinn nach ëmmer, vläicht wéinst dëser Technologie), huet den Algorithmus decidéiert d'Resumés mat "Fraen" iwwerall ze bestrofen - d'Frae Fussball Kapitän oder d'Fraen Geschäftsgrupp, zum Beispill. Et huet souguer décidéiert d'Bewerber vun zwee Fraekollegen ze bestrofen. Amazon behaapt datt d'Instrument ni als eenzege Critère benotzt gouf fir potenziell Kandidaten ze evaluéieren, awer Recruteuren hunn de Recommandatiounsmotor gekuckt wann se no neie Mataarbechter gesicht hunn.
D'Amazon Hiring-Tool gouf schlussendlech no Joere vun der Aarbecht ofgeschaaft, awer d'Lektioun dauert, a beliicht d'Wichtegkeet vun der Datequalitéit beim Training vun Algorithmen an AI Tools. Wéi gesäit "héich Qualitéit" Daten aus? Kuerz gesot, et kontrolléiert dës fënnef Këschte:
1. Relevant
Fir als qualitativ héichwäerteg ugesi ze ginn, mussen d'Donnéeën eppes wäertvollt an den Entscheedungsprozess bréngen. Gëtt et eng Korrelatioun tëscht dem Status vun engem Bewerber als StaatsChampion Pole Vaulter an hirer Leeschtung op der Aarbecht? Et ass méiglech, awer et schéngt ganz onwahrscheinlech. Andeems Dir Daten erauskënnt déi net relevant sinn, kann en Algorithmus sech fokusséieren op d'Sortéierung duerch d'Informatioun déi tatsächlech d'Resultater beaflosst.
2. Genau
Dës Donnéeën déi Dir benotzt, mussen d'Iddien déi Dir testt präzis duerstellen. Wann net, ass et net wäert. Zum Beispill, Amazon huet säin Hiringalgorithmus trainéiert mat 10 Joer Bewerberresuméen, awer et ass onkloer ob d'Firma d'Informatioun iwwer dës Resuméen als éischt bestätegt huet. Fuerschung vun der Referenzkontrollfirma Checkster weist datt 78% vun de Bewerber léien oder géifen iwwerdenken op enger Aarbechtsapplikatioun ze léien. Wann en Algorithmus Empfehlungsentscheedunge mécht mat engem GPA vum Kandidat, zum Beispill, ass et eng gutt Iddi fir d'éischt d'Authentizitéit vun dësen Zuelen ze bestätegen. Dëse Prozess géif Zäit a Suen huelen, mä et géif och ouni Zweiwel d'Genauegkeet vun Äre Resultater verbesseren.
3. Richteg organiséiert an annotéiert
Am Fall vun engem Hiremodell baséiert op Resuméen ass d'Annotatioun relativ einfach. An engem Sënn kënnt e Resumé vir-annotéiert, och wann et ouni Zweifel Ausnahmen wier. Déi meescht Bewerber lëschten hir Aarbechtserfahrung ënner enger Rubrik "Erfahrung" a relevant Fäegkeeten ënner "Fäegkeeten." Wéi och ëmmer, an anere Situatiounen, wéi Kriibsscreening, wäerten d'Donnéeën vill méi variéiert sinn. D'Informatioun kéint a Form vu medizinescher Imaging kommen, d'Resultater vun enger kierperlecher Duerchmusterung, oder souguer e Gespréich tëscht dem Dokter a Patient iwwer d'Famillgesondheetsgeschicht a Fäll vu Kriibs, ënner anerem Formen vun Daten. Fir datt dës Informatioun zu engem präzisen Erkennungsalgorithmus bäidroe muss, muss se suergfälteg organiséiert an annotéiert ginn fir sécherzestellen datt den AI Modell léiert korrekt Prognosen ze maachen baséiert op de richtegen Inferenzen.
4. Aktuell
Amazon huet probéiert en Tool ze kreéieren deen Zäit a Suen spuere géif andeems se déiselwecht Ugestalltentscheedungen reproduzéieren, déi d'Mënsche maachen a vill manner Zäit. Fir d'Empfehlungen esou korrekt wéi méiglech ze maachen, missten d'Donnéeën um neiste Stand gehale ginn. Wann eng Firma eemol eng Preferenz fir Kandidaten mat der Fäegkeet bewisen huet Schreifmaschinnen ze reparéieren, zum Beispill, hätten dës historesch Hire wahrscheinlech net vill Afloss op d'Fitness vun den haitegen Jobbewerber fir all Zort Roll. Als Resultat wier et schlau se ze läschen.
5. Passend divers
Amazon Ingenieuren hu gewielt en Algorithmus ze trainéieren mat engem Pool vu Bewerber déi iwwerwältegend männlech war. Dës Entscheedung war e kritesche Feeler, an et gëtt net manner schrecklech gemaach duerch d'Tatsaach, datt dat d'Resuméen waren, déi d'Firma deemools verfügbar hat. Amazon Ingenieuren kéinte mat geschätzte Organisatioune mat ähnlechen Partnerschaften zesummeschaffen verfügbare Positiounen, déi méi weiblech Bewerberinnen kritt hunn, fir de Mangel ze kompenséieren, oder et hätt kënnen kënschtlech ofgeschnidden d'Zuel vun de Resumé vu Männer fir d'Zuel vun de Fraen ze passen an trainéiert an guidéiert den Algorithmus mat enger méi genee Representatioun vun der Bevëlkerung. De Punkt ass, datt daten Diversitéit ass Schlëssel, an ausser e konsequent Effort gëtt gemaach fir Bias an Inputen ze eliminéieren, biased Outputs wäerten herrscht.
Kloer, héichqualitativ Donnéeën erschéngen net nëmmen aus néierens. Amplaz muss et suergfälteg curéiert ginn mat den virgesinnen Resultater am Kapp. Am AI Feld gëtt et dacks gesot datt "Müll eran heescht Dreck eraus." Dës Ausso ass richteg, awer et ënnersträicht e bëssen d'Wichtegkeet vun der Qualitéit. AI kann onheemlech Quantitéiten un Informatioun veraarbechten an alles an alles ëmsetzen, vu Aktiewahlen bis Empfehlungen fir medizinesch Diagnosen astellen. Dës Kapazitéit iwwerschreift wäit d'Fäegkeet vu Mënschen, wat och bedeit datt et d'Resultater vergréissert. Ee biaséierte mënschleche Recruteur konnt nëmme sou vill Fraen iwwersinn, awer e biaséierten AI Recruteur kéint se all iwwersinn. An deem Sënn heescht Dreck eran net nëmmen Dreck eraus - et heescht datt eng kleng Quantitéit vun "Dreck" Daten an eng ganz Deponie kënne ginn.
Navigéieren Komplex Konformitéit Ufuerderunge
Wéi wann d'Qualitéitsdaten net schwéier genuch wieren, sinn e puer vun den Industrien, déi am meeschte vun AI Dateninnovatiounen gewannen, och am meeschte reglementéiert sinn. Gesondheetsversuergung ass vläicht dat bescht Beispill, a wärend eng Ëmfro vun HIT Infrastructure fonnt huet datt 91% vun den Industrieinsider mengen datt d'Technologie den Zougang zu der Betreiung kéint verbesseren, gëtt den Optimismus duerch d'Tatsaach temperéiert datt 75% et als eng Bedrohung fir d'Patientesécherheet a Privatsphär gesinn. - an d'Patiente sinn net déi eenzeg a Gefor.
Déi iwwerflësseg Reglementer, déi duerch d'Gesondheetsversécherung Portabilitéit a Verantwortungsgesetz agefouert goufen, kräizen elo mat verschiddene lokalen Datekonformitéitshürden wéi d'European General Date Protection Regulation, de California Consumer Privacy Act an den USA, an d'Personal Data Protection Act zu Singapur. Dës lokal Reglementer wäerte vu vill méi ugeschloss ginn, a wéi Telehealth als eng méi bedeitend Quell vu Gesondheetsdaten erauskënnt, ass et méiglech datt d'Reglementer en nach méi enk Grëff op d'Patientendaten am Transit kréien. Als Resultat wäert dem Shaip seng sécher a konform Cloud Plattform en nach méi wäertvollt Mëttel beweisen fir Gesondheetsdaten ze sammelen an Zougang ze kréien fir AI Produkter ze trainéieren.
Perséinlech identifizéierend Informatioun kann eng bedeitend Bedrohung fir Är AI Entwécklung sinn, awer och eng komplett konform Ëmsetzung ass a Gefor wann et net déi Aart vu genee Resultater liwwere kann, déi nëmme mat diversen Trainingsdaten kommen. Eng 2020 Studie am Journal of the American Medical Association huet bewisen datt Maschinnléieren Algorithmen am medizinesche Beräich meeschtens mat Daten vu Patienten a Kalifornien, New York a Massachusetts trainéiert ginn. Vu datt dës Patienten manner wéi ee Fënneftel vun der US Bevëlkerung representéieren, fir näischt vum Rescht vun der Welt ze soen, ass et schwéier virzestellen wéi dës Modeller alles anescht wéi biased Resultater produzéiere kënnen.
Iwwerwannen AI Entwécklung Hindernisser
AI Entwécklungsefforten enthalen bedeitend Hindernisser egal a wéi enger Industrie se stattfannen, an de Prozess fir vun enger machbarer Iddi op en erfollegräicht Produkt ze kommen ass schwéier. Tëscht den Erausfuerderunge fir déi richteg Donnéeën ze kréien an der Bedierfnes fir se ze anonymiséieren fir all relevant Reglementer ze respektéieren, kann et fille wéi wann en Algorithmus tatsächlech konstruéiert an trainéiert ass den einfachen Deel.
Fir Är Organisatioun all Virdeel ze ginn, deen néideg ass am Effort fir eng banebriechend nei AI Entwécklung ze designen, wëllt Dir iwwerleeë mat enger Firma wéi Shaip ze schaffen. Chetan Parikh a Vatsal Ghiya hunn Shaip gegrënnt fir Firmen ze hëllefen d'Aarte vu Léisungen z'entwéckelen, déi d'Gesondheetsariichtung an den USA transforméiere kënnen. Clienten iwwerzeegend Iddien an AI Léisungen ëmsetzen.
Mat eise Leit, Prozesser a Plattform déi fir Är Organisatioun schaffen, kënnt Dir direkt déi folgend véier Virdeeler opmaachen an Äre Projet op en erfollegräichen Ofschloss katapultéieren:
1. D'Kapazitéit fir Är Datewëssenschaftler ze befreien
Et gëtt kee Wee ronderëm datt den AI Entwécklungsprozess eng bedeitend Investitioun vun Zäit hëlt, awer Dir kënnt ëmmer d'Funktiounen optimiséieren, déi Äert Team am meeschten Zäit verbréngt. Dir hutt Är Datewëssenschaftler agestallt well se Experten an der Entwécklung vun fortgeschrattenen Algorithmen a Maschinnléiere Modeller sinn, awer d'Fuerschung weist konsequent datt dës Aarbechter tatsächlech 80% vun hirer Zäit verbréngen fir d'Sourcing, d'Botzen an d'Organisatioun vun den Donnéeën ze verbréngen, déi de Projet ënnerstëtzen. Méi wéi dräi Véierel (76%) vun den Datewëssenschaftler berichten datt dës alldeeglech Datesammlungsprozesser och hir mannst Liiblingsdeeler vun der Aarbecht sinn, awer de Besoin fir Qualitéitsdaten léisst just 20% vun hirer Zäit fir tatsächlech Entwécklung, wat ass déi interessantst an intellektuell stimuléierend Aarbecht fir vill Datewëssenschaftler. Andeems se Daten duerch en Drëtt-Partei Verkeefer wéi Shaip këmmeren, kann eng Firma hir deier an talentéiert Dateingenieuren hir Aarbecht als Datebehälter outsource loossen an amplaz hir Zäit op den Deeler vun AI-Léisungen verbréngen, wou se dee Wäert produzéiere kënnen.
2. D'Fäegkeet fir besser Resultater z'erreechen
Vertrauen op Open Source Daten ass eng aner gemeinsam Ofkiirzung déi mat sengem eegene Set vu Fallen kënnt. E Mangel un Differenzéierung ass ee vun de gréissten Themen, well en Algorithmus trainéiert mat Open Source Daten ass méi einfach replizéiert wéi een op lizenzéierte Datesets gebaut. Andeems Dir dëse Wee gitt, invitéiert Dir Konkurrenz vun aneren Entrants am Raum, déi Är Präisser ënnersträichen an zu all Moment Maartundeel huelen. Wann Dir op Shaip vertrauen, gitt Dir Zougang zu den héchste Qualitéitsdaten, gesammelt vun engem kompetente geréierten Aarbechtskräften, a mir kënnen Iech eng exklusiv Lizenz fir e personaliséierten Datesaz ginn, deen d'Konkurrenten verhënnert datt Dir Är schwéier gewonnen intellektuell Propriétéit einfach nei erstallt.
3. Zougang zu erfuerene Fachleit
Mat Domainexperten déi Daten fir Iech identifizéieren, organiséieren, kategoriséieren an etikettéieren, wësst Dir datt d'Informatioun benotzt fir Ären Algorithmus ze trainéieren déi bescht méiglech Resultater produzéiere kann. Mir maachen och reegelméisseg Qualitéitssécherung fir sécherzestellen datt d'Donnéeën den héchste Standarden entspriechen an net nëmmen an engem Labo, awer och an enger realer Welt Situatioun funktionnéieren.
4. Eng beschleunegt Entwécklung Timeline
AI Entwécklung geschitt net iwwer Nuecht, awer et ka méi séier geschéien wann Dir mat Shaip Partner. Intern Datensammlung an Annotatioun erstellt e bedeitende operationelle Flaschenhals deen de Rescht vum Entwécklungsprozess ophält. Schaffen mat Shaip gëtt Iech direkten Zougang zu eiser grousser Bibliothéik vun prett-ze-benotzen Donnéeën, an eis Experten kënnen all Zort vun zousätzlech Input ze Quell Dir braucht mat eisem déiwe Industrie Wëssen a globale Reseau. Ouni d'Belaaschtung vun der Sourcing an der Annotatioun, kann Äert Team direkt un der aktueller Entwécklung schaffen, an eise Trainingsmodell kann hëllefe fréi Ongenauegkeeten z'identifizéieren fir d'Iteratiounen ze reduzéieren déi néideg sinn fir Genauegkeetsziler z'erreechen.
Wann Dir net prett sidd all Aspekter vun Ärem Datemanagement ze outsourcen, bitt Shaip och eng Cloud-baséiert Plattform déi Teams hëlleft verschidden Zorte vun Daten méi effizient ze produzéieren, z'änneren an annotéieren, dorënner Ënnerstëtzung fir Biller, Video, Text an Audio. . ShaipCloud enthält eng Vielfalt vun intuitive Validatiouns- a Workflow-Tools, sou wéi eng patentéiert Léisung fir Aarbechtslaascht ze verfolgen an ze iwwerwaachen, en Transkriptiounsinstrument fir komplex a schwiereg Audioopnamen ze transkriéieren, an e Qualitéitskontrollkomponent fir kompromisslos Qualitéit ze garantéieren. Bescht vun allem, et ass skalierbar, sou datt et ka wuessen wéi déi verschidde Fuerderunge vun Ärem Projet eropgoen.
Den Alter vun der AI Innovatioun fänkt just un, a mir wäerten onheemlech Fortschrëtter an Innovatiounen an de kommende Joeren gesinn, déi d'Potenzial hunn fir ganz Industrien z'forméieren oder souguer d'Gesellschaft als Ganzt z'änneren. Bei Shaip wëlle mir eis Expertise benotze fir als transformativ Kraaft ze déngen, déi revolutionärst Firmen op der Welt hëllefen d'Kraaft vun AI-Léisungen ze profitéieren fir ambitiéis Ziler z'erreechen.
Mir hunn déif Erfahrung an Gesondheetsapplikatiounen a konversativ AI, awer mir hunn och déi néideg Fäegkeeten fir Modeller fir bal all Zort Applikatioun ze trainéieren. Fir méi Informatiounen iwwer wéi de Shaip hëllefe kann Äre Projet vun der Iddi bis zur Ëmsetzung ze huelen, kuckt op déi vill Ressourcen déi op eiser Websäit verfügbar sinn oder kontaktéiert eis haut.