En AI Algorithmus ass nëmme sou gutt wéi d'Donnéeën déi Dir fiddert.
Et ass weder eng fett nach eng onkonventionell Ausso. AI kéint virun e puer Joerzéngte zimlech wäit ausgesinn hunn, awer Kënschtlech Intelligenz a Machine Learning sinn zënterhier e ganz laange Wee komm.
Computer Visioun hëlleft Computeren Etiketten a Biller ze verstoen an ze interpretéieren. Wann Dir Äre Computer mat der richteger Aart vu Bilddatesets trainéiert, kann et d'Fäegkeet kréien fir verschidde Gesiichtsmerkmale z'entdecken, ze verstoen an z'identifizéieren, Krankheeten z'entdecken, autonom Gefierer ze fueren, an och Liewen ze retten mat multidimensionalen Organscannen.
De Computer Vision Maart gëtt virausgesot ze erreechen $ 144.46 Billion bis 2028 vun engem bescheidenen $ 7.04 Milliarde am Joer 2020, wuesse bei engem CAGR vu 45.64% tëscht 2021 an 2028.
d' Bilddataset Dir fiddert an trainéiert Är Machine Learning a Computer Visioun Aufgaben sinn entscheedend fir den Erfolleg vun Ärem AI Projet. E Qualitéitsdates ass zimlech schwéier ze kréien. Ofhängeg vun der Komplexitéit vun Ärem Projet, kann et iwwerall tëscht e puer Deeg an e puer Wochen daueren fir zouverlässeg an relevant Datesätz fir Computervisiounszwecker ze kréien.
Hei gi mir Iech eng Rei (kategoriséiert fir Är Liichtegkeet) vun Open-Source Bilddatesätze déi Dir direkt benotze kënnt.
Iwwergräifend Lëscht vun Image Datesets fir Äre Computer Vision Model ze trainéieren
General:
IMAGEnet
ImageNet ass e wäit benotzten Dataset, an et kënnt mat erstaunlech 1.2 Millioune Biller kategoriséiert an 1000 Kategorien. Dës Dataset ass organiséiert no der WorldNet Hierarchie an an dräi Deeler kategoriséiert - d'Trainingsdaten, Bildetiketten a Validatiounsdaten.
Kinetik 700
Kinetics 700 ass e riesegen héichqualitativen Dataset mat méi wéi 650,000 Clips vu 700 verschiddene mënschlechen Handlungsklassen. Jiddereng vun de Klassenaktiounen huet ongeféier 700 Videoclips. D'Clips an der Datesaz hunn Mënsch-Objet a Mënsch-Mënsch Interaktiounen, déi sech als ganz hëllefräich beweisen wann se mënschlech Handlungen a Videoen erkennen.
CIFAR-10
CIFAR 10 ass ee vun de gréisste Computer-Visioun Datesätz mat 60000 32 x 32 Faarfbilder, déi zéng verschidde Klassen representéieren. All Klass huet ongeféier 6000 Biller benotzt fir Computer Visioun Algorithmen a Maschinn Léieren ze trainéieren.
Oxford-IIIT Pet Biller Dateset
D'Déierbilddateset enthält 37 Kategorien mat 200 Biller pro Klass. Dës Biller variéieren a Skala, Pose a Beliichtung, a gi begleet vun Annotatiounen fir Rass, Kapp ROI, a Pixel-Niveau Trimap Segmentatioun.
Google's Open Biller
Mat beandrockend 9 Milliounen URLen ass dëst ee vun de gréisste Bilddatesets op der Lëscht, mat Millioune Biller, déi iwwer 6,000 Kategorien bezeechent ginn.
Planzen Biller
Dës Kompiléierung enthält verschidde Bilddatesätz mat beandrockend 1 Millioun Planzenbilder, déi ongeféier 11 Arten ofdecken.
Gesiichtserkennung:
Label Gesiichter am Wild
Labeled Faced in the Wild ass e riesegen Dataset mat méi wéi 13,230 Biller vu bal 5,750 Leit, déi vum Internet entdeckt goufen. Dësen Dataset vu Gesiichter ass entworf fir et méi einfach ze maachen, onbeschränkt Gesiichtserkennung ze studéieren.
CASIA WebFace
CASIA Web Gesiicht ass e gutt entworf Dataset deen hëlleft Maschinn Léieren a wëssenschaftlech Fuerschung iwwer onbeschränkt Gesiichtserkennung. Mat méi wéi 494,000 Biller vu bal 10,000 richtegen Identitéiten ass et ideal fir Gesiichtsidentifikatioun a Verifizéierungsaufgaben.
UMD Faces Dataset
UMD steet mat engem gutt annotéierten Dataset deen zwee Deeler enthält - Stillbilder a Videoframes. Den Dataset huet méi wéi 367,800 Gesiichtsannotatiounen an 3.7 Milliounen annotéiert Videoframes vun Themen.
Gesiicht Mask Detektioun
Dësen Dataset enthält 853 Biller, déi an dräi Klassen kategoriséiert sinn: "mat Mask", "ouni Mask," an "Maske falsch gedroen", zesumme mat hire Grenzkëschten am PASCAL VOC Format.
FERET
D'FERET (Facial Recognition Technology Database) ass eng ëmfaassend Bilddates mat iwwer 14,000 annotéiert Biller vu mënschleche Gesiichter.
Handschrëft Unerkennung:
MNIST Datebank
MNIST ass eng Datebank mat Echantillon vun handgeschriwwenen Zifferen aus 0 ze 9, an et huet 60,000 an 10,000 Training an Test Biller. Verëffentlecht am 1999, MNIST mécht et méi einfach Bildveraarbechtungssystemer am Deep Learning ze testen.
Kënschtlech Charaktere Dataset
Kënschtlech Charaktere Dataset ass, wéi den Numm et scho seet, kënschtlech generéiert Daten déi d'englesch Sproochstruktur an zéng Haaptbuschtawen beschreiwen. Et kënnt mat méi wéi 6000 Biller.
Objekterkennung:
MS COCO
MS COCO oder Common Objects in Context ass en Objekterkennungs- an Iwwerschrëft-Datasaz.
Et huet méi wéi 328,000 Biller mat Keypoint Detektioun, Multi-Objet Detektioun, Iwwerschrëft, a Segmentéierungsmask Annotatiounen. Et kënnt mat 80 Objektkategorien a fënnef Ënnerschrëften pro Bild.
LSUN
LSUN, kuerz fir Large-Skala Scene Understanding, huet méi wéi eng Millioun markéiert Biller an 20 Objekt- an 10 Szenkategorien. E puer Kategorien hu bal 300,000 Biller, mat 300 Biller speziell fir d'Validatioun an 1000 Biller fir Testdaten.
Home Objete
Home Objects Dataset enthält annotéiert Biller vun zoufälleg Objeten aus dem Haus - Kichen, Wunnzëmmer a Buedzëmmer. Dësen Dataset huet och e puer annotéiert Videoen an 398 onannotéiert Fotoen entworf fir ze testen.
Automotive:
Cityscape Dataset
Cityscape ass den Dataset fir ze goen wann Dir no verschiddene Videosequenzen sicht, déi aus verschiddene Stroossszenen opgeholl goufen. Dës Biller goufen iwwer eng laang Zäit an ënner verschiddene Wieder- a Liichtbedéngungen ageholl. D'Annotatioune si fir 30 Klassen vu Biller opgedeelt an aacht verschidde Kategorien.
Barkley Deep Drive
Barkley DeepDrive ass speziell fir autonom Gefier Training entworf, an et huet méi wéi 100 dausend annotéiert Video Sequenzen. Et ass eng vun den hëllefräichsten Trainingsdaten fir autonom Gefierer duerch déi verännert Strooss- a Fuerbedéngungen.
mapillary
Mapillary huet iwwer 750 Millioune Stroosseszenen a Verkéiersschëlder weltwäit, wat ganz nëtzlech ass fir visuell Perceptiounsmodeller a Maschinnléieren an AI Algorithmen ze trainéieren. Et erlaabt Iech autonom Gefierer z'entwéckelen déi op verschidde Beliichtung a Wiederkonditiounen a Standpunkter këmmeren.
Medizinesch Imaging:
Covid-19 Open Research Dataset
Dësen ursprénglechen Dataset huet ongeféier 6500 Pixel-polygonal Lungesegmentatiounen iwwer AP / PA Këscht Röntgenstrahlen. Zousätzlech sinn 517 Biller vu Covid-19 Patient Röntgenstrahlen mat Tags mat Numm, Standuert, Entrée Detailer, Resultat, a méi verfügbar.
NIH Datebank vun 100,000 Këscht X-Strahlen
D'NIH Datebank ass eng vun den extensivsten ëffentlech verfügbaren Datesätz mat 100,000 Röntgenbilder vun der Këscht a verwandte Daten nëtzlech fir d'wëssenschaftlech a Fuerschungsgemeinschaft. Et huet souguer Biller vu Patienten mat fortgeschrattem Lungebedéngungen.
Atlas vun Digital Pathologie
Atlas of Digital Pathology bitt verschidde histopathologesch Patch-Biller, méi wéi 17,000 am Ganzen, vu bal 100 annotéiert Rutschen vu verschiddenen Organer. Dës Dataset ass nëtzlech fir Computervisioun a Mustererkennungssoftware z'entwéckelen.
Szenerkennung:
Indoor Zeen Unerkennung
Indoor Scene Recognition ass eng héich kategoriséiert Dataset mat bal 15620 Biller vun Objeten an Indoor Kuliss fir am Maschinnléieren an Datetraining benotzt ze ginn. Et kënnt mat iwwer 65 Kategorien, an all Kategorie huet e Minimum vun 100 Biller.
x Vue
Als ee vun de bekannteste ëffentlech verfügbaren Datesätz enthält xView Tonne vun annotéierten Overhead Biller vu verschiddene komplexen a grousse Szenen. Mat ongeféier 60 Klassen a méi wéi eng Millioun Objektinstanzen, ass den Zweck vun dësem Dataset eng besser Katastrophenhëllef mat Satellitebiller ze bidden.
Plazen
Plaze, en Dataset bäigedroen vum MIT, huet iwwer 1.8 Millioune Biller aus 365 verschiddene Szenkategorien. Et gi ongeféier 50 Biller an all vun dëse Kategorien fir d'Validatioun an 900 Biller fir ze testen. Déif Szen Features ze léieren fir Szenerkennung oder visuell Unerkennungsaufgaben z'etabléieren ass méiglech.
Entertainment:
IMDB WIKI Datenset
IMDB - Wiki ass eng vun de populäersten ëffentlechen Datenbanken vu Gesiichter déi adequat mam Alter, Geschlecht an Nimm bezeechent ginn. Et huet och ongeféier 20 dausend Gesiichter vu Promi an 62 dausend vu Wikipedia.
Celeb Gesiichter
Celeb Faces ass eng grouss-Skala Datebank mat 200,000 annotéiert Biller vun Promi. D'Biller kommen mat Hannergrondgeräischer a Pose Variatiounen, sou datt se wäertvoll sinn fir Trainingstestsets a Computervisiounsaufgaben. Et ass héich profitabel fir méi héich Genauegkeet an der Gesiichtserkennung, Redaktioun, Gesiichtsdeel Lokaliséierung a méi ze erreechen.
Elo datt Dir eng massiv Lëscht vun Open-Source Bilddatessätz hutt fir Är kënschtlech Intelligenz Maschinnen ze brennen. D'Resultat vun Ären AI- a Maschinnléiermodeller hänkt virun allem vun der Qualitéit vun den Datesets of, déi Dir fiddert an trainéiert. Wann Dir wëllt datt Ären AI Modell präzis Prognosen erausgeet, brauch et Qualitéitsdatesätz déi aggregéiert, tagged a markéiert sinn zu Perfektioun. Fir den Erfolleg vun Ärem Computervisiounssystem ze verstäerken, musst Dir Qualitéitsbilddatenbanken benotze fir Är Projektvisioun. Wann Dir no méi esou Datesätz sicht Klick hei