Tato práce se věnuje vytvoření detektoru přesné polohy objektů v reálném čase, jehož výstupy jsou dostatečně přesné pro následnou robotickou manipulaci s těmito objekty. Nejprve jsou představeny základní úlohy počítačového vidění a architektura konvolučních neuronových sítí. Následuje rešerše moderních metod pro detekci a klasifikaci objektů založených na hlubokých neuronových sítích. Praktická část se věnuje návrhu a implementaci samotného systému, který propojuje detekční model YOLOv5 a klasifikační EfficientNet.