Detta arbete behandlar utvecklingen av ett visionsbaserat robotsystem för att automatisera avlägsnandet av skyddslock från ventilmoduler. Utgångspunkten är en faktisk monteringsstation hos Volvo GTO, där momentet idag utförs manuellt. Momentet medför ergonomiska utmaningar och låg värdeskapande nytta, vilket motiverar en teknisk lösning med fokus på automation och flexibilitet. Systemet utvecklas i tre huvudsakliga delar. Den första delen omfattar ett visionsystem baserat på YOLOv11-pose för keypoint detection. Efterföljande metoder för pose estimation är Perspective-n-Point för initial uppskattning och Iterative Closest Point för förfining. Den andra delen fokuserar på framtagandet av specialanpassade gripfingrar för att avlägsna skyddslock, monterade på ett Robotiq-gripdon. Den tredje delen utvecklar en lösning för att styra roboten (UR10) och Robotiq-gripdonet.Varje delsystem verifieras individuellt där noggrannhet, funktion och stabilitet beaktas. Därefter integreras delarna till en sammanhängande helhetslösning inom ett ROS 2-baserat ramverk, vilket möjliggjorde modulär styrning, distribuerad databehandling och sekventiell exekvering av uppgiften. Systemet testades i två konfigurationer: ett förenklat 4DoF-läge och ett fullt 6DoF-läge. Båda uppvisade god grundfunktionalitet under gynnsamma förhållanden. Däremot uppstod utmaningar vid låg bakgrundskontrast, då skyddslocken inte framträdde lika tydligt i bilden. Detta påverkade precisionen i visionsystemet och därmed helhetslösningen. Trots detta uppnådde systemet sitt huvudsakliga mål och slutsatserna är att systemet fungerar konceptuellt. Resultaten visar tydligt att den föreslagna lösningen har potential att effektivisera manuella arbetsmoment och bidra till både ergonomisk förbättring och produktionsoptimering. Samtidigt krävs fortsatta förbättringar av alla tre delsystem för att uppnå den robusthet och tillförlitlighet som eftersträvas i industriella produktionsmiljöer.
This thesis presents the development of a vision-based robotic system designed to automate the removal of protective caps from valve modules. The work is based on a actual assembly station at Volvo GTO, where the task is currently performed manually. The task presents ergonomic challenges and offers limited value-adding contributions, thereby motivating a technical solution focused on automation and flexibility. The system is developed in three main components. The first component consists of a vision system based on YOLOv11-pose for keypoint detection and subsequently pose estimation is performed using Perspective-n-Point for initial estimation, followed by refinement using Iterative Closest Point. The second component involves the design of custom gripper fingers mounted on a Robotiq gripper. The third component comprises the development of a control solution for both the robot (UR10) and the Robotiq gripper. Each subsystem was verified individually with respect to accuracy, functionality, and stability. The components were then integrated into a cohesive end-to-end solution within a ROS 2-based framework, enabling modular control, distributed data processing, and sequential task execution.The system was evaluated in two configurations: a simplified 4DoF mode and a full 6DoF mode. Both demonstrated core functionality under favorable conditions. However, challenges arose in low-contrast backgrounds where the protective caps did not clearly stand out in the image. This impacted the accuracy of the vision system and, by extension, the performance of the entire system. Despite these limitations, the system successfully achieved its primary objective and was shown to function as a conceptual proof of concept.The results indicate that the proposed solution has clear potential to streamline manual tasks and contribute to both ergonomic improvements and production efficiency. Nonetheless, continued refinement of all three subsystems is necessary to reach the robustness and reliability required for demanding industrial environments.