Högskolan i Skövde

his.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • apa-cv
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Visionbaserad robotmanipulation: 6DoF pose estimation i ett ROS 2-system
University of Skövde, School of Engineering Science.
University of Skövde, School of Engineering Science.
2025 (Swedish)Independent thesis Basic level (degree of Bachelor), 20 credits / 30 HE creditsStudent thesisAlternative title
Vision-based robot manipulation : 6DoF pose estimation in a ROS 2 system (English)
Abstract [sv]

Detta arbete behandlar utvecklingen av ett visionsbaserat robotsystem för att automatisera avlägsnandet av skyddslock från ventilmoduler. Utgångspunkten är en faktisk monteringsstation hos Volvo GTO, där momentet idag utförs manuellt. Momentet medför ergonomiska utmaningar och låg värdeskapande nytta, vilket motiverar en teknisk lösning med fokus på automation och flexibilitet. Systemet utvecklas i tre huvudsakliga delar. Den första delen omfattar ett visionsystem baserat på YOLOv11-pose för keypoint detection. Efterföljande metoder för pose estimation är Perspective-n-Point för initial uppskattning och Iterative Closest Point för förfining. Den andra delen fokuserar på framtagandet av specialanpassade gripfingrar för att avlägsna skyddslock, monterade på ett Robotiq-gripdon. Den tredje delen utvecklar en lösning för att styra roboten (UR10) och Robotiq-gripdonet.Varje delsystem verifieras individuellt där noggrannhet, funktion och stabilitet beaktas. Därefter integreras delarna till en sammanhängande helhetslösning inom ett ROS 2-baserat ramverk, vilket möjliggjorde modulär styrning, distribuerad databehandling och sekventiell exekvering av uppgiften. Systemet testades i två konfigurationer: ett förenklat 4DoF-läge och ett fullt 6DoF-läge. Båda uppvisade god grundfunktionalitet under gynnsamma förhållanden. Däremot uppstod utmaningar vid låg bakgrundskontrast, då skyddslocken inte framträdde lika tydligt i bilden. Detta påverkade precisionen i visionsystemet och därmed helhetslösningen. Trots detta uppnådde systemet sitt huvudsakliga mål och slutsatserna är att systemet fungerar konceptuellt. Resultaten visar tydligt att den föreslagna lösningen har potential att effektivisera manuella arbetsmoment och bidra till både ergonomisk förbättring och produktionsoptimering. Samtidigt krävs fortsatta förbättringar av alla tre delsystem för att uppnå den robusthet och tillförlitlighet som eftersträvas i industriella produktionsmiljöer.

Abstract [en]

This thesis presents the development of a vision-based robotic system designed to automate the removal of protective caps from valve modules. The work is based on a actual assembly station at Volvo GTO, where the task is currently performed manually. The task presents ergonomic challenges and offers limited value-adding contributions, thereby motivating a technical solution focused on automation and flexibility. The system is developed in three main components. The first component consists of a vision system based on YOLOv11-pose for keypoint detection and subsequently pose estimation is performed using Perspective-n-Point for initial estimation, followed by refinement using Iterative Closest Point. The second component involves the design of custom gripper fingers mounted on a Robotiq gripper. The third component comprises the development of a control solution for both the robot (UR10) and the Robotiq gripper. Each subsystem was verified individually with respect to accuracy, functionality, and stability. The components were then integrated into a cohesive end-to-end solution within a ROS 2-based framework, enabling modular control, distributed data processing, and sequential task execution.The system was evaluated in two configurations: a simplified 4DoF mode and a full 6DoF mode. Both demonstrated core functionality under favorable conditions. However, challenges arose in low-contrast backgrounds where the protective caps did not clearly stand out in the image. This impacted the accuracy of the vision system and, by extension, the performance of the entire system. Despite these limitations, the system successfully achieved its primary objective and was shown to function as a conceptual proof of concept.The results indicate that the proposed solution has clear potential to streamline manual tasks and contribute to both ergonomic improvements and production efficiency. Nonetheless, continued refinement of all three subsystems is necessary to reach the robustness and reliability required for demanding industrial environments.

Place, publisher, year, edition, pages
2025. , p. 69
National Category
Production Engineering, Human Work Science and Ergonomics
Identifiers
URN: urn:nbn:se:his:diva-25212OAI: oai:DiVA.org:his-25212DiVA, id: diva2:1968735
Subject / course
Industrial Engineering
Supervisors
Examiners
Available from: 2025-06-13 Created: 2025-06-13 Last updated: 2025-09-29Bibliographically approved

Open Access in DiVA

fulltext(2901 kB)97 downloads
File information
File name FULLTEXT01.pdfFile size 2901 kBChecksum SHA-512
b66a41e14dfad5408d5288ab48e3df55a6145e232c815411187676ee7ae12ecb924ba0b424d125a19deae2c0486fb6bf2cefd8346fc7f20a5b8d704d3eec381b
Type fulltextMimetype application/pdf

By organisation
School of Engineering Science
Production Engineering, Human Work Science and Ergonomics

Search outside of DiVA

GoogleGoogle Scholar
Total: 97 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 138 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • apa-cv
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf