Kan een LLM bouding boxes zetten zoals YOLO?
Graag neem ik je mee in een gedachtenexperiment van mij:
Een LLM met vision engine kan objecten/gebeurtenissen van een plaatje/foto omschrijven, is het ook mogelijk om daar bounding boxes omheen te zetten zoals YOLO (OpenCV)?
En zo ben ik begonnen aan de weg naar bouding boxes met een Vision capable LLM, het was een hele reis, maar het doel is bereikt:
“Kan een LLM bouding boxes zetten zoals YOLO?” (JA!, dat kan zeker!)
Mijn verhaal vind je op: https://domoticx.net/docs/llm-met-vision-genereer-bounding-boxes

