Liczenie obiektów Raspberry Pi: 5 kroków

Spisu treści:

Krok 1: Coraz głębiej: w jaki sposób można wykryć ruch obiektu w strumieniu obrazu?
Krok 2: Binaryzacja
Krok 3: Rozszerzać
Krok 4: Poszukiwanie konturów (i ich centroidów)
Krok 5: Ruch Centorydy i liczenie obiektów

👤 Autor John Day 📧 [email protected].
⏱ Public 2024-01-30 11:30.
🖍 Ostatnio zmodyfikowany 2025-01-23 15:03.

Wizja komputerowa to bez wątpienia fantastyczna rzecz! Dzięki temu komputer zyskuje zdolność „widzenia” i lepszego wyczuwania otoczenia, co pozwala na tworzenie złożonych, użytecznych i fajnych aplikacji. Aplikacje takie jak wykrywanie i rozpoznawanie twarzy, śledzenie obiektów i wykrywanie obiektów są coraz częściej obecne w naszych codziennych działaniach dzięki postępom w zakresie widzenia komputerowego.

Biorąc pod uwagę, jak zaawansowane i dostępne są frameworki i narzędzia widzenia komputerowego, aplikacja opisana w tym artykule dobrze pasuje: używając prostego Raspberry PI oraz darmowego i open-source frameworku wizji komputerowej o nazwie OpenCV do zliczania obiektów w ruchu, a dokładniej ile obiekty wchodzą i wychodzą z określonej monitorowanej strefy.

Krok 1: Coraz głębiej: w jaki sposób można wykryć ruch obiektu w strumieniu obrazu?

Teraz nadszedł czas, aby zagłębić się w rzeczy związane z przetwarzaniem obrazu:

jak uzyskać obrazy z kamery internetowej i wykryć, że coś się tam poruszyło

Składa się z pięciu kroków:

Krok 1: Aby podświetlić obiekt w ruchu

Zgodnie z definicją w fizyce klasycznej, odniesienie jest konieczne, aby wywnioskować, że coś się porusza lub czy stoi nieruchomo. Tutaj, aby ustalić, czy coś się poruszyło, jest prawie tak samo: każda klatka przechwycona przez kamerę internetową zostanie porównana z klatką odniesienia. Jeśli coś się zmieniło, to coś zostało poruszone. To proste, jak się wydaje.

Ta ramka odniesienia musi być uchwycona w najdoskonalszych warunkach (na przykład nic się nie porusza). W świecie przetwarzania obrazu to porównanie między przechwyconą klatką a klatką odniesienia polega na technice zwanej odejmowaniem tła. Odejmowanie tła polega na dosłownym odejmowaniu informacji o kolorze piksel do piksela z przechwyconej klatki i klatki odniesienia. Tak więc obraz wynikowy z tego procesu będzie podświetlał / pokazywał z większą ilością szczegółów tylko to, co różni się między tymi dwiema klatkami (lub co się przesunęło / nabrało ruchu), a wszystko inne na obrazie będzie czarne (kolor o wartości zerowej na szarym -skalować piksel). Ważne: warunki oświetleniowe i jakość przechwyconego obrazu z kamery internetowej (ze względu na jakość czujników przechwytywania) mogą się nieznacznie różnić w zależności od klatki. Oznacza to, że "równe części" z klatki odniesienia i innych klatek nie będą całkowicie czarne po odjęciu tła. Mimo takiego zachowania nie ma poważnych konsekwencji w kolejnych krokach przetwarzania obrazu w tym projekcie.

W celu zminimalizowania czasu przetwarzania obrazu, przed wykonaniem odejmowania tła, przechwycona klatka i klatka odniesienia są konwertowane na obraz w skali szarości. Ale dlaczego? Jest to kwestia wydajności obliczeniowej: obraz przedstawiający wiele kolorów (obraz kolorowy) ma trzy informacje na piksel: składowe koloru czerwonego, niebieskiego i zielonego (stary, ale złoty standard RGB). Tak więc, matematycznie, każdy piksel można zdefiniować jako tablicę trzech wartości, z których każda reprezentuje składnik koloru. Dlatego, rozszerzając go na cały obraz, ostateczny obraz będzie w rzeczywistości mieszanką trzech komponentów obrazu: komponentów obrazu czerwonego, niebieskiego i zielonego.

Aby go przetworzyć, potrzeba dużo pracy! Jednak w obrazach w skali szarości każdy piksel ma tylko jedną informację o kolorze. Tak więc przetwarzanie obrazu kolorowego jest trzykrotnie wolniejsze niż w przypadku obrazu w skali szarości (co najmniej trzy razy, w zależności od zastosowanej techniki). Co więcej: w niektórych celach (takich jak ten projekt) przetwarzanie wszystkich kolorów nie jest w ogóle konieczne ani ważne. Dlatego doszliśmy do wniosku: użycie obrazów w skali szarości jest wysoce zalecane do celów przetwarzania obrazu. Po odjęciu tła konieczne jest zastosowanie filtra Gaussian Blur.

Filtr Rozmycie gaussowskie zastosowany na obrazie z odjętym tłem wygładza wszystkie kontury poruszającego się wykrytego obiektu. Na pewno pomoże w kolejnych krokach obróbki obrazu.

Krok 2: Binaryzacja

W większości przypadków przetwarzania obrazu binaryzacja jest niemal obowiązkowym krokiem po wyróżnieniu obiektów / cech na obrazie. Powód: w obrazie binarnym każdy kolor piksela może przyjmować tylko dwie wartości: 0x00 (czarny) lub 0xFF (biały). To bardzo pomaga w przetwarzaniu obrazu, ponieważ wymaga jeszcze mniejszej „mocy obliczeniowej” do zastosowania technik przetwarzania obrazu w następnych krokach. Binaryzację można przeprowadzić, porównując każdy kolor piksela obrazu w skali szarości z określonym progiem. Jeżeli wartość koloru piksela jest większa niż próg, ten kolor piksela przyjmie wartość białą (0xFF), a jeżeli wartość koloru piksela jest niższa od progu, ten kolor piksela przyjmie wartość czarną (0x00). Niestety wybór wartości progowej nie jest taki łatwy. Zależy to od czynników środowiskowych, takich jak warunki oświetleniowe. Zły wybór wartości progowej może dalej zrujnować wszystkie kroki. Dlatego zdecydowanie zalecam ręczne dostosowanie progu w projekcie dla swojego przypadku przed podjęciem jakichkolwiek dalszych działań. Ta wartość progowa musi gwarantować, że poruszający się obiekt będzie widoczny na obrazie binarnym. W moim przypadku po odpowiednim doborze progu uzyskuje się to, co widać na rysunku 5.

Rysunek 5 - obraz binarny

Krok 3: Rozszerzać

Do tej pory możliwe było wykrywanie poruszających się obiektów, podświetlanie ich i zastosowanie binaryzacji, co daje całkiem wyraźny obraz poruszającego się obiektu (= całkiem wyraźny obraz obiektu do celów przetwarzania obrazu). Przygotowanie do liczenia obiektów jest PRAWIE wykonane. „Prawie” oznacza tutaj, że przed przejściem dalej trzeba wprowadzić pewne drobne poprawki. W tym momencie istnieje realna szansa na obecność „dziur” w obiektach (czarne masy pikseli w podświetlonym na biało obiekcie). Te otwory mogą być dowolne, od określonych warunków oświetleniowych po jakąś część kształtu obiektu. Gdy dziury mogą "produkować" fałszywe obiekty wewnątrz rzeczywistych obiektów (w zależności od tego, jak duże i gdzie się znajdują), konsekwencje obecności dziur na obrazie mogą być katastrofalne dla zliczania obiektów. Sposobem na wyeliminowanie tych dziur jest użycie Technic przetwarzania obrazu o nazwie Dilate. Użyj tego, a dziury znikną.

Krok 4: Poszukiwanie konturów (i ich centroidów)

W tym momencie mamy podświetlone obiekty, bez dziur w środku i gotowe na to, co dalej: poszukiwanie konturów (i ich centroidów). W OpenCV są zasoby do automatycznego wykrywania konturów, ale wykryte kontury muszą być mądrze wybrane (aby wybrać tylko rzeczywisty obiekt lub obiekty). Tak więc kryterium wykrywania konturów jest obszar obiektu mierzony w pikselach². Jeśli kontur ma większą powierzchnię niż granica (skonfigurowana w oprogramowaniu), musi być traktowany jako rzeczywisty obiekt do zliczenia. Wybór tej granicy/kryteriów obszaru jest bardzo ważny, a zły wybór oznacza błędne liczenie. Musisz wypróbować kilka wartości granicznych wartości obszaru i sprawdzić, co lepiej pasuje do twojego zastosowania. Nie martw się, te limity nie są trudne do znalezienia / dostosowania. Po wybraniu wszystkich obiektów na obrazie następnym krokiem jest narysowanie na nim prostokąta (ten prostokąt musi zawierać w sobie cały wykryty obiekt). A środek tego prostokąta to…. centroid obiektu! Być może myślisz „O co chodzi z tym centroidem?”, prawda? Oto twoja odpowiedź: nieważne jak duży lub jaki jest kształt obiektu, jego ruch jest taki sam jak środek ciężkości. Innymi słowy: ten prosty punkt zwany centroidem reprezentuje cały ruch obiektu. To sprawia, że liczenie jest teraz bardzo proste, prawda? Zobacz obrazek poniżej (rysunek 6), gdzie centroid obiektu jest przedstawiony jako czarny punkt.

Krok 5: Ruch Centorydy i liczenie obiektów

Wielki finał: porównaj współrzędne centroidów obiektu ze współrzędnymi linii wejścia i wyjścia i zastosuj opisany wcześniej algorytm liczenia. I będzie liczenie poruszających się obiektów!

Wynik końcowyJak pokazano na samym początku tego postu, oto projekt w akcji:

Zalecana:

Wykrywanie obiektów za pomocą płyt Sipeed MaiX (Kendryte K210): 6 kroków

Wykrywanie obiektów za pomocą płyt Sipeed MaiX (Kendryte K210): Kontynuując mój poprzedni artykuł o rozpoznawaniu obrazów za pomocą płyt Sipeed MaiX, postanowiłem napisać kolejny samouczek, skupiając się na wykrywaniu obiektów. Ostatnio pojawiło się trochę interesującego sprzętu z chipem Kendryte K210, w tym S

Zdalny czujnik obiektów za pomocą Arduino: 7 kroków

Zdalny czujnik obiektów przy użyciu Arduino: Obecnie twórcy i programiści preferują Arduino do szybkiego tworzenia prototypów projektów. Arduino to platforma elektroniczna typu open source oparta na łatwym w użyciu sprzęcie i oprogramowaniu. Arduino ma bardzo dobrą społeczność użytkowników. W tym

Wykrywanie obiektów Raspberry Pi: 7 kroków

Raspberry Pi Object Detection: Ten przewodnik zawiera instrukcje krok po kroku dotyczące konfiguracji interfejsu API wykrywania obiektów TensorFlow na Raspberry Pi. Wykonując kroki opisane w tym przewodniku, będziesz mógł używać swojego Raspberry Pi do wykrywania obiektów na żywo wideo z P

Raspberry Pi - autonomiczny łazik marsjański ze śledzeniem obiektów OpenCV: 7 kroków (ze zdjęciami)

Raspberry Pi - autonomiczny łazik marsjański z śledzeniem obiektów OpenCV: Zasilany przez Raspberry Pi 3, rozpoznawanie obiektów Open CV, czujniki ultradźwiękowe i motoreduktory prądu stałego. Ten łazik może śledzić każdy obiekt, do którego jest wyszkolony, i poruszać się po dowolnym terenie

Liczenie i zrównywanie w systemie binarnym: 6 kroków

Liczenie i zrównywanie w systemie binarnym: Podaj ogólny opis InstructableTo jest moja druga instrukcja binarna. To idzie w równania matematyczne wykonane w systemie binarnym. sekcja 1 pokazuje, jak liczyć binarne rękami, podczas gdy sekcja 2 pokazuje w formie pisemnej. Tylko uwaga na marginesie, c

Liczenie obiektów Raspberry Pi: 5 kroków

Spisu treści:

Krok 1: Coraz głębiej: w jaki sposób można wykryć ruch obiektu w strumieniu obrazu?

Teraz nadszedł czas, aby zagłębić się w rzeczy związane z przetwarzaniem obrazu:

jak uzyskać obrazy z kamery internetowej i wykryć, że coś się tam poruszyło

Składa się z pięciu kroków:

Krok 2: Binaryzacja

Krok 3: Rozszerzać

Krok 4: Poszukiwanie konturów (i ich centroidów)

Krok 5: Ruch Centorydy i liczenie obiektów

Zalecana:

Wykrywanie obiektów za pomocą płyt Sipeed MaiX (Kendryte K210): 6 kroków

Zdalny czujnik obiektów za pomocą Arduino: 7 kroków

Wykrywanie obiektów Raspberry Pi: 7 kroków

Raspberry Pi - autonomiczny łazik marsjański ze śledzeniem obiektów OpenCV: 7 kroków (ze zdjęciami)

Liczenie i zrównywanie w systemie binarnym: 6 kroków

Inteligentny łazik: 4 kroki

TANIEC ŚWIATŁA: 4 kroki

Użyj modułu Bluetooth HC-06, aby zrealizować komunikację Micro:bit z telefonem komórkowym: 8 kroków (ze zdjęciami)

Technika vintage: Le Minitel: 6 kroków

Akcelerometr kontrolera Xbox 360 / modyfikacja sterowania żyroskopem: 7 kroków

Technologie pamięci RAM i rozwiązywanie problemów: 6 kroków

Mini stacja pogodowa z Attiny85: 6 kroków (ze zdjęciami)

Konfiguracja Waveshare Game Hat dla Recalbox i Kodi: 4 kroki

Pomiar przyspieszenia za pomocą BMA250 i Arduino Nano: 4 kroki

DIY niskonapięciowe oświetlenie zewnętrzne sterowane za pomocą Raspberry Pi: 11 kroków (ze zdjęciami)

Podstawowa platforma IoT z RaspberryPi, WIZ850io: Sterownik urządzenia platformy: 5 kroków (ze zdjęciami)

Łatwa konfiguracja pilota na podczerwień za pomocą LIRC dla Raspberry PI (RPi) - lipiec 2019 [Część 2]: 3 kroki

Utwórz akcje niestandardowe dla Asystenta Google: 12 kroków

Mysz wspomagana językiem (ATOM): 7 kroków (ze zdjęciami)

Generator częstotliwości głośników: 4 kroki

Obudowa Raspberry Pi: 6 kroków (ze zdjęciami)