Widzenie komputerowe to dział sztucznej inteligencji, która pozwala komputerom i systemom na wyodrębnienie informacji na podstawie cyfrowych obrazów, filmów lub innych pozycji wizualnych

Widzenie komputerowe – automatyzacja zmysłów

11 kwi 2024

Widzenie komputerowe jest technologią coraz bardziej zintegrowaną z urządzeniami takimi jak roboty kompletacyjne i zyskuje na znaczeniu wśród przedsiębiorstw na całym świecie. Według firmy DHL do 2030 roku jej wartość ma osiągnąć 41,11 miliardów euro. Prognozuje się, że w ciągu najbliższych pięciu lat wizja komputerowa rozpowszechni się nie tylko w branży logistycznej, ale także w wielu innych sektorach.

Widzenie komputerowe – co to jest?

Widzenie komputerowe to dziedzina sztucznej inteligencji, która pozwala systemom informatycznym wyodrębniać informacje z cyfrowych zdjęć, filmów czy innych źródeł wizualnych. Po przetworzeniu danych zebranych za pomocą algorytmów komputery mogą podjąć działania lub zasugerować rozwiązanie. Dzięki AI komputery mogą „myśleć”, a dzięki wizji komputerowej  „widzą” i „orientują się” w przestrzeni.

Maszyny uczą się, naśladując ludzką percepcję, czyli zdolność odróżniania przedmiotów, interpretowania obrazów i rozumienia tego, co widzą. Jednakże w ich przypadku proces ten przebiega znacznie szybciej z uwagi na możliwość przyswojenia większej ilości informacji.

Jak działa system widzenia komputerowego?

Systemy widzenia komputerowego czerpią z następujących technologii:

  • Uczenia głębokiego (Deep learning)  wykorzystującego algorytmy, dzięki którym komputery nabywają zdolność samodzielnego uczenia się kontekstu danych wizualnych, czyli odróżniania obrazów od siebie bez konieczności programowania urządzeń w zakresie rozpoznawania każdego kształtu.
  • Konwolucyjnej sieci neuronowej (CNN)  aby modele uczenia maszynowego zaczęły rozpoznawać to, co widzą, muszą dokonać podziału obrazów, koncentrując się na pikselach, którym przypisują wartości. Następnie wykorzystują te oznaczenia do tworzenia splotów, czyli operacji matematycznych opartych na dwóch funkcjach w celu wygenerowania trzeciej funkcji. Na tej podstawie roboty opracowują prognozy i sprawdzają ich dokładność w serii iteracji, dzięki czemu rozpoznają przedmioty w podobny sposób co ludzie.
Deep learning umożliwia komputerom samodzielną naukę bez konieczności trenowania ich w zakresie rozpoznawania każdego przedmiotu
Deep learning umożliwia komputerom samodzielną naukę bez konieczności trenowania ich w zakresie rozpoznawania każdego przedmiotu

Analiza otoczenia przez widzenie komputerowe dzieli się na trzy etapy:

  1. Wbudowane w urządzeniach czujniki rejestrują obraz.
  2. Obraz jest przesyłany do systemu interpretacyjnego, który stosuje wzór rozpoznawania do porównania danej scenerii z innymi, znanymi przez system.
  3. Kiedy użytkownik wystosuje zapytanie, program dostarcza wyniki przeprowadzonej analizy.

Zastosowania widzenia komputerowego w przemyśle

Firmy działające w sektorach takich jak logistyka, medycyna, transport i rozrywka wdrożyły już widzenie komputerowe. Kamery bezpieczeństwa, aparatura wspomagająca zarządzanie ruchem drogowym, smartfony i inne urządzenia dostarczają dane, które mają różnorodne zastosowania. Jako przykład może posłużyć Google Translate – jedną z jego funkcji jest natychmiastowe tłumaczenie tekstu ze zdjęcia.

Ponadto istnieje wiele aplikacji wykorzystujących widzenie komputerowe w przemyśle 4.0:

  • Rzeczywistość rozszerzona. Zebrane przez komputerowe widzenie informacje służą do pozycjonowania wirtualnych obiektów w fizycznej przestrzeni.
  • Autonomiczne pojazdy. Poruszające się samodzielnie samochody przetwarzają obraz w czasie rzeczywistym, aby wykrywać zdarzenia na drodze i podejmować odpowiednie działania.
  • Produkcja. Technologia ta stosowana jest do monitorowania maszyn w celu zagwarantowania ich prawidłowego działania, a także przeprowadzania kontroli jakości produktów i nadzorowania procesu pakowania na liniach produkcyjnych.
  • Analiza przestrzenna. Rejestrowana jest obecność osób lub przedmiotów, a także ich ruchy w danej przestrzeni.
  • Opieka zdrowotna. Analiza obrazów przechwyconych przez urządzenia medyczne wspiera lekarzy podczas identyfikowania chorób, usprawniając stawianie trafnych diagnoz.
  • Rolnictwo. Satelity, drony czy samoloty umożliwiają monitorowanie upraw, wykrywanie możliwych sytuacji kryzysowych i niedoborów składników odżywczych. Firma Patatas Meléndez wdrożyła tę technologię w celu udoskonalenia procesu selekcji ziemniaków, które docierają do klientów.
  • Praca z tekstem. Automatyczne przetwarzanie może pomóc w wyszukiwaniu przydatnych treści pośród dużych ilości tekstu.

Kto stworzył widzenie komputerowe?

Thomas Huang, badacz i emerytowany wykładowca Uniwersytetu w Illinois (Stany Zjednoczone) i jeden z liderów związanych z komputerowym widzeniem, twierdzi, że historia tej technologii sięga lat sześćdziesiątych, kiedy Larry Roberts omówił możliwość pozyskiwania informacji geometrycznych 3D z perspektywy 2D w swojej pracy dyplomowej na uczelni Massachusetts Institute of Technology (MIT). W tamtych latach AI narodziła się jako akademicka dziedzina studiów i w 1963 roku komputery zaczęły przekształcać obrazy dwuwymiarowe w trójwymiarowe.

Historia widzenia komputerowego sięga lat sześćdziesiątych, kiedy Larry Roberts obronił swoją pracę dyplomową na uczelni MIT
Historia widzenia komputerowego sięga lat sześćdziesiątych, kiedy Larry Roberts obronił swoją pracę dyplomową na uczelni MIT

Optyczne rozpoznawanie znaków (OCR) powstało w 1974 roku, a inteligentne rozpoznawanie znaków (ICR) umożliwiło rozszyfrowywanie pisanych odręcznie tekstów za pomocą sieci neuronowych. W 1982 neurobiolog David Marr ustalił, że widzenie działa w sposób hierarchiczny i opracował algorytmy, dzięki którym maszyny wykrywają krawędzie, narożniki, krzywizny i inne formy geometryczne. Jednocześnie informatyk Kunihiko Fukushima stworzył sieć komórek do rozpoznawania wzorów zwaną Neocognitron. Dziedzina rozwijała się nadal na początku XXI wieku, a w 2012 roku modelowi AlexNet udało się zredukować wskaźnik błędów do niewielkiego odsetka.

Widzenie komputerowe w logistyce

Logistyka i zarządzanie łańcuchem dostaw to kolejne dziedziny, w których widzenie komputerowe znajduje wiele zastosowań, głównie w obszarze robotyki:

  • Wysyłki. Widzenie komputerowe jest wykorzystywane do sprawdzania czytelności etykiet oraz oszacowania przestrzeni, jaką zajmą ładunki podczas ich transportu czy składowania w magazynach. Przyczynia się także do poprawy danych gromadzonych przez system zarządzania magazynem (WMS).
  • Utrzymanie ruchu. Gromadzenie informacji otrzymywanych z różnych urządzeń może przyczynić się do wykrycia konieczności przeprowadzenia naprawy.
  • Operacje. Sztuczna inteligencja wyznacza operatorom optymalne ścieżki przeprowadzania kompletacji, a także prowadzi kontrolę dostępu. Może także prowadzić kontrolę dostępu, wykrywając obecność osób przemieszczających się po obiekcie lub wchodzących do obszarów zamkniętych, i podjąć szybką interwencję za pomocą systemu ostrzegania.
  • Bezpieczeństwo. Nadzorowanie ruchu pojazdów i osób w magazynach i na parkingach umożliwia podejmowanie natychmiastowych działań mających na celu zminimalizowanie ryzyka. Kamery sprawdzają również, czy stosowane są wymagane środki ochrony indywidualnej, a także monitorują kierowców, pilnując, by robili przerwę przy pierwszych oznakach zmęczenia.

Roboty do kompletacji

Widzenie komputerowe może także zrewolucjonizować logistykę w zakresie robotów kompletacyjnych lub cobotów, czy też robotów pick and place. Urządzenia te doskonale sprawdzają się w centrach logistycznych, w których codziennie obsługiwana jest duża liczba wysyłek, ponieważ sprawnie przygotowują zamówienia, pobierając 1000 artykułów na godzinę. Działają bez przerwy, a oprogramowanie wizyjne określa odpowiednie punkty pobrania dla każdego produktu. Dzięki algorytmom AI urządzenie pobiera nieznane sobie artykuły bez konieczności wcześniejszego przeprowadzenia treningu.

Mecalux projektuje magazyny wyposażone w najnowsze postępy technologiczne, takie jak widzenie komputerowe do przeprowadzania operacji kompletacji. Jeśli chcesz przenieść swoją firmę na wyższy poziom i dowiedzieć się więcej o robocie do kompletacji oraz innych rozwiązaniach, skontaktuj się z nami. Nasi eksperci doradzą Ci, co najlepiej dostosuje się do potrzeb Twojego magazynu i będą wspierać podczas całego procesu instalacji.

Missconfigured or missplaced portlet, no content found
Dynamic Content: false
Master Name: Banner-Software-Solutions
Template Key: