SecurityWorldMarket

01-12-2009

Intelligent videoanalyse

Af Matts Lilja, Frode Berg Olsen (OPAX) og Leif Haglund, Amritpal Singh (Saab).

Hvis man skal vælge et emne, hvor selve udfordringen er at øge bevidstheden og vidensniveauet i sikkerhedsbranchen, så er intelligent video et godt valg. Mange spørgsmålstegn kan rettes ud, når det drejer sig om denne relativt nye og potentielt kraftfulde teknologi. Hvad kan man forvente sig af intelligent video? Hvordan fungerer det? Hvilken ’Return on Investment’ (ROI) kan brugerne håbe på? Disse og mange andre spørgsmål får deres svar i denne artikel.

Der er flere alternative rubriceringer til ”Intelligent video”. Allerede her bliver det røbet, at vi taler om noget relativt nyt. De alternative betegnelser, der bruges, er intelligent videoanalyse (IVA) og videoindholdsanalyse (VCA=Video Content Analysis). Derudover er der en masse forskellige variationer af disse udtryk, men VCA er den bedste betegnelse, når vi skal beskrive, hvad det egentlig handler om. At kalde et teknologisk system for intelligent, i ordets egentlige betydning, er ikke korrekt. Fælles for alle udtryk, der beskriver VCA, er, at de har at gøre med den teknologi, som bruges for at analysere video via specifik data, adfærd, objekt og holdning. 


Skabe nytte via forenkling
Vi finder i dag store mængder af videodata i private og kommercielle applikationer, men interaktion med denne lagrede video kræver bedre værktøjer for at beskrive, organisere og vedligeholde videodata. På grund af dette behov har virksomheder sammen med forskningsinstitutter samarbejdet for at udforske mulighederne for at automatisere beskrivelse og kategorisering af multimedia generelt, og video i særdeleshed. Arbejdet med manuelt at beskrive videodata er naturligvis meget tidskrævende, og derfor er der brug for automatiserede metoder. Målet er automatisk at skabe videosammenfatninger, eftersom strukturerede medier er mere egnet til at søge efter. Forestil dig, at alle videoer på YouTube automatisk kunne blive beskrevet ved hjælp af software. Så ville søgningen efter specifik video ikke længere være et resultat af uploadernes subjektive bedømmelser af, hvad videoen indeholder. Det vil dog tage et godt stykke tid, før disse typer af applikationer når markedet. 


Sikkerhedsvideo
Store mængder af video kan også findes i sikkerhedsanlæg med kameraovervågning. Interessen for VCA er steget i de senere år, hvilket er fokus for denne artikel. Inden for sikkerhed bruges VCA især til analyse af realtidsvideo, men den kan med fordel også bruges til at søge på optaget materiale ved at sætte visse parametre, som softwaren kan søge efter. Dette er en funktionalitet, som sparer rigtig meget tid, og som derved yderligere bidrager gavnligt i en VCA-installation.


”Uintelligent” videoovervågning
For at eksemplificere, hvad der udgør et typisk videoovervågningssystem, og hvorfor dette hverken kan klassificeres som intelligent eller analytisk, udgår vi fra et indkøbscenter. Et antal kameraer er mere eller mindre direkte sammenkoblet med et antal monitorer, som i visse tilfælde er overvåget af operatører, og som ind imellem også bliver optaget. Den videoforædling, som i bedste fald sker, er af billedforbedrende karakter. Al analyse og forståelse for, hvad der sker i det overvågede område, er op til operatørerne. Heldigvis sker der som oftest ingenting specielt eller truende, og det er godt. Undersøgelser viser nemlig, at operatørerne mister op til 90 procent af deres opmærksomhed efter kun 22 minutters manuel videoovervågning. Hvis der så sker en hændelse, som kræver en form for action, giver videoovervågningssystemet ingen anden støtte, end at man kan se på forløbet bagefter, såfremt det er blevet optaget. Hvis man tager de tidligere nævnte tal for en operatørs opmærksomhed i betragtning, er det ikke svært at indse, at risikoen er overhængende, for at en hændelse ikke opdages, også selv om der er installeret videoovervågning. En undersøgelse af, hvad der er sket inden, under og efter en hændelse er nødt til at gøres manuelt ved at gennemgå de optagne videoer. Eftersom der ikke tilbydes egentlig support af systemer online eller offline, kan et sådant system ikke klassificeres som analytisk eller intelligent.

Forskellen mellem en traditionel kameraovervågning og et VCA-anlæg er, at man med VCA får automatiserede funktioner, som forenkler og til dels overvinder problemerne med operatører, såvel offline som online.


Bevægelsesdetektion 
Før vi går nærmere ind på, hvordan teknologien bag VCA fungerer, så tager vi en enklere type videoanalyse op, som har eksisteret i over 20 år, nemlig bevægelsesdetektion (motion detection). Bevægelsesdetektion er i dag en integreret del af mange digitale overvågningskameraer og overvågningssoftware. Bevægelsesdetektion ser på forandringer i pixelværdier (bevægelse) i en videostrøm og trigges i gang af en hændelse, såfremt bevægelsen ligger over et vist niveau. I mere avancerede anlæg kan systemet kræve, at bevægelsen skal ske inden for et vist bestemt område i billedet, eller hvis objektet er af en vis størrelse for at alarmer/optagelse skal trigges i gang.

Da bevægelsesdetektion er relativt usofistikeret, er dens anvendelse begrænset, ikke mindst på grund af den mængde falske alarmer, den skaber. Med falske alarmer mener vi hændelser, som sætter alarmen/optagelsen i gang, selv om intet rigtigt objekt har bevæget sig i billedet. Den vigtigste fordel med bevægelsesdetektion er, at den ofte bruges til at kontrollere, hvornår der bliver optaget video, eftersom et statisk billede sjældent er af interesse. På denne måde spares der en hel del lagerplads.


Hvad er intelligent?
Så bevægelsesdetektion er altså ikke særlig intelligent. Hvad er det då, der gør, at VCA betragtes som værende intelligent? Er det overhovedet rimeligt at kalde et VCA-system intelligent?
Hvis vi vender tilbage til indkøbscentret og nu forsyner systemet med VCA, så kan vi se et antal forbedringer. 

  • Da indkøbscentret består af et antal butikker, entreer/udgange, åbne flader osv., er det en udfordring for et konventionelt system at holde rede på alt dette.
    I et VCA-system kender systemet relationen mellem kameraerne i netværket og positioneringen i forhold til bestemte steder i centret. Desuden kan VCA-systemer følge mennesker og objekter via netværket på en konsekvent måde. Således kan operatørerne få et klart forbedret overblik over centret. Det bliver f.eks. muligt at spørge VCA-systemet, hvorfra en gerningsmand kom, og – måske endnu vigtigere – hvor kan han være gået hen, og hvor man kan stoppe ham?
  • Ofte kan der opstå behov for at specialovervåge et bestemt område i centret. I et konventionelt system betyder det, at en operatør må være ekstra opmærksom på dette særlige område. Dette kræver, at han reducerer sin opmærksomhed på øvrige områder, eller at der tilføres yderligere en operatør. I et VCA-system kan operatøren selv definere et virtuelt sikkerhedsområde med tilhørende regler for at trigge en alarm. Han kan altså fortsætte med at udføre sine normale pligter, mens VCA-systemet sørger for at have særlig opmærksomhed på et bestemt område.
  • Om en hendelse oppstår som leder til en alarm generert av VCA-systemet vil ikke bare operatøren varsles, men et HDTV kamera med PTZ-funksjon kan automatisk zoome inn på hendelsen og gi nærbilder med høy kvalitet.Skulle der opstå en hændelse, som fører til, at en alarm går via VCA-systemet. vil ikke kun operatørerne blive alarmeret, men et PTZ-kapabelt HDTV kamera kan desuden automatisk zoome ind på den hændelse, som har udløst alarmen og skabe højkvalitetsbilleder af objektet.
  • Et VCA-system kan også integreres med biometrisk identifikation. Det indebærer, at operatørerne selv må identificere sig, før de går ind i et følsomt område.


Før der kan foretages nogen analyse, skal meta-data tages fra videostrømmen. Meta-data indeholder information om f.eks. objektets hastighed, størrelse og position.
Før der kan foretages nogen analyse, skal meta-data tages fra videostrømmen. Meta-data indeholder information om f.eks. objektets hastighed, størrelse og position.

Sådan fungerer VCA  
VCA er muligt takket vare skabelsen og analysen af meta-data. Typiske eksempler på meta-data er:

  • Objektets størrelse og position i billedet.
  • Objektets hastighed.
  • Nummerplader.

Enkelt udtrykt er meta-data et udtryk for data om data - eller data, som beskriver indholdet af, hvad kameraet ser. Eftersom disse aktuelle data siden hen føres videre til analyse, så er kvaliteten og præcisionen i skabelsen af meta-data af største betydning.
Først og fremmest er det vigtigt, at kun rigtige objekter bliver beskrevet, så at fx vegetation, der bevæger sig på grund af vind og lignende, ikke opfattes som objekter. Endvidere er det vigtigt at sørge for, at skygger heller ikke af systemet opfattes som objekter.

Meta-datas betydning
Betydningen af, at meta-data har en høj præcision, kan belyses, hvis man udgår fra en applikation som f.eks. automatisk nummerpladegenkendelse (ANPR). Hvis præcisionen er lav i et ANPR-system og tilforladeligheden i identificeringen af ID er dårlig, vil ANPR-systemet være værdiløst. Det kan også føre til problemer, hvis et objekts størrelse bliver fejlbedømt, så f.eks. en person kan komme ind på et forbudt område, uden at alarmen går i gang. Jo højere sikkerhed, der kræves af VCA-systemet, desto højere krav må man følgelig stille til skabelsen af korrekte meta-data. Selve dataen i billedet er naturligvis også vigtig at tage i betragtning. Er det tilstrækkeligt at kende et objekts position i billedet for at kunne implementere en steril zone eller en ’trip wire’ alarm? Tænk på, hvilke muligheder der ville være, hvis forskellige objekters position kunne plottes på et kort via koordinater, og videre, hvis man kunne klassificere dem som mennesker, biler, dyr etc.

Når det gælder værdien for slutbrugeren, er meta-data analysen naturligvis af yderste interesse. Det er jo resultatet af den, der bliver præsenteret som hændelser for brugeren.

Analysen af et menneskes position over tid kan resultere i områdesindtrængen, afhængig af personens bevægelser og typen af den analyse, som bruges. Hvis meta-data indeholder information om objektets geografiske position, kan meta-data afgøre, om det drejer sig om en for hurtigt kørende bil eller et løbende menneske. Informationen om hver bils hastighed kan siden hen bruges til at udregne gennemsnitshastigheden på en vejstrækning eller for at detektere og alarmere, når der er ved at blive dannet køer.

I et højsikkerhedsanlæg kan et velorganiseret indbrud detekteres tidligere, hvis systemet f.eks. er programmeret til at slå alarm i tilfælde af, at et vist antal personer på én gang bevæger sig hen imod et vist område forskellige steder fra. Såfremt meta-data indsamlingen er præcis og robust, kan en person i teorien følges mellem kameraerne i en by eller en bygning.


Originalvideo
Originalvideo.

Baggrundsdifferentiering
Når man beskriver, hvordan VCA fungerer, er det vigtigt at belyse separationen af objekter fra deres baggrund i en videostrøm. Der findes store forskelle i detaljer, når det gælder selve implementeringen af baggrundsdifferentiering, især de metoder, som bruges til at bortfiltrere billedforstyrrelser forårsagede af lysforandringer og vejreffekter så som vind, regn og sne. De grundlæggende skridt for en baggrundsdifferentiering er beskrevet nedenfor.

Segmentering
Segmentering.

Segmentering
Systemet holder et langsomt forandret billede i hukommelsen og koder dette som billedets statiske baggrund. For hvert nyt billede i videostrømmen opdateres baggrundsbilledet for at tilpasse sig ændrede lysniveauer osv. Pixels i det eksisterende billede, som er anderledes sammenlignet med baggrundsbilledet, segmenteres bort. Der findes forskellige metoder til at reducere effekterne fra ændrede lysforhold, dårlige kontraster og naturlige forandringer forårsaget af vejr. Niveauet på den bagvedliggende algoritme for dette adskiller de enklere teknologier fra de mere avancerede.

Clustering
Clustering.

Clustering
Clusters af segmenterede pixels grupperes for at forme objekter. De mere avancerede systemer er også kapable til at bortjustere slagskygger, men kan også følge objekter, som er delvist skjulte, eller hvor de, i de enkle systemer, glider i ét med baggrunden.

Klassificering – stående person
 Klassificering – stående person.

Klassificering
Langt fra alle VCA-systemer kan klare at skabe objektklassificering, men der findes en mængde forskellige teknologier for dette. En måde, hvorpå man kan gøre det, er at estimere et antal parametre for hvert objekt, inklusive størrelse, hastighed og position. Parameterværdierne sammenlignes derefter med forud definerede værdier, og objekterne stoppes derefter ind i de respektive klasser. Dette gør, at antallet af falske alarmer kan minimeres, da VCA-systemet slipper for at slå alarm for fx slagskygger og fugle.

En anden variant er at bruge, hvad der ofte kaldes skabelonmamatchnings-teknologier. Fælles for disse teknologier er, at de sammenligner objekterne med en database af forskellige skabeloner for derefter at beregne sandsynligheden for, at et objekt passer ind i en vis klasse. Denne metode kan videreudvikles til kun at have brug for et billede for at plukke objekter ud af billedet. På den måde bliver baggrundsdifferentieringen uvigtig. Men så vidt vi ved, er disse metoder hidtil kun blevet testet i forskningsprojekter og endnu ikke implementeret i noget kommercielt tilgængeligt VCA-produkt.

Ulemperne ved direkte klassificeringsteknologier er, at de kræver mere computerkraft og højere opløsning (flere pixels) på objekterne. Det betyder, at visse VCA-systemer kan klare at detektere og klassificere objekter over lange afstande (200 m med 640x480 opløsning), mens andre systemer stopper ved 50-70 meter på grund af tekniske begrænsninger.

Målfølging – stående person
.Sporing – stående person.

Sporing
Det sidste trin i processen er sporingen, hvor opgaven er at tildele hvert objekt et vist ID og holde objektet i systemet, så længe det opholder sig i kameraets synsfelt. Der eksisterer forskellige teknologier for at opspore objekter, hvor de er fuldt synlige eller delvist synlige, men de forskellige VCA-systemer adskiller sig meget på dette punkt.

Forskellen mellem ’Features & Functions’
Hvilke funktioner er det så, der faktisk kan detekteres? BSIA (British Security Industry Association) udtrykker det på følgende måde: Teoretisk set kan en hvilken som helst adfærd, der kan ses og beskrives præcist på et videobillede, identificeres automatisk og derefter alarmeres.
Altså: en adfærd, der skal detekteras, skal kunne ses. Dette betyder, at hvis man ikke kan se, hvorvidt en person bærer våben eller ej, kan det heller detekteres med VCA. Det er faktisk en almindelig misforståelse, at dette er tilfældet, men videoanalyse kan ikke udøve magi.

Et eksempel er det såkaldte ”left item detection”. Denne ”feature” er til for at detektere potentielt farlige objekter, f.eks. en bombe, som er blevet efterladt i en lufthavn eller et andet sted, hvor mange mennesker rejser. Problemet er, at et videokamera ikke kan se, hvad der er gemt bag en papirkurv, eller objekter, der er skjult bag forbipasserende mennesker. Dette fører os til distinktionen mellem ”feature” og funktion.

Med ’feature’ (mere præcist capability feature) mener man, at et system er i stand til at gøre visse ting. ’Funktion’ er mere komplekst, da den er afhængig af, hvordan ”featuren” er implementeret, og i hvilken grad det faktisk fungerer, dvs. brugbarheden. Et almindeligt brugt eksempel er en bils evne til at standse. Denne ”feature” er alle biler nødt til at have, men for at featuren skal være brugbar, er selve bremsefunktionen nødt til at være implementeret i form af en pedal, ikke en knap i handskerummet. Og hvis vi kører i en sportsvogn, stilles der yderligere krav til, hvor hurtigt bilen skal standse sammenlignet med en familiebil. Der er klare forskelle i funktioner.

Features

Hvis vi ser på alle de ”features”, som VCA-producenter bryster sig med at have, får vi en forvirrende liste med engelske udtryk:

• Asset Protector • Virtual Fence
• Loitering • Wrong Direction Detection
• Left Item Detection • Suspicious Directional Movement
• Tracking • Unusual Crowd Formation Detection
• Tailgating • People Counting
• Intelli-Search • Intrusion Detection
• Removed Item Detection • Crowd & Queue Management
• Perimeter Defence • Tripwire Detection
 • Traditional Video Motion Detection (VMD) • Unauthorised Activity Detection
• Camera Obstruction • Running Detection
• Slip & Fall Detection

Vi må nu spørge os selv, hvilken adfærd, som kan faktisk ses, og om den i givet fald kan beskrives præcist. Hvis vi ser på ”left item detection”, er vi tidligere i artiklen kommet frem til, at adfærden kan ses, såfremt objektet ikke er skjult bag noget. Med andre ord kan objektet ses, men kun ind imellem. Kan denne adfærd beskrives præcist? Hvordan definerer vi en glemt genstand? I hvor lang tid skal objektet være forladt, og hvor langt fra en person skal genstanden være? Hvis en person efterlader en taske i nærheden af en anden person, er tasken så en forladt genstand? Kan adfærden beskrives præcist? Ja, men kun ind imellem.

Mange VCA-virksomheder hævder, at deres systemer kan detektere efterladte genstande, en adfærd, som ind imellem kan beskrives og ind imellem ses af et kamera. Lad os være ærlige: dette er en ”feature” med en ussel funktionalitet. Hvad så med de øvrige ”features”, som bliver nævnt på siden? Hvad er egentlig ”unusual crowd formation movement”? Hvor godt kan systemerne leve op til disse udlovede ”features”?   

Arbejdsprincipper for VCA

Som tidligere nævnt, adskiller de forskellige VCA-systemer sig hvad angår gælder evnen til at generere og analysere meta-data. Med meta-data menes i denne forbindelse data, som beskriver indholdet af en videostrøm på den måde, at man kan danne sig en opfattelse om, hvad der foregår i billedet. Hvis systemet fx har evnen til at informere operatøren, så snart en person løber, så skal den kunne ekstrahere i hvert fald følgende data fra videostrømmen (analysedelen):

  • Ekstrahere forgrundsobjekt.
  • Estimere størrelse og andre adskillende værdier mht. forgrundsobjekterne.
  • Estimere hastigheden af hvert objekt (for at dette skal fungere, kræves, at systemet klarer at spore objekter via kommende videobilleder).

Denne ekstraherede data er altså meta-data. I næste trin vil VCA-systemet analysere meta-data, snarere end selve rå-videodata. I dette eksempel består meta-data analysen af:

  • Klassificering af forgrundsobjekt og inddeling i kategorierne ”mennesker” og ”ikke-mennesker”.
  • Klassificering af forgrundsobjekt og inddeling i kategorierne ”mennesker” og ”ikke-mennesker”.
Figur 1: Stereosensorer fra Saab bruges i det tracking-system for fodboldstadions, som Tracab leverer.
Figur 1: Stereosensorer fra Saab bruges i det tracking-system for fodboldstadions, som Tracab leverer. 


Forretningsmuligheder med VCA
Der er adskillige eksempler på, hvordan erhvervslivet kan tjene på at bruge VCA i sine sikkerhedsinstallationer. Fordelen ved, at et VCA-system kan detektere tyveri og anden uønsket  adfærd i et indkøbscenter er åbenbar, men VCA-systemet kan også bruges til f.eks. at følge op på butikskampagner og se, hvilke produkter eller hvilke reklameskiltsplaceringer, som tiltrækker flest kunder.

Et andet eksempel kunne være at bruge videoanalyse i et bankmiljø, hvor sikkerhedsfunktionen består i at forebygge tyveri og bedrageri, men som samtidig kunne bruges til at optimere effektiviteten i køerne foran kasserne ved at informere personalet, når der var brug for at åbne endnu en kasse.


Investeringsafkast (ROI)
Når et CCTV-system i dag bliver indkøbt, handler diskussionen som regel alene om sikkerhed, og måske er det også sådan det skal være. Der kan komme et tidspunkt, hvor forretningsanalytikere og statistik indtager CCTV-scenen og forlanger afkast fra sikkerhedsinstallationerne. Såfremt dette er nu, senere eller aldrig, ved vi ikke rigtigt. Hvad vi ved, er, at hele sikkerhedsindustrien burde lære at applicere de samme ideer og fundamentale værdier i en hvilken som helst CCTV-installation. Beregningen af afkastet af en investering er et kritisk værktøj, som skal berettige, at man har ret til at eksistere i en fri økonomi. Så hvordan måler vi, hvilket afkast en investering i videoanalyse kan have i en sikkerhedsapplikation? Som for alle andre forretningsscenarier handler det om at kalkulere omkostningen sammenlignet med investeringens effekt på indtægter og omkostningsbesparelser.

Typiske applikationer
En skole, som implementerer videoanalyse, kan have til hensigt at reducere skadevoldelse og omkostninger til sikkerhedspersonale, eller ganske enkelt sætte en stopper for de afbrydelser, som forekommer i løbet af skolens almindelige drift. Deres investeringsafkast kan beregnes ved at undersøge den totale omkostning for skadevoldelse i skolen sammenlignet med den besparelse, som en alarm med videoanalyse ville kunne bidrage med.

I dagens moderne samfund er skoler ofte mål for unge menneskers skadevoldelse, hvilket tærer alvorligt på de offentlige midler. Alarmer og sikkerhedsinstallationer stopper sjældent skadevoldelsen, men påkalder snarere opmærksomhed, så sikkerhedspersonale kan agere med passende foranstaltninger. Oftest drejer det sig om unge mennesker, som er i gang med sport og leg på skolens område, og som altså ikke er egentlige trusler. Ved hjælp af VCA ville enhver irrelevant alarm kunne bortfiltreres vha. videoanalyse. Således kan der spares udrykningsomkostninger for sikkerhedspersonalet.

En anden typisk arena for VCA er, når det drejer sig om at følge love og regler. Vi har i dag et stigende antal lovgivende organer, som opstiller regler for forskellige typer af virksomheder og organisationer. Mange af disse regler har et sikkerhedsfokus. Producenter, som fremstiller biologiske substanser er fx nødt til at følge amerikanske FDA’s forskellige regler om sikkerhed i produktionslokalerne - også selv om fabrikken befinder sig uden for USA. FDA regulerer fx hvor meget og hvilken type trafik, som får finde sted inden for et bestemt område. Det er oftest et must at følge disse regler af hensyn til business på det amerikanske marked. Dette bevirker, at producenterne mere eller mindre tvinges til at indkøbe systemer, som klarer at måle hastighed og retning for køretøjer, som bevæger sig inden for fabrikkens område. I disse tilfælde kræves der et bedre VCA system, som kan løse hele problematikken på en omkostningseffektiv måde. Beregningen af investeringsafkast bliver i disse tilfælde meget let at acceptere.

 

Beregning af investeringsafkast
Det er normalt ret enkelt at beregne afkastet af en VCA-investering; øget sikkerhed fører som regel til reducerede omkostninger for skadevoldelse og tyveri. Men tid er også penge, og tidsforbruget er ofte stort, når sikkerhedspersonale skal rykke ud og undersøge årsagen til en alarm, selv om der ikke har fundet nogen skadevoldelse eller noget tyveri sted. Hvis VCA kan bruges til at reducere antallet af falske alarmer, er der et klart og åbenbart afkast af VCA-installationen. 

En højspændingstransformator er normalt en ubemandet højsikkerhedsinstallation ude i landskabet med tilhørende, farlige elledninger. Omkostningen for at sende sikkerhedspersonale til en sådan installation er er høj, men nødvendig, da det er livsfarligt for civile at opholde sig i området. Ved at bruge videoanalyse i en sådan installation og kun slå alarm, når der er mennesker involveret, kunne antallet af falske alarmer reduceres væsentligt. Dette sparer helt klart tid og penge, da man kun behøver et sende sikkerhedspersonale ud, nær det er virkelig nødvendigt.

Lignende applikationer eksisterer overalt i verden – telefonnetstationer, togtunneller mv.


Stereobilleder
I et videoovervågningssystem dækker ét kamera normalt ét område. Videosensorerne fungerer altså monokulært. I kontrast til disse todimensionskameraer har menneskets øjne stereosyn for at kunne se og forstå sine omgivelser, dvs. en opfattelse af virkeligheden i 3D. Monokulært syn formidler en 2D-projektion af en 3D-verden, altså en flad beskrivelse. Det er åbenbart, at en sådan projektion begrænser typen af information, som kan ekstraheres ud af en videostrøm. Information om distance og dybde går tabt i en 2D-projektion, hvorved beregningen af objektets størrelse er umulig, med mindre der ikke findes en kortmodel over det overvågede område. Stereosyn lider ikke under den samme begrænsning. Almindelige kameraer kan konfigureres til at formidle et 3D-billede af virkeligheden. På samme måde som øjnenes opbygning sker dette ved at opsætte to videokameraer ved siden af hinanden med en vis afstand, (f.eks. 50 cm). Saabs stereosensor er et eksempel på en sådan billedsensor, som kan håndtere stereobilleder i realtid. Kameraerne indstilles på små og klart definerede afstande fra hinanden og observerer det samme område. Signalprocessorerne formidler derefter informationen fra de to kameraer og skaber et kort over området (se figur 1).

En stereosensor kan baseres på næsten et hvilket som helst videokamera. Det, der kræves, er, at kameraernes parametre og afstand fra hinanden er kendt. Mht. overvågning af dynamiske områder er det også vigtigt, at kameraerne er synkroniseret. Præcisionen i synkroniseringen skal være noget bedre end den typiske tidskonstant for de klassificerede objekter.

Tilgængeligheden af mere information (dyb) sammenlignet med et almindeligt kamerabillede er meget anvendelig for et VCA-system. Dette kan for eksempel bruges til nøje at måle de fysiske proportioner af et objekt, såvel som at separere delvist skjulte objekter fra hinanden. Desuden kan dette afstedkommes uden et kortbillede over det overvågede område. Ud over denne store fordel øger stereobilledet kraften i den grundlæggende proceskæde. Da stereo giver et 3D billede af virkeligheden, kan fugle og andre distraktioner let sorteres fra, og dermed reduceres antallet af falske alarmer. Et objekt kan også let skelnes fra sin skygge, hvilket er meget vanskeligt for et enkelt kamera. Detektion og clustering bliver også meget mindre afhængig af ændrede lysforhold.

Figur 2: En skematisk oversigt over et kameranetværk og dets relation til det geografiske netværk. Billedet viser mulige   kamera-til-kamera overgange. (Til højre) et eksempel på, hvordan bevægelsesspor fra individuelle kameraer kan sammenkobles  for at skabe globale spor gennem et kameranetværk.
Figur 2: En skematisk oversigt over et kameranetværk og dets relation til det geografiske netværk. Billedet viser mulige
kamera-til-kamera overgange. (Til højre) et eksempel på, hvordan bevægelsesspor fra individuelle kameraer kan sammenkobles
for at skabe globale spor gennem et kameranetværk.
  

Konsekvent sporing gennem kameraer

Vi beskrev tidligere i artiklen behovet for at kunne spore objekter. En typisk videoinstallation består af et antal kameraer, hvor visse enheder har overlappende overvågningsområder, mens andre kameraer kan være installeret med store afstande mellem kameraerne og med helt forskellige overvågningsområder. Det er åbenbart, at det er meget sværere at følge objekter, som bevæger sig mellem kameraer, sammenlignet med at følge et objekt i en og samme videostrøm:

  • Kameraerne kan være separeret af store afstande, og objekterne kan havne uden for billedet i lange perioder.
  • Lysforholdene kan også variere kraftigt, hvilket kan gøre det svært for forskellige kameraer at forstå, at det drejer sig om ét og samme objekt.
  • Kameraerne kan være af forskellig model og fabrikat, hvilket yderligere komplicerer implementeringen.    

Som det fremgår af ovenstående, er problemet svært at løse. Det kræver eksponentielt stigende beregninger i takt med, at flere kameraer og flere objekter bliver involveret. I dag udvikles der  imidlertid metoder til konsekvent sporing imellem kameraer, der så småt er ved at blive brugbare i virkelige installationer. Den mest vellykkede af disse metoder tager med i beregningen, hvordan det fysiske netværk af entreer, udgange og åbne arealer ser ud i indkøbscentret, og hvordan disse er relateret til kameraernes positioner. På denne måde behøver vi kun at koble objekter mellem de synsfelter, som faktisk er tilsluttede (se figur 2).

Mange fordele
Et velfungerende netværk med konsekvent sporing kan øge operatørens evne til at udføre sine sikkerhedsrutiner væsentligt. Først og fremmest skaber dette et betydeligt bedre overblik over det overvågede område. Desuden bliver det muligt at se, hvor et objekt har været, før man blev interesseret af det. Endelig fører denne type funktionalitet til, at det også bliver enklere at gå igennem optaget materiale, da det bliver muligt at sammenkoble optaget video med objektdata. Eftersom meta-data er meget mere koncentreret sammenlignet med råvideodata, bliver det enklere at søge i det optagne materiale.



Leverandører
Tilbage til toppen