Timp de citire: 10 minute

Contextul actual al ratei de infracțiuni la nivel global reprezintă un motiv de îngrijorare pentru agențiile abilitate în prevenția și soluționarea acestora deoarece numărul acestor fapte care încalcă legile penale este într-un trend ascendent. În acest sens, metodele tradiționale folosite de autorități nu mai oferă rezultatele așteptate, aceste metode fiind lente și mai puțin eficiente.

Algoritmii și tehnicile din sferele Machine Learning și Computer Vision pot reprezenta o metodă de soluționare al acestor aspecte. În continuare vor fi descrise sumar rezultatele unor cazuri în care au fost utilizate aceste tehnici, rezultate descrise pe larg în cadrul articolului intitulat “Crime forecasting: a machine learning and computer vision approach to crime prediction and prevention”, publicat pe platforma SpringerOpen.[1]

Pentru a oferi o viziune mai clară asupra subiectului prezentat, în continuare se vor defini sumar termenii de Machine Learning și Computer Vision.

Computer Vision reprezintă o ramură a Inteligenței Artificiale care, prin analiza unor date provenite de la o cameră, calculatorul este antrenat în scopul înțelegerii mediului înconjurător. Aplicațiile concrete în această direcție sunt: recunoașterea facială, identificarea de obiecte, determinarea locației sau realitățile augmentate și mixte. În prezent, înțelegerea imaginilor de tip 3D de către calculatoare este un subiect de mare interes ce presupune cercetări în acest sens.

Machine Learning reprezintă tot o ramură a Inteligenței Artificiale, al cărui obiectiv este de a dezvolta capacitatea unui calculator de învățare și de a se îmbunătăți în mod automat, din experiențele anterioare. Există două tipuri de Machine Learning: Supervised (supravegheat) și Unsupervised (nesupravegheat).

În cazul ML Supervised, calculatorul este antrenat pe baza unui set predefinit de exemple de antrenament, ceea ce facilitează capacitatea de a obține concluzii precise și exacte atunci când sunt furnizate date noi. Pe de altă parte, în cazul ML Unsupervised, calculatorului i se oferă un set de date și acesta trebuie să găsească în mod individual anumite modele și relații comune între datele furnizate.

În continuare, se va pune în discuție o teorie prin care s-au combinat algoritmi de Machine Learning, ce au ca scop acționarea ca o bază de date pentru toate infracțiunile înregistrate în funcție de categorie, împreună cu tehnici de Computer Vision pentru a prezice o infracțiune înainte ca aceasta să se producă, dar nu înainte de a oferi câteva exemple ale actualelor modalități de prevenire a infracțiunilor.

Un instrument actual în scopul prevenirii infracționalității îl constituie simulatoarele de turn mobile “Stingray”. Aceste aparate simulează comportamentul unui turn de telefonie mobilă și induc în eroare telefoanele mobile din apropriere prin transmiterea locației lor și a altor informații. Deși reprezintă o modalitate destul de avansată în urmărirea telefoanelor, această tehnică este un subiect controversat în rândul anumitor țări, în special în Statele Unite ale Americii, deoarece ar încălca granițele vieții private.

O altă modalitate folosită în zilele noastre o constituie filajul. Filajul sau urmărirea operativă este o  acțiune de urmărire în scopul observării directe a comportamentului, conduitei și acțiunilor unei persoane, urmărindu-se stabilirea de adrese, identificarea de persoane conexe cu urmăritul sau fotografierea unor momente sau situații de interes. Însă, factorul uman din partea autorităților poate reprezenta o sursă de erori în anumite situații.

Alte modalități similare celor prezentate anterior sunt utilizarea dronelor, recunoașterea facială, recunoașterea plăcuțelor de înmatriculare și camere video corporale. Deși există numeroase tehnici actuale, înglobarea tuturor aspectelor pozitive individuale ale fiecărei tehnici de către un aparat ar fi un lucru extrem de benefic.

Exemple de tehnici Machine Learning folosite în predicția infracționalității

În continuare vor fi descrise două studii care au folosit tehnici de ML pentru predicția infracționalității, descrise și în articolul precizat în partea inițială, în scopul înțelegerii aplicabilității acestora.

Una dintre situațiile prezentate a fost predicția criminalității din ultimii 15 ani din Vancouver, Canada. Procesul întreg al analizei a constat în colectarea de date, clasificarea acestora, identificarea modelelor, predicția și vizualizarea. Algoritmii K-nearest neighbor (KNN) și Boosted Decision Tree au fost implementați pentru analiza seturilor de date. În respectivul studiu, un total de 560.000 de seturi de date privind infracțiunile între 2003 și 2018 au fost folosite în analiză și a rezultat o acuratețe între 39% și 44% pentru predicția infracțiunilor folosind algoritmii de Machine Learning.  Deși acuratețea a fost una relativ scăzută, autorii studiului au precizat că această acuratețe poate fi îmbunătățită prin reglarea algoritmilor sau a datelor pentru aplicațiile specifice.[2]

Un al studiu a presupus utilizarea unui sistem prin care era analizat un set de date care conține înregistrări ale infracțiunilor comise anterior și modelele acestora. Sistemul a avut în centru doi algoritmi ML: Decision Tree și KNN. Pentru creșterea acurateței modelului de predicție, au fost utilizate tehnici precum algoritmii Random Forest sau Adaptive Boosting. În acest caz, în scopul obținerii unor rezultate mai bune, infracțiunile au fost împărțite în clase frecvente și clase rare, din punct de vedere temporal. Sistemul a avut la dispoziție seturi de date privind activitatea infracțională pentru o perioadă de 12 ani în San Francisco, Statele Unite ale Americii. Utilizând metode de subeșantionare și supraeșantionare împreună cu algoritmul Random Forest, precizia a crescut surprinzător la 99.16%.[3]

După cum se poate observa privind exemplele anterior menționate, există diferite tehnici sau diferiți algoritmi din zona Machine Learning care pot ajuta agențiile abilitate în scopul predicției infracționalității. Evident, sunt tehnici pentru care s-au obținut rezultate mai bune în funcție de contextul dat sau sunt situații în cadrul cărora nu s-au obținut rezultatele așteptate. Analiza de performanță cu privire la metodele de ML utilizate este sumarizată prin tabelul 1.[4]

Modele Computer Vision combinate cu tehnici de Machine și Deep Learning

Un exemplu al acestei categorii îl constituie modelul de recunoaștere automată al plăcuțelor de înmatriculare (Automatic Number Plate Recognition – ANPR) pe care autorii l-au descris ca fiind o inovație în domeniul procesării imaginilor. [5]

Sistemul este alcătuit din 5 etape: capturarea imaginii vehiculului, preprocesarea, extragerea plăcuțelor de înmatriculare, segmentarea caracterelor și recunoașterea caracterelor. Înainte să se realizeze principala procesare a imaginii, se efectuează o preprocesare a acesteia care include convertirea culorilor într-o imagine gri, precum și îmbunătățirea marginilor pentru luminozitate. Ulterior, plăcuța de înmatriculare este separată de restul imaginii prin propria ei dimensiune. În final, literele și numerele sunt separate și vizualizate în mod individual.

De asemenea, autorii altui studiu au oferit o perspectivă asupra modului în care putem realiza cartografierea criminalității cu ajutorul sateliților.[6] În respectivul studiu s-a dorit investigarea utilizând Deep Learning pentru a prezice ratele criminalității direct din imaginile brute din satelit.

Autorii au antrenat o rețea neuronală convoluțională profundă (Deep Convolutional Neural Network – CNN) pe imagini din satelit obținute din peste un milion de rapoarte de incidente criminale (15 ani de date) colectate de către Departamentul de Poliție din Chicago. Cel mai performant model a prezis ratele criminalității cu o precizie de 79%.

Pentru o cercetare mai aprofundată, au folosit modelele testate și învățate din Chicago pentru a face predicții în orașele Denver și San Francisco, obținându-se o acuratețe a hărților acestor două orașe de 72% respectiv 70%.

Concluziile studiului au fost: caracteristicile vizuale conținute în imaginile din satelit pot fi utilizate cu succes ca indicator al ratelor de criminalitate, rețelele neuronale convoluționale fiind capabile să învețe modele pentru predicția ratelor de criminalitate din imaginile din satelit, iar modelele Deep Learning pot fi refolosite în diferite orașe după ce sunt utilizate și învățate.

Soluția propusă

Soluția prezentată în cadrul articolului constituie dorința de a proiecta un software capabil să utilizeze diferite tehnici de Machine Learning și Computer Vision în scopul prezicerii infracțiunilor precum și o analiză în detaliu despre locul unei infracțiuni.

Metodele prezentate și analizate sunt, în mod sumar, următoarele:

  1. Core analytics: Cunoașterea tehnicilor statistice prin care se pot prezice rezultate viitoare, în cazul contextului discutat, fiind de la instincte comportamentale la jefuirea unui magazin.
  2. Neural networks: Aceste rețele constituite un număr mare de algoritmi care ajută la găsirea relației comune între datele analizate, acționând asemenea unui creier uman, imitând celulele nervoase biologice și încercând să gândească, să înțeleagă și chiar să prezică în mod individual.
  3. Heuristic engines: Motoare cu date referitoare la antiviruși în scopul sporirii siguranței sistemului software implementat.
  4. Cryptographic algorithms: Aceștia au rolul de a codifica în mod privat datele criminale confidențiale cunoscute și sunt utilizați pentru păstrarea criptată a datelor infracționale potențiale nou descoperite.
  5. Recursion processors: Aceștia sunt utilizați pentru a aplica funcțiile mașinii noastre în mod repetat pentru a se asigura că acestea funcționează în mod continuu și nu încalcă niciodată supravegherea mașinii.
  6. Bayesian networks: Modele grafice aciclice probabilistice utilizate în predicție, detectarea anomaliilor, diagnosticarea și cunoașterea automată.
  7. Data acquisition: Acest aspect este unul dintre cele mai importante deoarece sistemul trebuie să posede cunoștiințele despre infracțiunile anterioare și să învețe din ele pentru a prezice viitoarele infracțiuni posibile.
  8. Document processors: Acestea sunt utilizate după colectarea datelor, în principal pentru parcurgerea, organizarea, analiza și învățarea din date.
  9. Computer linguistics: Utilizând algoritmi și modele de învățare, se încearcă să se ofere unui computer capacitatea de a înțelege limbajul vorbit uman.
  10. Natural language processor: Folosit de calculatoare pentru înțelegerea lingvisticii umane.
  11. Voice print identification: Distingerea vocii unei persoane față de altă persoană.
  12. Gait analysis: Studierea mișcării umane pentru distingerea dintre un ritm normal și unul anormal.
  13. Bio metric identification: Identificarea persoanelor după fața lor sau după amprenta degetelui stocată în câteva baze de date diferite.
  14. Pattern mining: Observarea tiparelor între activitățile de rutină.
  15. Intel interpretation: Utilizată pentru a da sens informațiilor colectate.
  16. Threat detection: O amenințare este detectată dacă, în timpul procesării informațiilor, se bifează un anumit număr de căsuțe de control predefinite la realizarea sistemului.
  17. Threat classification: Atunci când o amenințare este detectată, aceasta este clasificată în funcție de nivelul de gravitate: cazuri penale, spargeri, crime, posibil atac terorist.

Concluziile studiului

În primul rând, realizarea unui software care să înglobeze toate cele 17 modalități, tehnici și caracteristici anterior prezentate reprezintă o adevărată provocare pentru cercetători. Sistemul implementat va trebui întâi testat într-o parte mai restrânsă a unei zone metropolitane și ulterior, cu îmbunătățirile realizate, să fie extins la scară largă. De asemenea, durata procesării va reprezenta o provocare deoarece va fi de ordinul zilelor sau chiar săptămânilor până când datele vor fi analizate și învățate.

În al doilea rând, se poate observa faptul că există metode și tehnici la această oră care oferă rezultatele așteptate. De asemenea, dezvoltarea tehnologică din zilele noastre ne oferă o posibilă implementare în viitorul apropriat a unui sistem software care poate să ajute agențiile abilitate în scopul prezicerii infracționalității.

Această sinteză prezentată anterior a reprezentat o imagine de ansamblu privind predicția și prevenirea criminalității folosind tehnici și metode de Machine Learning și Computer Vision. Articolul menționat în partea inițială oferă o perspectivă mai detaliată în acest scop, informațiile prezentate anterior constituind parte din articol.

Referințe

[1] Shah, N., Bhagat, N. & Shah, M. Crime forecasting: a machine learning and computer vision approach to crime prediction and prevention. Vis. Comput. Ind. Biomed. Art 4, 9 (2021). https://doi.org/10.1186/s42492-021-00075-z

[2] Kim S, Joshi P, Kalsi PS, Taheri P (2018) Crime analysis through machine learning. In: Paper presented at the IEEE 9th annual information technology, electronics and mobile communication conference. IEEE, Vancouver 1-3 November 2018. https://doi.org/10.1109/IEMCON.2018.8614828

[3] Hossain S, Abtahee A, Kashem I, Hoque M, Sarker IH (2020) Crime prediction using spatio-temporal data. arXiv preprint arXiv:2003.09322. https://doi.org/10.1007/978-981-15-6648-6_22

[4] Performance analysis of forecasting methods, Shah, N., Bhagat, N. & Shah, M. Crime forecasting: a machine learning and computer vision approach to crime prediction and prevention. Vis. Comput. Ind. Biomed. Art 4, 9 (2021).https://vciba.springeropen.com/articles/10.1186/s42492-021-00075-z/tables/1

[5] Goyal A, Bhatia R (2016) Automated car number plate detection system to detect far number plates. IOSR J Comput Eng 18(4):34–40. https://doi.org/10.9790/0661-1804033440

[6] Najjar A, Kaneko S, Miyanaga Y (2018) Crime mapping from satellite imagery via deep learning. arXiv preprint arXiv:1812.06764. p. 1–8