Video gözetimi için yapay zeka - Vikipedi

Video gözetimi için yapay zeka, insanları, araçları, nesneleri ve olayları tanımak için video gözetim kameralarından gelen ses ve görüntüleri analiz eden bilgisayar yazılım programlarını kullanmaktadır. Güvenlik müteahhitleri programı, kamera gözetimi ile korunan mülk için (örneğin çitle çevrili bir alan, bir park yeri gibi, ancak park yeri dışındaki kaldırım veya halka açık cadde değil) kameranın görüşü ve günün saatleri için (örneğin iş kapanışından sonra) programlanan kısıtlı alanları tanımlayan yazılımdır. Yapay zeka, günün o saatinde o bölgeye kimsenin girmesine izin verilmeyen "kural" setini ihlal eden bir kişi tespit ederse bir uyarı göndermektedir.[1]

Yapay zeka programı, yapay görme kullanarak çalışır. Yapay görme, farklı duruş, açı, konum ve hareketlerdeki insanların yüz binlerce kayıtlı referans görüntüsüyle görülen nesneyi karşılaştırmak için bir akış şeması veya bir dizi soru gibi çalışan bir dizi algoritma veya matematiksel prosedürdür. Yapay zeka kendisine gözlenen nesnenin referans görüntülerdeki gibi hareket edip etmediğini, genişliğine göre yaklaşık olarak aynı boyutta olup olmadığını, karakteristik iki kol ve iki bacağa sahip olup olmadığını, benzer hızda hareket edip etmediğini ve yatay yerine dikey olup olmadığını sormaktadır. Nesnenin yansıtma derecesi, sabit veya titreşme derecesi ve hareket ettiği pürüzsüzlük gibi birçok başka soru da mümkündür. Çeşitli sorulardan elde edilen tüm değerleri birleştirerek, yapay zekaya nesnenin bir insan olup olmadığı olasılığını veren genel bir sıralama elde edilmektedir. Değer, ayarlanmış bir sınırı aşarsa uyarı göndermektedir. Bu tür programların bir dereceye kadar kendi kendine öğrenmeleri, öğrenmeleri, örneğin izlenen görüntünün belirli bölümlerinde insanların veya araçların kameradan en uzak alanlar olan diğer bölümlerden daha büyük görünmesini öğrenmeleri bu tür programların karakteristiğidir.

Günün belirli saatlerinde belirli bölgelerden insanları veya araçları kısıtlayan basit kuralın yanı sıra daha karmaşık kurallar da belirlenebilir. Sistemin kullanıcısı, araçların bir yönde ilerleyip diğer yönde gitmediğini bilmek isteyebilir. Kullanıcılar, belirli bir alanda önceden belirlenmiş belirli sayıdan fazla insan olduğunu bilmek isteyebilir. Yapay zeka, aynı anda yüzlerce kameranın gözetimini sağlama yeteneğine sahiptir. Uzakta, yağmurda veya parıldayan bir durumda izinsiz giren bir kişiyi tespit etme yeteneği, insanların bunu yapma yeteneğinden daha üstündür.

Güvenlik için bu tür yapay zeka "kural tabanlı" olarak bilinir, çünkü bir insan programcı, kullanıcının uyarılmak istediği her şey için kurallar belirlemelidir. Bu, güvenlik için en yaygın yapay zeka biçimidir. Günümüzde birçok video gözetim kamera sistemi, bu tür yapay zeka özelliğini içerir. Programı barındıran sabit disk, kameraların kendisinde veya kameralardan girdi alan ayrı bir cihazda olabilir.

Daha yeni, kurala dayalı olmayan bir yapay zeka biçimi. güvenlik için "davranışsal analitik" adı verilen geliştirilmiştir. Bu yazılım, kullanıcı veya güvenlik yüklenicisi tarafından herhangi bir ilk programlama girişi olmaksızın tamamen kendi kendine öğrenmektedir. Bu tür analitikte, yapay zeka, boyut, yansıtma, renk, gruplama, hız, dikey veya yatay yönlendirme gibi çeşitli özelliklere ilişkin kendi gözlemlerine dayanarak insanlar, araçlar, makineler ve çevre için normal davranışın ne olduğunu öğrenmektedir. Yapay zeka görsel verileri normalleştirir, yani gözlemlediği nesneleri ve kalıpları sınıflandırır ve etiketlemektedir. Ayrıca gözlemlenen çeşitli nesneler için neyin normal veya ortalama davranış olduğuna dair sürekli olarak rafine tanımlar oluşturmaktadır. Birkaç hafta bu şekilde öğrendikten sonra, işlerin kalıbı ne zaman kırdığını anlayabilir. Bu tür anormallikleri gözlemlediğinde bir uyarı gönderir. Örneğin, arabaların sokakta sürmesi normaldir. Kaldırıma çıkarken görülen bir araba bir anormallik olurdu. Geceleri çitle çevrili bir avlu normalde boşsa, o alana giren bir kişi bir anormallik olacaktır.

Problem cümlesi

[değiştir | kaynağı değiştir]

İnsanların video gözetim canlı görüntülerini dikkatli bir şekilde izleme yeteneğindeki sınırlamalar, görevi daha iyi yerine getirebilecek yapay zeka talebine yol açmıştır. Tek bir video monitörünü yirmi dakikadan fazla izleyen insanlar, önemli olayları ayırt etmek için yeterli dikkati sürdürme yeteneklerinin %95'ini kaybeder.[2] İki monitör ile bu tekrar yarıya indirilir.[3] Birçok tesiste düzinelerce hatta yüzlerce kamera olduğu göz önüne alındığında, görev açıkça insan yeteneğinin ötesindedir. Genel olarak, boş koridorların, depolama tesislerinin, otoparkların veya yapıların kamera görüntüleri son derece sıkıcıdır ve bu nedenle dikkat hızla azalmaktadır. Birden fazla kamera izlendiğinde, tipik olarak bir duvar monitörü veya bölünmüş ekran görünümüne sahip bir dizi monitör kullanılır ve bir kamera seti ile diğeri arasında birkaç saniyede bir dönerek görsel bıkkınlık hızla bunaltıcı olur. Video gözetim kameraları, otomobil bayilerinden alışveriş plazalarına, okullara ve işletmelere, nükleer santraller gibi yüksek güvenlikli tesislere kadar değişen kullanıcılar tarafından büyük ölçüde benimsenerek çoğalırken, memurlar tarafından video gözetiminin pratik ve etkisiz olduğu sonradan anlaşılmıştır. Kapsamlı video gözetim sistemleri, bir hırsızlık, kundakçılık, saldırı veya olaydan sonra birini tanımlamak için olası adli kullanım için yalnızca kayıt yapmakla sınırlandırıldı. Özellikle geniş dış mekanlar için geniş açılı kamera görüntülerinin kullanıldığı yerlerde, yetersiz çözünürlük nedeniyle bu amaç için bile ciddi sınırlamalar keşfedildi.[4] Bu durumlarda, izinsiz gireni veya faili tespit etmek imkansızdır çünkü görüntüleri monitörde çok küçüktür.

Çözüm için erken dönem denemeleri

[değiştir | kaynağı değiştir]

Hareket algılama kameraları

[değiştir | kaynağı değiştir]

İnsan korumaların uzun süreli gözetleme monitörlerini izleme konusundaki eksikliklerine yanıt olarak, ilk çözüm kameralara hareket dedektörleri eklemek oldu. Bir davetsiz misafirin veya failin hareketinin, uzaktan izleme görevlisine sürekli insan uyanıklığı ihtiyacını ortadan kaldıran bir uyarı göndereceği düşünüldü. Sorun, dış ortamda, ekranda görüntülenen toplam görüntüyü oluşturan piksellerde sürekli hareket veya değişiklikler olmasıdır. Rüzgarda uçuşan ağaçlardaki yaprakların, yerdeki çöplerin, böceklerin, kuşların, köpeklerin, gölgelerin, farların, güneş ışınlarının ve benzeri şeylerin hareketini içerir. Bu, günde yüzlerce, hatta binlerce yanlış uyarıya neden oldu ve bu çözümü, kapalı ortamlar dışında çalışma saatleri dışında çalışmaz hale getirmiştir.

Gelişmiş video hareket algılama

[değiştir | kaynağı değiştir]

Bir sonraki evrim, yanlış uyarıları bir dereceye kadar azaltmıştır. Ancak bunun maliyeti, karmaşık ve zaman alıcı manuel kalibrasyon olarak geri dönmüştür. Burada, bir kişi veya araç gibi bir hedefin sabit bir arka plana göre değişiklikleri tespit edilir. Arka planın mevsimsel olarak veya diğer değişikliklerden dolayı değiştiği durumlarda, güvenilirlik zamanla bozulmaktadır. Çok fazla yanlış uyarıya yanıt vermenin ekonomisi bir kez daha engel olmuştur ve bu çözüm de yeterli bulunmamıştır.

Gerçek video analitiğinin ortaya çıkışı

[değiştir | kaynağı değiştir]

Görsel tanımanın makine öğrenimi, örüntüler ve bunların sınıflandırılması ile ilgilidir.[5][6] Gerçek video analitiği, insan biçimini, araçları ve tekneleri veya seçilen nesneleri, diğer tüm nesnelerin genel hareketinden ve monitördeki görsel statik veya piksellerdeki değişikliklerden ayırt edebilmektedir. Bunu kalıpları tanıyarak yapar. İlgilenilen nesne, örneğin bir insan önceden belirlenmiş bir kuralı ihlal ettiğinde, örneğin önceden tanımlanmış bir alanda, tanımlanmış bir zaman aralığında insan sayısının sıfırı geçmemesi durumunda, bir uyarı gönderilir. Kırmızı bir dikdörtgen veya sözde "sınırlayıcı kutu", genellikle algılanan davetsiz misafiri otomatik olarak takip eder ve uyarı olarak bunun kısa bir video klibini gönderir.

Pratik uygulama

[değiştir | kaynağı değiştir]

Gerçek zamanlı önleyici faaliyet

[değiştir | kaynağı değiştir]

Video gözetimi kullanan davetsiz misafirlerin tespiti, video kameraların ekonomisine ve doğasına bağlı olarak sınırlamalara sahiptir. Tipik olarak, dış mekan kameraları geniş açılı bir görünüme ayarlanır ve uzun bir mesafeye bakar. Saniyedeki kare hızı ve parlak aydınlatılmış alanları ve loş aydınlatılmış alanları işlemek için dinamik aralık, kameranın hareket eden bir insan davetsiz misafirini görmeye gerçekten yeterli olmasını daha da zorlar. Geceleri, aydınlatılmış dış mekanlarda bile, hareketli bir nesne saniyede kare başına yeterli ışık toplamaz ve bu nedenle, kameraya oldukça yakın olmadıkça, ince bir tutam veya zar zor fark edilebilen hayalet veya tamamen görünmez olarak görünecektir. Parlama, kısmi bulanıklık, yağmur, kar, sis ve karanlık koşullarının tümü sorunu daha da karmaşık hale getirir. Bu koşullarda bir insan, bir öznenin monitöründe gerçek konuma bakmaya yönlendirilse bile, özne genellikle algılanmayacaktır. Yapay zeka, görüntünün tamamına ve tüm kameraların görüntülerine aynı anda tarafsız bir şekilde bakabilir. İnsan formunu neyin oluşturduğuna dair öğrenmiş olduğu modelden sapma derecelerinin istatistiksel modellerini kullanarak, olumsuz koşullarda bile yüksek güvenilirlik ve düşük yanlış alarm oranı ile bir davetsiz misafiri tespit edecektir.[7] Öğrenmesi, çeşitli pozisyonlarda, açılarda, duruşlarda yaklaşık çeyrek milyon insan görüntüsüne dayanmaktadır.

Yerleşik video analitiğine sahip bir megapiksel kamera, ideal olmayan koşullarda yaklaşık 350' uzaklıkta ve yaklaşık 30 derecelik bir görüş açısında bir insanı tespit edebilmiştir. "Sanal bir çit" veya önceden tanımlanmış bir alana izinsiz giriş için kurallar belirlenebilir. Yönlü seyahat, geride kalan nesne, kalabalık oluşumu ve diğer bazı koşullar için kurallar belirlenebilir. Video gözetimi için yapay zeka, Çin'de yaygın olarak kullanılmaktadır.

Sistemin en güçlü özelliklerinden biri, yapay zekadan bir uyarı alan bir memurun veya operatörün, dış mekan genel seslendirme hoparlörleri üzerinden davetsiz misafirle anında konuşabilmesidir. Bu, suçların çoğu fırsatçı olduğundan ve canlı bir kişi onlarla konuştuğunda, davetsiz misafirlere yakalanma riski o kadar belirgin hale geldiğinden, yüksek caydırıcılık değerine sahiptir. Güvenlik görevlisi, davetsiz misafirin gerçek bir kişinin onları izlediğinden şüphe duymaması için davetsiz misafirin hareketlerini tarif eder. Memur, davetsiz misafirin yasaları çiğnediğini ve kolluk kuvvetleriyle temasa geçildiğini ve video kaydının alındığını ilan eder.[8]

Doğrulanmış ihlal raporu

[değiştir | kaynağı değiştir]

Polis, hırsız alarmlarından çok sayıda yanlış alarm alır. Aslında güvenlik endüstrisi, bu tür alarmların %98'inden fazlasının yanlış alarmlar olduğunu bildirmektedir. Buna göre, polis hırsız alarmlarına çok düşük öncelikli yanıt veriyor ve olay yerine müdahale etmesi yirmi dakika ile iki saat arasında sürebiliyor. Buna karşılık, video analiziyle tespit edilen suç, devam eden gerçek bir suç olduğunu kendi gözleriyle doğrulayan merkezi izleme görevlisine bildirilir. Daha sonra, bu tür aramalara en yüksek önceliği veren polise gönderir.

Davranışsal analiz

[değiştir | kaynağı değiştir]

Kural tabanlı video analitiği birçok güvenlik uygulaması için ekonomik ve güvenilir bir şekilde çalışsa da, çalışamayacağı birçok durum vardır.[9] Günün belirli saatlerinde, örneğin bir gecede, kimsenin ait olmadığı bir kapalı veya açık alan veya baz istasyonu gibi herhangi bir zamanda kimsenin ait olmadığı alanlar için, geleneksel kural tabanlı analitik mükemmel şekilde uygundur. Baz istasyonu örneğinde, bir servis teknisyeninin bölgeye erişmesi gereken nadir zaman, izleme yanıtını "teste" koymak için bir geçiş koduyla aramayı gerektirecek veya yetkili kişinin orada bulunduğu kısa süre için devre dışı bırakılacaktır.

Ancak her zaman her yere yüzlerce veya binlerce insanın ait olduğu aktif ortamlarda birçok güvenlik ihtiyacı vardır. Örneğin, bir üniversite kampüsü, aktif bir fabrika, bir hastane veya herhangi bir aktif işletme tesisi. Meşru kişiler ile suçlular veya suç işleyenler arasında ayrım yapacak kurallar koymak mümkün değildir.

Durumsal farkındalığın ölçülmesi

[değiştir | kaynağı değiştir]

Yapay zekanın güvenlik için faydası bir boşlukta mevcut değildir ve gelişimi tamamen akademik veya bilimsel çalışma tarafından yönlendirilmemiştir. Daha ziyade, gerçek dünya ihtiyaçlarına ve dolayısıyla ekonomik güçlere yöneliktir. Operasyonel verimlilik, alışverişçilerin teşhir alanlarının ısı haritalaması (perakende alanında belirli bir alanda kaç kişinin olduğu anlamına gelir) ve derslere katılım gibi güvenlik dışı uygulamalar için kullanımı, kullanımları geliştirmektedir.[10] İnsanlar, birden fazla uzaktan görüntülenen konumda eşzamanlı hesaplamalar gerektiren çok büyük veri kümelerinden oluşan kalıpları derlemek ve tanımak için yapay zeka kadar nitelikli değildir. Bu tür çoklu görevlerin insan dikkatini ve performansını odaktan uzaklaştırdığı gösterilmiştir. Yapay zekalar bu tür verileri işleme yeteneğine sahiptir. Video kameralarla etkileşime giren güvenlik amaçları için, işlevsel olarak insanlardan veya makinenin ona yaklaşımından daha iyi görme keskinliğine sahiptirler. Kişilerin davranışlarının veya niyetlerinin inceliklerini veya tehdit derecelerini değerlendirmek için, teknolojinin mevcut durumunda insanlar çok daha üstündür. Bu nedenle, güvenlikteki yapay zeka, insan kapasitesinin ötesinde geniş bir şekilde tarama yapmak ve verileri birinci bir uygunluk düzeyine göre incelemek ve daha sonra değerlendirme ve yanıt işlevini devralan insan memuru uyarmak için işlev görmektedir.

Pratik dünyada güvenlik, ekonomik olarak belirlenir, böylece önleyici güvenlik harcaması asla tipik olarak kaçınılması gereken riskin algılanan maliyetini aşamaz. Araştırmalar, şirketlerin tipik olarak, gerçek kayıplarının kendilerine mal olduğu güvenlik tutarının yalnızca yirmi beşte birini harcadıklarını göstermiştir.[11] Saf ekonomik teori ile bir denklik veya homeostaz olması gereken şey, bu nedenle ondan çok geri kalmaktadır. Bunu açıklayan teorilerden biri, bilişsel uyumsuzluk veya risk gibi hoş olmayan şeylerin bilinçli zihinden kolaylıkla kaçabilmesidir. Bununla birlikte, güvenlik büyük bir harcamadır ve farklı güvenlik araçlarının maliyetlerinin karşılaştırılması, güvenlik uzmanları arasında her zaman en başta gelir.

Gelecekteki güvenlik tehditlerinin veya kayıplarının yeterince değerlendirilmemesinin bir başka nedeni de, eşzamanlı olarak yaşanan dolaylı kayıplar yelpazesi yerine, genellikle potansiyel bir kaybın doğrudan maliyetinin dikkate alınmasıdır. Örneğin, bir fabrikada özel üretim bir makinenin veya soğutmalı bir çekici-römork vandalizm-imhası, müşterilere hizmet edilemeyen uzun bir değiştirme süresine neden olarak işlerinin kaybedilmesine neden olur. Şiddet içeren bir suç, bir işveren için, çalışanı korumama konusundaki doğrudan sorumluluğun ötesinde, kapsamlı bir halkla ilişkiler hasarına yol açacaktır.

Davranışsal analitik, basit güvenliğin ötesinde benzersiz bir şekilde çalışır ve standart protokol kalıplarındaki ihlalleri gözlemleme yeteneği nedeniyle, çalışanların tazminat veya kamu sorumluluğu olaylarına yol açabilecek güvenli olmayan eylemlerini etkili bir şekilde bulabilir. Burada da gelecekteki olayların maliyetlerinin değerlendirilmesi gerçeğin gerisinde kalmaktadır. Liberty Mutual Insurance Company tarafından yapılan bir araştırma, dolaylı zararların sigortasız maliyetleri geçici yedek işçileri değiştirmeler için işe alma maliyetleri, eğitim maliyetleri, yöneticilerin raporlarda veya mahkemede geçirdiği süre, diğer çalışanlar üzerinde olumsuz moral ve müşteri ve halkla ilişkiler üzerindeki etkisini içerdiğinden, işverenlere maliyetinin doğrudan sigortalı maliyetin yaklaşık altı katı olduğunu göstermiştir.[12] Yapay zekanın davranışsal analitik biçiminde bu tür olayları proaktif olarak engelleme ve önleme potansiyeli önemlidir.

  1. ^ "Video Analizi - genel bakış". www.sciencedirect.com. 8 Kasım 2020 tarihinde kaynağından arşivlendi. 
  2. ^ "ABD Okullarında Güvenlik Teknolojilerinin Uygun ve Etkili Kullanımı, Okullar ve Kanun Uygulayıcı Kurumlar İçin Bir Kılavuz" (PDF). Green, Mary W. (1999). 28 Nisan 2015 tarihinde kaynağından (PDF) arşivlendi. 
  3. ^ "İnsan video gözetim performansı ne kadar etkilidir?". Pattern Recognition,. 13 Ağustos 2019 tarihinde kaynağından arşivlendi. 
  4. ^ "Görsel sürekli dikkat: Görüntü bozulması, zaman içinde hızlı hassasiyet azalmasına neden olur". Science, 220, 327-329. Nuechterlein, K.H., Parasuraman, R., & Jiang, Q. (1983). 31 Ağustos 2017 tarihinde kaynağından arşivlendi. 
  5. ^ Pedro Domingos, The Master Algorithm: How the Quest for the Ultimate Learning Machine Will Remake Our World, September 22, 2015 Basic Books
  6. ^ Bilgisayar ve Yapay Görme, Dördüncü Baskı: Teori, Algoritmalar, Pratiklikler. Davies, E. R. (2012). 25 Haziran 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 26 Haziran 2021. 
  7. ^ Dufour, Jean-Yves, Intelligent Video Surveillance Systems, John Wiley Publisher (2012)
  8. ^ "Video Analizi Nedir, Basitçe Açıklandı". Hantman, Ken (2014). 23 Haziran 2011 tarihinde kaynağından arşivlendi. 
  9. ^ Rice, Derek, Finding & Selling The Value of Analytics, SDM Magazine (Sept 2015) BNP Media II, Troy Michigan
  10. ^ Gruber, Illy, The Evolution of Video Analytics, Security Sales & Integration magazine (August 11, 2012) Security Sales & Integration, Framingham MA
  11. ^ Bressler, Martin S., The Impact of Crime on Business: A Model of Prevention, Detection & Remedy, Journal of Management and Marketing Research (2009)
  12. ^ Safety Index Report, Liberty Mutual Insurance Company (2002)