Джерела даних

data-sources.png

В цій статті ми описуємо, які джерела даних ми використовуємо на сайті alerts.in.ua, які проблеми виникали з джерелами дани та чому усі підрахунки є приблизними.

Джерела даних

Повітряні тривоги

В нашій базі інформація про повітряні тривоги умовно розділена на чотири частини:

Вибухи та проведення вибухонебзепечних робіт

Інформація про вибухи з 25 лютого 2022 - це дані моніторингу ЗМІ, місцевих каналів, каналів голів ОДА від команди єТривога

Вуличні бої, хімічна та ядерна загроза

Канал “Повітряна тривога” повідомляє про вуличні бої, хімічну та ядерну загрозу. Проте за весь час існування таких повідомлень не було. Надіємось, що і не буде.

Інформація про причину тривоги

Інформація про загрози формується на основі аналізу каналів “Повітряна тривога” та офіційного каналу каналу Повітряні сили ЗСУ.

⚠️ За замовчуванням в усіх користувачів відображається лише офіційна інформація. Користувач може явно увімкнути додаткову інформацію на основі ЗМІ в налаштуваннях.

Повітряна тривога

24 лютого

Інформації за 24 лютого дуже мало і подекуди вона суперечить одна одній.

Ми спробували відтворити тривоги на основі:

За цей період практично немає інформації про тривалість тривог, тому ми використали значення в 1 годину.

Плануємо ретроспективно доповнювати інформацію, якщо будемо мати більше даних.

25 лютого - 15 березня

Схожа ситуація, як і за 24 лютого. Системи сповіщення поступово поступово покращувалися, проте є багато невизначеностей.

За цей період фіксація тривог здійснювалася за допомогою місцевих ЗМІ, Суспільного, каналів голів ОДА та інших публічних джерел.

Типові проблеми, які виникали:

  1. Невідомо на якому рівні оголошуються тривоги: місто, громада, район чи область. В таких випадках оголошувалися тривога на рівні області.
  2. Тривоги не мали відбоїв. Тобто відомий факт оголошення тривоги, проте невідомо коли відбій. У даному випадку використовувалося значення - 30хв.
  3. Деякі регіони не публікували про тривоги в соцмережах.

Ми використали дані від проєкту “єТривога”, які займалися моніторингом тривог та повідомлень ЗМІ у своєму однойменному мобільному застосунку.

Вдячні Вадиму Клименку за допомогу по підбору початкових даних.

Для Києва ми згодом актуалізували дані, беручи інформацію з офіційного каналу КМДА та застосунку Київ Цифровий, а також для Львівської області з офіційного каналу оповіщення “Оповіщення ЦЗ”.

Підсумовуючи усі ці фактори слід сказати, що дані про кількість та тривалість повітряних тривог за цей час є орієнтовними, проте вони виражають загальні тренди.

15 березня - 25 серпня

15 березня 2022 р. компанія Ajax Systems анонсувала про створення офіційного Telegram каналу “Повітряна тривога”. Цей канал приймає сигнали від застосунку «Повітряна тривога» і миттєво публікує повідомлення про початок та завершення тривог у різних областях України.

Перше повідомлення в каналі було о 18:02, а отже з цього часу починається збір тривог з цього джерела.

Дані за цей і подальші періоди є найбільш точними.

25 серпня

З 25 серпня ми також почали додатково моніторити інші офіційні канали. То ж якщо голова ОДА повідомляв про тривогу чи відбій в області раніше за канал “Повітряна тривога” ми фіксуємо цей час.

АР Крим

Згідно інформації з Офіційної карти тривог в АР Крим триває постійна тривога.

Детальніше…

Луганська область

Згідно інформації з офіційних джерел в Луганській області не було відбою, то ж там триває постійна тривога.

Детальніше…

м. Севастополь

Севастополь - це один із 27-ми адміністративних регіонів України і він не входить до складу Автономної Республіки Крим.

Ми не знайшли жодних згадок про тривоги в офіційних джерелах, тому місто не представлене в статистиці.

Загроза артобстрілу

Дані про артобстріли беруться з офіційного каналу “Повітряна тривога”. На жаль, канал повідомляє лише про загрозу в обмеженій кількості міст. Так скажімо не повідомляється про обстріли в Сумській області чи в м. Очаків. З 14 жовтня 2022 ми додатково, на основі моніторингу каналів громад командою “єТривога”, використовуємо дані про обстріли прикордонних територіїй Сумщини, а з 1 травня 2023 дані про обстріли прикордонних та прифронтових територій Харківської, Херсонської, Запорізької, Донецької, Дніпропетровської, Миколаївської областей.

Недоліком такої інформації є те, що канали повідомляють про початок обстрілів, але не про кінець, тому ми використовуємо значення в 30хв в такому випадку.

Помилки та неточності

Офіційні джерела

За час моніторингу ми зафіксували декілька разів, коли офіційний канал “Повітряна тривога” не повідомляв про певні тривоги в своєму каналі, проте такі тривоги була на Офіційній мапі тривог та в мобільному додатку.

Такі моменти фіксували користувачі і ми вручні їх коректували використовуючи дані з офіційної мапи.

Також в інших офіційних джерелах були ситуації коли:

У всіх випадках ми досліджуємо ситуацію і якщо з’являється якась інформація коректуємо статус тривоги.

Наші помилки

Ми також не виключаємо, що з нашої сторони можуть певні помилки і тому:

За весь час існування проєкту не було зафіксовано серйозних збоїв сервісу моніторингу, а ситуації з помилковими спрацьовуваннями пов’язаних з парсингом офіційних джерел оперативно виправлялись.

Детальніше про моніторинг…

Але ж сайт деколи не відкривався, то може не зафіксувалися всі тривоги?

Робота основного сайту ніяк не впливає на сервіс моніторингу.

Чи помилки вплинули на статистику?

Зважаючи на вищеописані факти ми не вважаємо, що помилки можуть суттєво вплинути на статистику. Адже скажімо 30 хибних спрацьовувань(що значно перебільшено) це менше 1% від загальної кількості.

Значно більше на статистику впливає частковість інформації про тривоги за період 24 лютого 2022 - 15 березня 2022.

Про статистику

Повітряна тривога в містах, районах, громадах

Ми не враховували в статистиці окремі повітряні тривоги в містах, районах чи територіальних громадах через те, що:

Тобто, якщо ми б враховували окремі повітряні тривоги в районах чи громадах, то ми б мали часткову статистику по тих регіонах, яких ми моніторимо і зовсім ніякої статистики по регіонах, які не моніторяться.

Також була б в залежність від часу коли ми почали моніторити, скажімо Світловодськ ми почали моніторити з листопада, тому і дані за цей регіон були б з листопада.

Зважаючи, що на даний момент не існує централізованої системи, яка могла б повідомляти про тривогу в кожній адміністративній одиниці на певний момент часу, тому така статистика була б дещо часткова.

Чому на інших сайтах інша статистика?

Наші дані можуть не співпадати з іншими джерелами через:

Яка б не була статистика вона всеодно не буде точною через відсутність єдиного джерела, яке б існувало з 24 лютого і яке повідомляло про стан тривоги в кожній адміністративній одиниці на кожен момент часу.