Нейросеть научили предсказывать наводнения по Flickr
Опубликованно 12.03.2017 00:30
Британские ученые доказали, что семантический анализ пользовательского Контента в социальных сетях для прогнозирования стихийных бедствий.
Современная система оповещения о стихийных бедствиях во многом основывается на работе специального оборудования и профессиональных аналитиков. В то же время, существуют сервисы, через которые любой желающий может сообщать властям об изменениях некоторых климатических переменных, таких как количество осадков или бассейновом уровне. Кроме того, сообщила Геологическая служба США (usgs) признать, что анализ пользовательского контента и места расположения постов в Twitter может быть хорошим дополнением к высокотехнологичным методам, действуя как "социальный Барометр".
Последние исследования показали, что аналогичным образом можно использовать сервис для обмена фотографиями с Flickr. Итак, динамика публикаций и характер их описания и теги коррелирует с колебаниями атмосферного давления, в Нью-Джерси до и во время урагана Сэнди в 2012 году, что теоретически позволяет предсказать изменения погоды в пострадавших районах. Однако существующие методы анализа Контента в социальных сетях часто зависит от ключевых слов и фраз, соответствующих конкретному типу или имени стихийных бедствий (наводнение, ураган Катрина). По мнению авторов новой работы, такой подход может быть эффективным в решении оперативных проблем, но его возможности существенно ограничены.
Чтобы восполнить пробел, ученые из Уорикского университета разработали алгоритм семантического анализа тегов, который был обучен с помощью корреляционной матрицы demonstrirovalsya каскада (Деконструкции Каскадной матрицы корреляции). Этот метод позволяет обучать искусственные нейронные сети анализ проблемные, "заморозить" веса скрытых нейронов на входе — в результате, оценка остается относительно стабильным, несмотря на изменчивость параметров. Кроме того, DCCM обеспечивает возможность вертикального и горизонтального деконструкции переменные и работать в интернете. Метод междисциплинарных и прикладных, в том числе для прогнозирования погоды.
Команда обученных новый алгоритм на фото и видео с упаковке Yahoo Фликр творческих 100м (YFCC100M), которые были опубликованы в период с апреля 2004 года по август 2014 года. На входе, компьютер анализировал материалы по четырем общим ("природа", "пейзаж", "река", "вода") и два полугодия ("РВ" — от "реки" и "воды", и "НЛ" — от "природы" и "пейзаж") теги, каждый из которых выход был связан с конкретным ("наводнение", "половодье", "пойма") теги без указания атрибутами вес. Сравнение тегов с риском стихийных бедствий был проведен на основе трех параметров: масштаб события, Количество публикаций за пять дней до пика паводка и после пяти дней и модель поведения в пиковый период наводнения.
Результаты показали, что появление на Flickr теги связанные с наводнениями, статистически значимо коррелирует с уровнем специфических ("вода", "река") и обобщенный ("РАО") теги. В то же время, угроза стихийных бедствий было практически не связано с увеличением числа такие теги, как "пейзаж" и "природа". Примечательно, что теги "вода" и "река" заняла промежуточное положение между маркерами катастрофы и тема природа и примерно в равной степени коррелирует с другими тегами. Резюме теги были более вероятно, чтобы быть на один день раньше пиковый период наводнения, в то время как ближе к пику тег "РВ" используется более часто, и по тегу "безлимит", наоборот, резко утратили популярность.
Кроме того, исследователи ретроспективно проверялась способность модели предсказывать наводнения на Количество публикаций в сутки в течение пять дней до события. Сильные корреляции тегов "РВ" и "вода". Так, угроза стихийных бедствий свидетельствует увеличение числа загрузок с тегом "РАО" в 100 и более за пять дней до потопа, затем плавное падение. С увеличением числа публикаций с тегом "РАО" до 125 и более в сутки корреляции увеличивается; аналогичная динамика была характерна для роста загрузок с тегом "вода" до 125 и более в день с пиковой три дня до потопа и последующего сокращения.
По мнению авторов, их исследование показывает, что социальные сети-это ресурс, который может быть использован в сочетании с профессиональным источников данных Ю. п.. В будущем, такую систему предупреждения на основе анализа пользовательского Контента, могли бы беспрецедентной точностью и эффективностью, утверждают ученые.
Поведение пользователей социальных сетей становится объектом исследования не в первый раз. Ранее психологи связали активность в этих областях с чувством социальной изоляции, и физика по сравнению распространения мемов в социальных сетях с помощью статистических моделей, описывающих эпидемия и финансовые рынки.
Категория: Hi-Tech
Нейросеть научили предсказывать наводнения по Flickr