Методы текстового поиска и обработки информации в социальных сетях при управлении деятельностью правоохранительных органов тема диссертации и автореферата по ВАК РФ 05.13.10, кандидат наук Давыдова Юлия Витальевна
- Специальность ВАК РФ05.13.10
- Количество страниц 146
Оглавление диссертации кандидат наук Давыдова Юлия Витальевна
Введение
1 Обзор и анализ подходов к текстовому поиску и обработке информации в задачах мониторинга социальных сетей
1.1 Роль мониторинга социальных сетей для ситуационных центров
в задаче мониторинга противоправной ситуации в регионе
1.2 Особенности мониторинга социальных сетей и обработки
текстовых сообщений
1.3 Обзор существующих подходов к текстовому поиску и обработке информации для задач мониторинга социальных сетей
1.4 Постановка задач диссертационного исследования
1.5 Выводы по первой главе
2 Разработка метода интеллектуального специализированного текстового поиска лексических паттернов участников социальных
сетей, причастных к противоправным сферам
2.1 Анализ подходов к неточному сравнению строк и нечеткому текстовому поиску
2.1.1 Анализ мер сходства строк
2.1.2 Анализ методов нечеткого текстового поиска
2.2. Анализ моделей и алгоритмов обработки ошибок
2.3 Метод интеллектуального специализированного текстового поиска лексических паттернов участников социальных сетей, причастных к противоправным сферам
2.3.1 Этапы метода интеллектуального специализированного текстового поиска лексических паттернов
2.3.2 Модель ошибок для текстов на русском языке
2.3.3 Разработка классификатора словоформ
2.3.4 Этап обработки сообщений
2.4 Выводы по второй главе
3 Разработка метода обработки результатов интеллектуального специализированного текстового поиска лексических паттернов
3.1 Анализ подходов к обработке семантики
3.2 Метод обработки результатов интеллектуального специализированного текстового поиска лексических паттернов
3.2.1 Этапы метода обработки результатов интеллектуального специализированного текстового поиска лексических паттернов
3.2.2 Подготовка тематических моделей лексических паттернов
3.2.3 Обработка результатов работы интеллектуального специализированного текстового поиска лексических паттернов
3.3 Выводы по третьей главе
4 Реализация прототипа программного обеспечения интеллектуального специализированного текстового поиска и
обработки информации социальных сетей
4.1 Обзор функциональных требований
4.2 Структура прототипа программного обеспечения интеллектуального специализированного текстового поиска и обработки информации социальных сетей
4.2.1 База данных лексических паттернов
4.2.2 Модель ошибок. Оценка параметров буквенной модели ошибок
4.2.3 Обучение и тестирование классификатора словоформ
4.2.4 Построение тематических моделей для лексических паттернов
4.3 Оценка эффективности прототипа программного обеспечения интеллектуального специализированного текстового поиска и обработки информации социальных сетей
4.4. Выводы по четвертой главе
Заключение
Список литературы
Приложение А. Визуализация дерева решений после обучения
Рекомендованный список диссертаций по специальности «Управление в социальных и экономических системах», 05.13.10 шифр ВАК
Метод и алгоритмы классификации текстовой информации по индикаторам деструктивной направленности2021 год, кандидат наук Гостюнина Валерия Андреевна
Иерархическая обработка потоков текстовых сообщений на базе наивного байесовского классификатора2013 год, кандидат наук Крайнов, Александр Юрьевич
Номинации, относящиеся к семантическому полю "наркотики", и их текстовый анализ2013 год, кандидат наук Щенникова, Евгения Владимировна
Методология обнаружения угроз нарушения информационной безопасности в открытых компьютерных сетях на основе функциональной модели естественного языка2011 год, доктор технических наук Лебедев, Илья Сергеевич
Исследование методов и алгоритмов обработки текстовой информации социальных сетей в задачах формирования социального портрета пользователя2022 год, кандидат наук Андреев Илья Алексеевич
Введение диссертации (часть автореферата) на тему «Методы текстового поиска и обработки информации в социальных сетях при управлении деятельностью правоохранительных органов»
Введение
Актуальность темы исследования. Согласно Федеральному закону № 172-ФЗ от 28 июня 2014 г. «О стратегическом планировании в Российской Федерации» и Указу Президента РФ от 25.07.2013 г. № 648 «О формировании системы распределенных ситуационных центров, работающих по единому регламенту взаимодействия» создана федеральная информационная система стратегического планирования на основе распределенной информации, обеспечивающая формирование и обработку информации, содержащейся в федеральных, региональных и муниципальных информационных ресурсах и системах региональных органов исполнительной власти, необходимых для обеспечения поддержки принятия управленческих решений.
Одной из задач мониторинга и контроля, осуществляемых в ситуационных центрах, является задача мониторинга противоправной ситуации в регионе, а именно наркоситуации, терроризма, экстремизма, пропаганды суицида и др. Для проведения мониторинга противоправных сфер деятельности на территории субъекта Российской Федерации осуществляется сбор, изучение, обобщение, анализ и оценка информации: статистических сведений получаемых из территориальных органов федеральных органов исполнительной власти, иных федеральных государственных органов, органов исполнительной власти субъектов Российской Федерации, органов местного самоуправления, организаций и исследовательских центров; информационно-аналитических сведений и экспертных оценок указанных органов; результатов социологических исследований.
Управленческая деятельность со стороны региональных властей обеспечивается комплексом мероприятий в сфере профилактики правонарушений и антиобщественных действий. Осуществляется совместная работа подведомственной Минкомсвязи России Федеральной службы по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор) и МВД России по реализации статьи 15.1 Федерального закона от 27 июля 2006 г.
№ 149-ФЗ «Об информации, информационных технологиях и о защите информации». Так, МВД России за январь-декабрь 2018 года рассмотрено более 35 тыс. электронных обращений, по которым принято свыше 26,5 тыс. экспертных решений об ограничении доступа к интернет-ресурсам. Высокая степень вовлеченности населения, быстрое распространение контента и легкий доступ к аудитории - все эти особенности превращают социальные сети в важный источник информации.
Таким образом, в ситуационных центрах необходимо осуществлять регулярный мониторинг социальных сетей для мониторинга противоправной ситуации в региональной социально-экономической системе (РСЭС) и принятия оперативных управленческих решений.
Собираемая информация должна быть обработана, проанализирована, агрегирована и визуализируема для формирования альтернатив принятий решений. Мониторинг социальных сетей является частью комплексного подхода к решению проблемы распространения противоправного контента в социальных сетях.
Коммуникации в противоправных сферах характеризуются узкоспециализированными лексическими паттернами, являющимися жаргонизмами. Основными функциями жаргона в рамках социальных групп являются: затруднение понимания смысла беседы людьми непосвященными; идентификация участников сообщества; отражение внутренней иерархии социальной группы; определение коммуникационных каналов информационного обмена (т.е. структура социальной группы).
Сбор и анализ информации в социальных сетях, в сравнении с мониторингом веб-сайтов имеет свои особенности, в частности - огромное количество регулярно публикуемых пользователями сообщений, в среднем имеющих небольшую длину. В процессе мониторинга организуется поиск лексических паттернов, характеризующих противоправный объект мониторинга, в текстах сообщений пользователей социальных сетей. Поиск в тексте осложняется наличием орфографических ошибок и опечаток, необходимостью
обработки жаргона. Для лексических паттернов в противоправных сферах характерно явление лексической многозначности. Таким образом, возникает сложность определения тематической релевантности результатов поиска.
Данное диссертационное исследование базируется на результатах работ в следующих областях: управление в социально-экономических системах (Новиков Д. А.); информационный поиск и мониторинг (К. Д. Маннинг, Х. Шютце, В. И. Аверченков, Д. В. Ландэ, Р. Баеза-Йейтс); обработка естественного языка и компьютерная лингвистика (Ю. Д. Апресян, Л. Л. Иомдин, Е. И. Большакова, К. Д. Маннинг, Д. Журавски, П. Норвиг, Дж. Мартин, М. Д. Керниган); анализ данных (Дж. Ульман, Ю. Лесковец, П. Флах).
Представленные на рынке информационные системы мониторинга социальных сетей являются системами общего назначения и не ориентированы на обработку жаргонизмов. Обзор научных работ показал, что вопросам эффективного поиска в социальных сетях уделяется мало внимания. При этом именно этап поиска чаще всего является первичным фильтром для отбора сообщений, предназначенных для дальнейшего анализа. Задачами разграничения значений слов и снятия лексической неоднозначности, а также анализом и моделированием контекста занимались Н. Лукашевич, К. Лопухин, К. Воронцов, Р. Навигли, Т. Педерсен, Т. Миколов и другие. Существующие алгоритмы в той или иной степени снимают лексическую неоднозначность для слов общеупотребительной лексики, обработка жаргонизмов является более сложной и малоизученной задачей.
Таким образом, для организации мониторинга противоправных сфер деятельности в социальных сетях возникает потребность в разработке интеллектуального текстового поиска лексических паттернов со сниженной чувствительностью к ошибкам и обеспечивающего тематическую релевантность найденных результатов. Это позволяет сформировать объект, предмет и цель исследования.
Объектом исследования в данной работе являются процессы информационного взаимодействия между участниками социальных сетей для
выявления системных связей, закономерностей функционирования и развития противоправных объектов и процессов в РСЭС на примере сферы незаконного оборота наркотиков.
В качестве предмета исследования рассматриваются модели, методы и алгоритмы текстового поиска в социальных сетях для идентификации участников социальных сетей, причастных к противоправным сферам.
В связи с этим, целью диссертационного исследования является совершенствование мониторинга социальных сетей при управлении правоохранительной деятельностью на основе разработки эффективных методов специализированного текстового поиска.
Для достижения поставленной цели были сформулированы и решены следующие основные задачи:
1. Анализ социальных сетей как источника информации в задаче мониторинга противоправной ситуации в РСЭС.
2. Анализ методов текстового поиска и обработки информации в социальных сетях.
3. Разработка метода интеллектуального специализированного текстового поиска лексических паттернов участников социальных сетей, причастных к противоправным сферам.
4. Разработка метода обработки результатов интеллектуального специализированного текстового поиска лексических паттернов для формирования альтернатив принятия решений в задаче мониторинга противоправной ситуации в РСЭС.
5. Разработка прототипа программного обеспечения интеллектуального специализированного текстового поиска и обработки информации социальных сетей для механизмов принятия решений в задаче мониторинга противоправной ситуации в РСЭС.
Методы и средства исследования. В диссертационном исследовании использованы методы теории управления, методы обработки естественного языка,
теории вероятности и математической статистики, методы машинного обучения и теория множеств.
При разработке информационной системы использовались стандарты объектно-ориентированного проектирования и нотация ЦМЪ, принципы модульного и объектно-ориентированного программирования, методология проектирования баз данных ГОЕБ1Х.
Достоверность и обоснованность научных положений, результатов, выводов в диссертационном исследовании обеспечивается за счет корректного применения математического аппарата, соответствия результатов теоретических и экспериментальных исследований.
Научная новизна диссертационного исследования:
1. Разработан метод интеллектуального специализированного текстового поиска лексических паттернов участников социальных сетей, причастных к противоправным сферам, базирующийся на методах динамического программирования и машинного обучения на основе деревьев решений и отличающийся учетом грамматических и фонетических ошибок и фильтрационными правилами.
2. Предложен метод обработки результатов интеллектуального специализированного текстового поиска лексических паттернов для формирования альтернатив принятия решений в задаче мониторинга противоправной ситуации в РСЭС, базирующийся на математическом аппарате латентно-семантического анализа и отличающийся применением разработанных критериев оценки тематик для разграничения их семантики.
3. Разработан прототип программного обеспечения интеллектуального специализированного текстового поиска и обработки информации социальных сетей, отличающийся использованием разработанных методов, для механизмов принятия решений в задаче мониторинга противоправной ситуации в РСЭС.
Практическая значимость результатов диссертационного исследования заключается в том, что разработанные теоретические положения:
1. Реализованы в виде зарегистрированных программы для ЭВМ «Программное средство нечеткого текстового русскоязычного поиска в виртуальных социальных сетях» (свидетельство о государственной регистрации № 2018613671) и базы данных «Жаргон в сфере незаконного оборота наркотических средств и психотропных веществ» (свидетельство о государственной регистрации № 2016620197).
2. Результаты работы использовались в ходе работ по гранту РФФИ № 18 -29-03049 мк «Прогнозирование пространственного развития экономики России на основе агентного моделирования, методов искусственного интеллекта и анализа больших данных».
Положения, выносимые на защиту:
1. Предложенный метод интеллектуального специализированного текстового поиска лексических паттернов участников социальных сетей, причастных к противоправным сферам, позволяет идентифицировать лексические паттерны с учетом возможных ошибок в текстах.
2. Предложенный метод обработки результатов интеллектуального специализированного текстового поиска лексических паттернов позволяет отделить общеупотребительную лексику от жаргона в текстовых сообщениях и обеспечивает поддержку принятия решений по публикуемому контенту и лицу, его опубликовавшему.
3. Разработанный прототип программного обеспечения интеллектуального специализированного текстового поиска и обработки информации социальных сетей позволяет повысить эффективность специализированного текстового поиска и сформировать структуру социальной группы в рамках выбранной противоправной сферы мониторинга.
Апробация работы. Основные результаты диссертационного исследования докладывались и обсуждались на следующих конференциях:
1. XVI Международной научно-методической конференции «Информатика: проблемы, методологии, технологии» (2016 г., ВГУ, г. Воронеж).
2. VII Научно-практической конференции с международным участием «European integration: justice, freedom and security» (2016 г., Криминалистическо-полицейская Академия, г. Белград).
3. II Всероссийской научно-практической конференции «Искусственный интеллект в решении актуальных социальных и экономических проблем XXI века» (2016 г., Пермь, Пермский государственный национальный исследовательский университет).
4. III Международной конференции и молодежной школы «Информационные технологии и нанотехнологии» (ИТНТ-2017, Самарский университет, г. Самара).
5. XIV Международной научно-технической конференции «Новые информационные технологии и системы» (НИТиС-2017, Пензенский государственный университет, Пенза).
6. II Международной научной конференции «Конвергентные когнитивно-информационные технологии» (2017 г., МГУ, г. Москва).
Соответствие специальности. Работа соответствует следующим пунктам паспорта специальности 05.13.10: п. 6 - Разработка и совершенствование методов получения и обработки информации для задач управления социальными и экономическими системами; п. 7 - Разработка методов идентификации в организационных системах на основе ретроспективной, текущей и экспертной информации; п. 5 - Разработка специального математического и программного обеспечения систем управления и механизмов принятия решений в социальных и экономических системах.
Публикации. Материалы диссертационного исследования опубликованы в 14 работах, из них 4 статьи в рецензируемых журналах, входящих в перечень ВАК, 1 статья в издании, индексируемом в международной библиографической базе данных Scopus.
Структура и объем работы. Диссертационная работа изложена на 146 страницах, состоит из введения, четырех глав, заключения, списка литературы из 164 наименований; содержит 10 таблиц, 35 рисунков и 1 приложение.
1 Обзор и анализ подходов к текстовому поиску и обработке информации в задачах мониторинга социальных сетей
1.1 Роль мониторинга социальных сетей для ситуационных центров в задаче мониторинга противоправной ситуации в регионе
Ситуационные центры (СЦ) - организационно-технические комплексы, осуществляющие систематический мониторинг объектов и ситуаций наблюдения, аналитическую обработку получаемых данных и обеспечивающих поддержку принятия управленческих решений на разных уровнях государственного аппарата. СЦ представляет собой специальным образом спроектированное помещение, отвечающее требованиям безопасности, оснащенное комплексом телекоммуникационного оборудования и информационно-аналитическими инструментами [34, 84, 89, 91]. Под информационно-аналитическими инструментами понимается специализированное программное обеспечение, позволяющее осуществлять сбор, обработку данных об объекте мониторинга, их последующий анализ и визуализацию, прогнозирование развития ситуации, моделирование последствий управленческих решений. Подобные системы являются основой функционирования СЦ, они обеспечивают поддержку принятия решений, предоставляя ЛПР оценку состояния объекта мониторинга и формируя рекомендации для достижения поставленных управленческих задач.
Регион является примером сложной социально-экономической системы. Существует несколько подходов к определению региона, выделяющие его различные стороны. В целом можно сказать, что регион - единая территориальная социально-экономическая целостность, характеризующаяся совокупностью ресурсов и экономических субъектов, взаимосвязанных и взаимодействующих между собой в сфере производства, распределения, обмена и потребления товаров и услуг, а также обеспечивающая социальное воспроизводство и имеющая органы управления [6, 48, 92]. Социальное воспроизводство характеризуется уровнем образования и здравоохранения, удовлетворения духовных потребностей и др.
СЦ является инструментом для реализации ряда управленческих задач, представленных на рисунке 1.1. Совокупность данных задач управления по Новикову Д. А. [67, 68] представляет собой управленческий цикл социально-экономической системой (СЭС). Использование информационно-аналитической системы (ИАС) позволяет сократить цикл управления. Автоматизация мониторинга, анализа влияния управленческих решений на СЭС, выработка рекомендаций для осуществления оперативного управления - все это повышает эффективность управленческой деятельности ЛПР.
Рисунок 1.1 - Управленческий цикл
Объектами мониторинга для СЦ являются различные сферы:
- здравоохранение;
- образование;
- ЖКХ;
- занятость и безработица населения;
- формирование и исполнение бюджета;
- и др.
В целом можно выделить три предметные области государственного управления в рамках СЦ: общественно-политическая, социально-экономическая, комплексной безопасности [85].
Согласно Указу Президента РФ от 31.12.2015 N 683 «О Стратегии национальной безопасности Российской Федерации», в число основных угроз государственной и общественной безопасности входят [88]:
- деятельность террористических и экстремистских организаций, направленная на насильственное изменение конституционного строя Российской Федерации, дестабилизацию работы органов государственной власти, уничтожение или нарушение функционирования военных и промышленных объектов, объектов жизнеобеспечения населения, транспортной инфраструктуры, устрашение населения, в том числе путем завладения оружием массового уничтожения, радиоактивными, отравляющими, токсичными, химически и биологически опасными веществами, совершения актов ядерного терроризма, нарушения безопасности и устойчивости функционирования критической информационной инфраструктуры Российской Федерации;
- деятельность радикальных общественных объединений и группировок, использующих националистическую и религиозно-экстремистскую идеологию, иностранных и международных неправительственных организаций, финансовых и экономических структур, а также частных лиц, направленная на нарушение единства и территориальной целостности Российской Федерации, дестабилизацию внутриполитической и социальной ситуации в стране, включая инспирирование "цветных революций", разрушение традиционных российских духовно-нравственных ценностей;
- деятельность преступных организаций и группировок, в том числе транснациональных, связанная с незаконным оборотом наркотических средств и психотропных веществ, оружия, боеприпасов, взрывчатых веществ, организацией незаконной миграции и торговлей людьми;
- деятельность, связанная с использованием информационных и коммуникационных технологий для распространения и пропаганды идеологии фашизма, экстремизма, терроризма и сепаратизма, нанесения ущерба гражданскому миру, политической и социальной стабильности в обществе.
Также в Указе отмечено, что система распределенных ситуационных центров в числе прочих пунктов необходима для реализации Стратегии национальной безопасности России. Подчеркивается, что угрозы обостряются за счет использования информационных технологий. Повсеместное распространение Интернет в целом и социальных сетей в частности предоставляет широкие возможности для различного рода пропаганды и упрощает ведение противоправной деятельности
Согласно исследованиям аналитического агентства Brand Analytics [86], ежемесячно только в одной социальной сетия Вконтакте публикуются более полумиллиарда сообщений, например, за январь 2020 года было опубликовано 567 745 144 сообщений, а количество активных авторов - 31 871 538. На рисунке 1.2 и 1.3 представлено распределение активных авторов по возрасту с учетом того, что в количество авторов, указавших свой возраст в профиле, составляет 43,3% от общего количества авторов. Согласно исследованию [94] Россия находится на втором месте среди стран мира по участию населения в социальных сетях — 78% российских пользователей интернета присутствуют в какой-нибудь соцсети. Широкое распространение среди населения, частота использования позволяют рассматривать социальные сети как модель протекающих в обществе процессов, как отражение тенденций и реалий современного мира. Анализ социальных сетей позволяет оценить реакцию пользователей на происходящие события, выявить отношение к какому-либо явлению или событию. Пользователи (участники) социальных сетей могут свободно высказывать свое мнение,
обмениваться информацией, при этом скорость распространения информации может носит лавинообразный характер, что является как достоинством, например, в случае уведомлений о чрезвычайных ситуациях, так и источником угроз, как, например, в случаях с твиттер-революциями [155].
■ до 18 лет
■ 18-24 лет
■ 25-34 лет
■ 35-44 лет
■ 45-54 лет 55 и старше
■ 55-100
Рисунок 1.2 - Диаграмма распределения активных авторов по возрасту в социальной сети ВКонтакте январь 2020 (среди авторов, указавших свой возраст в
профиле)
Возраст Авторов %
до 18 лет 2 3ЭЭ058 17,39%
18-24 лет 3 066 269 22,22%
25-34 лет 4 34015Э 31,45%
35-44 лет 2 312 007 16,75%
45-54 лет 923 575 6,69%
55 и старше 0 0,00%
55-100 757 977 5,49%
Авторов с возрастом: 43,30%
Рисунок 1.3 - Распределение активных авторов по возрасту в социальноу сети ВКонтакте за январь 2020 (среди авторов, указавших свой возраст в профиле)
Социальные сети являются площадкой для осуществления коммуникаций в самых различных сферах - оборот наркотических средств и психотропных
веществ, пропаганда терроризма и экстремизма, пропаганда суицида среди детей и подростков.
Существенной угрозой является пропаганда употребления наркотических средств и психотропных веществ, а также их распространение. Мониторинг и закрытие сайтов пронаркотической направленности является менее сложной задачей, чем мониторинг социальных сетей. Свободный доступ к информации, возможность создания практического любого контента любым участником социальных сетей, высокая популярность самих сетей, сложность отслеживания среди миллионов сообщений и множества сообществ - все это является причинами перемещения деятельности наркодилеров в социальных сетях. По данным МВД наиболее востребованной в этом отношении стала сеть «ВКонтакте» [14]. В отношении страниц и групп данной сети в 2018 году МВД России принято 3 973 решения об ограничении к ним доступа на территории Российской Федерации. Несмотря на наличие административного и уголовного преследования за пропаганду в сфере оборота наркотических средств, психотропных веществ и их прекурсоров, а также их распространение, уровень угрозы не снижается. За 2017 год МВД проанализировало порядка 48 тысяч интернет-страниц, в результате чего было принято около 21 тысячи решений, являющихся основанием для их блокировки Роскомнадзором [74]. Однако преступники продолжают свою деятельность в социальных сетях. Во многом это обеспечивается за счет использования жаргона для обозначения названий наркотиков, способов их приготовления и прочих элементов из области наркотических средств и психотропных веществ. Регулярно появляются новые химические соединения с новыми названиями. Кроме того, само множество жаргонизмов может динамично меняться в целях конспирации. Все это существенно усложняет обнаружение фактов пропаганды и распространения наркотиков в социальных сетях.
Социальные сети являются удобной площадкой для экстремистских и террористических организаций для вербовки новых агентов [22, 37, 40, 42]. Информация об участниках социальных сетей находится в свободном доступе,
пользователи сами публикуют информацию о себе - свое вероисповедание, политические взгляды, а также фотографии, сведения о родных. Злоумышленники создают грамотный контент, позволяющий увлечь пользователей. Так же, как и в случае со сферой наркотизации, пропаганда экстремизма и терроризма перемещается в социальные сети [49].
Особым явлением, всколыхнувшем общественность, является пропаганда и организация суицида детей и подростков [44]. На первый взгляд «группы смерти» выглядят довольно безобидно, а подстрекательство к суициду оформлено в виде игры-квесты с заданиями различной сложности, выполняя которые, участники выходят на новые уровни. Самоповреждения в виде порезов, нахождение на объектах повышенной опасности (крыши, мосты) являются примерами заданий. Финал игры заканчивается заданием совершить самоубийство. Контент данных групп характеризуется использованием своего сленга и символики [13].
Задача мониторинга противоправной ситуации в регионе является одной из приоритетных задач в рамках обеспечения безопасности РСЭС. При этом социальные сети должны являться важным источником информации. Рассмотрим задачу мониторинга наркоситуации подробнее.
Согласно Карпец А. В. [39] мониторинг наркоситуации - регулярное отслеживание ключевых элементов (индикаторов) положения дел с наркотиками посредством регистрации данных из разных источников с последующим использованием полученной информации в целях противодействия наркотизму и незаконному обороту наркотиков. Данная информация включается в себя информационно-аналитические документы, статистическую информацию, данные научных и социаологически исследований, экспертные оценки по вопросам, касающимся оборота наркотиков, профилактики немедицинского потребления наркотиков. Таким образом, в процессе мониторинга осуществляется непрерывное получение и анализ информации, относящейся к обороту наркотических средств и психотропных веществ. При этом предполагается своевременная фиксация событий, имеющих отношение к данной сфере. На основе информации, полученной в процессе мониторинга, осуществляется
принятие оперативных управленческих решений, а также дальнейшая оценка наркоситуации в регионе. Управленческие решения заключаются блокировании незаконного контента, проведению профилактических мероприятий антинаркотической направленности среди населения, применению мер пресечения деятельности лиц, осуществляющих пропаганду наркотиков и др.
Оценка наркоситуации осуществляется по результатам мониторинга и представляется в виде информационно-аналитической справки, в которой в том числе указываются следующие сведения [58]:
Похожие диссертационные работы по специальности «Управление в социальных и экономических системах», 05.13.10 шифр ВАК
Систематизация, разработка методов и коллективов решающих правил классификации библиографических текстовых документов2009 год, доктор технических наук Толчеев, Владимир Олегович
Метод и алгоритмы интеллектуальной обработки информации в корпоративных хранилищах2012 год, кандидат технических наук Летовальцев, Виктор Иванович
Трансформация наркопотребления в России XXI века2023 год, кандидат наук Ларина Елена Викторовна
Метод классификации библиографической информации на основе комбинированных профилей классов с учетом структуры документов2017 год, кандидат наук Мохов, Андрей Сергеевич
Образ человека в английской и русской субстандартной лингвокультурах: на материале зоонимов английского и русского языков2012 год, кандидат наук Метельская, Елена Владимировна
Список литературы диссертационного исследования кандидат наук Давыдова Юлия Витальевна, 2021 год
Список литературы
1. Аверченков, В. И. Мониторинг и системный анализ информации в сети Интернет: монография / В. И. Аверченков, С. М. Рощин. - М.: Флинта, 2011. - 160 с.
2. Анисимов, О. С. Компоненты информационных технологий для ситуационных центров / О. С. Анисимов, А. А. Берс, О. А. Жирков и др.; под науч. ред. В. А. Филимонова. - Омск: ООО «Информационно-технологический центр», 2010. - 152 с.
3. Апресян, Ю. Д. Лингвистический процессор для сложных информационных систем / Ю. Д. Апресян, И. М. Богуславский, Л. Л. Иомдин. -М.: Наука, 1992. - 256 с.
4. Ашманов, И. С. Архитектура и технология промышленной реализации прикладных лингвистических систем (проверка правописания и электронные словари): автореф. дис. ... канд. техн. наук: 05.13.11 / Ашманов Игорь Станиславович. - Переславль-Залесский, 1995. - 22с.
5. Базенков, Н. И., Губанов, Д. А. Обзор информационных систем анализа социальных сетей / Н. И. Базенков, Д. А. Губанов // Управление большими системами. - 2013. - Вып. 41. - С. 357-394.
6. Баранов, В. А. Социальное воспроизводство и факторы его обеспечивающие / В. А. Баранов // Таврический научный обозреватель. - 2016. -№ 4(9). - С. 144-148.
7. Батурина, Т. В. Методы повышения эффективности поиска информации на основе синтаксического анализа: монография / Т. В. Батурина, Ф. А. Мурзин, А. А. Перфильев, Т. В. Шманина. - Новосибирск: Издательство СО РАН, 2014. -76 с.
8. Большакова, Е. И. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика: учебное пособие / Е. И. Большакова, Э. С. Клышинский, Д. В. Ланд, А. А. Носков, О. В. Пескова, Е. В. Ягунова. - М.: МИЭМ, 2011. - 272 с.
9. Босов, А. В. Некоторые общие подходы к формированию функциональных требований к ситуационным центрам и их реализации / А. В. Босов, А. А. Зацаринный, А. П. Сучко // Системы и средства информатики. - 2010.
- Т. 20, № 3. - С. 98-125.
10. Брябрина, Т. В. Опыт контент-анализа суицидальных высказываний в сети Интернет лиц с различным уровнем суицидальной активности / Т. В. Брябрина, А. И. Гиберт, А. В. Штрахова // Вестник Южно-Уральского государственного университета. Серия: Психология. - 2016. - Т. 9, № 3. - С. 3549.
11. Буч, Г. Язык ЦМЬ. Введение в ЦМЬ от создателей языка / Г. Буч, Д. Рамбо, И. Якобсон. - М.: ДМК Пресс, 2015. - 496 с.
12. Будыльский, Д. В. Автоматизация мониторинга общественного мнения на основе интеллектуального анализа сообщений в социальных сетях: автореф. дис. ... канд. техн. наук: 05.13.10 / Будыльский Дмитрий Викторович. - Брянск, 2015. - 20 с.
13. Бычкова, А. М. Доведение до самоубийства посредством использования интернет-технологий: социально-психологические, криминалогические и уголовно-правовые аспекты / А. М. Бычкова, Э. Л. Раднаева // Всероссийский криминалогический журнал. - 2018. - Т. 12, № 1. - С. 101-115.
14. В МВД назвали самую востребованную соцсеть для пропаганды наркотиков [Электронный ресурс]. - Режим доступа: https://iz.ru/709403/2018-02-15/v-mvd-nazvali-samuiu-vostrebovannuiu-sotcset-dlia-propagandy-narkotikov.
15. Валгина, Н. С. Активные процессы в современном русском языке: учебное пособие для студентов ВУЗов / Н.С. Валгина. - М.: Логос, 2003. - 304 с.
16. Вахмянин, И. С. Разработка модели управления информационными потоками в ситуационных центрах органов государственной власти / И. С. Вахмянин, Н. И. Ильин, Е. В. Новикова // Бизнес-информатика. - 2011. - № 1 (15).
- С. 3-10.
17. Видясова, Л. А., Жук, Д. В. Семантическая обработка и интеллектуальный поиск неструктурированных или слабо структурированных
данных / Л. А. Видясова, Д. В. Жук // XXI век: итоги прошлого и проблемы настоящего плюс. - 2016. - № 3 (31). - С. 23-27.
18. Воронцов, К. В. Вероятностное тематическое моделирование [Электронный ресурс] / К. В. Воронцов. Режим доступа: http: //www.machinelearning.ru/wiki/images/2/22/Voron-2013 -ptm.pdf.
19. Галушин, П. В. Автоматизация аналитической работы органов наркоконтроля с информацией, размещенной в социальных сетях / П. В. Галушин, И. А. Смирнов // Вестник Сибирского юридического института МВД России. -2014. - № 3 (16). - С. 117-121.
20. Гасфилд, Д. Строки, деревья и последовательности в алгоритмах: Информатика и вычислительная биология / Д. Гасфилд. - Спб.: Невский Диалект; БХВ-Петербург, 2003. — 654 с.
21. Генеральный интернет-корпус русского языка [Электронный ресурс]. -Режим доступа: http://www.webcorpora.ru/
22. Гладышев, В. Социальные сети как инструмент пропаганды экстремизма [Электронный ресурс]. - Режим доступа: http://nac.gov.ru/publikacii/stati-knigi-broshyury/gladyshev-v-socialnye-seti-kak-instrument-dlya.html
23. Голубева, С. А. Программное обеспечение для своевременного выявления негативного информационно-психологического воздействия, осуществляемого в социальных сетях / С. А. Голубева, П. А. Хмарский // Вестник Университета гражданской защиты МЧС Белоруси. - 2017. - Т. 1, № 2. - С. 232237.
24. Губанов, Д. А. Социальные сети: модели информационного влияния, управления, противоборства / Д. А. Губанов, Д. А. Новиков, А. Г. Чхартишвили; под ред. Д. А. Новикова. - М.: Издательство физико-математической литературы, 2010. - 228 с.
25. Давидюк, Н. В. Интеллектуальный алгоритм идентификации деструктивной информации в тексте / Н. В. Давидюк, В. А. Гостюнина, Д. Р. Байдулова // Вестник Астраханского государственного технического
университета. Серия: Управление, вычислительная техника и информатика. -2019. - № 2. - С. 29-39.
26. Давыдова, Ю. В. Алгоритм нечеткого текстового поиска в виртуальных социальных сетях [Электронный ресурс] / Ю. В. Давыдова // International Journal of Open Information Technologies. - 2018. - Vol. 6, No. 5. - С. 21-27. - Режим доступа: http://www.inj0it.0rg/index.php/j 1/article/view/561/549.
27. Давыдова, Ю. В. К вопросу о необходимости автоматизации поиска угроз в виртуальных социальных сетях и сообществах / Ю. В. Давыдова // Актуальные проблемы современной науки в 21 веке: сборник материалов VI Международной научно-практической конференции. - Махачкала: ООО «Апробация», 2014. - С. 25-26.
28. Давыдова, Ю. В. Модель ошибок для нечеткого текстового поиска в задаче мониторинга виртуальных социальных сетей для обеспечения информационно-психологической безопасности личности / Ю. В. Давыдова // Современные информационные технологии и ИТ-образование. - 2017. - Т. 13, № 3. - С. 72-82.
29. Давыдова, Ю. В. Определение тематической релевантности сообщений в задаче мониторинга виртуальных социальных сетей для обеспечения информационно-психологической безопасности личности [Электронный ресурс] / Ю. В. Давыдова // International Journal of Open Information Technologies. - 2019. -Vol. 7, No. 4. - С. 11-18. - Режим доступа: http : //www. inj oit.org/index.php/j 1/article/view/699/690.
30. Давыдова, Ю. В. Особенности информационного наполнения пользователем лингвистической базы данных жаргона, используемого в сфере незаконного оборота наркотических средств и психотропных веществ / Ю. В. Давыдова, Ю. Б. Савва // Актуальные направления научных исследований XXI века: теория и практика. - 2015. - Т. 3, № 7-4 (18-4). - С. 56-60.
31. Давыдова, Ю. В. Проблема обработки ошибок в текстах сообщений пользователей в задаче мониторинга виртуальных социальных сетей / Ю. В. Давыдова // Новые информационные технологии и системы: материалы XIV
Международной научно-технической конференции. - Пенза: Пензенский государственный университет, 2017. - С. 342-345.
32. Жерон, О. Прикладное машинное обучение с помощью Scikit-Leam и TensorFlow: концепции, инструменты и техники для создания интеллектуальных систем / О. Жерон. - Спб.: ООО «Диалектика», 2018. - 688 с.
33. Земская, Е. А. Русская разговорная речь. Общие вопросы. Словообразование. Синтаксис / Е. А. Земская, М. В. Китайгородская, Е. Н. Ширяев. - М.: Наука, 1981. - 276 с.
34. Ивашкевич В. Ситуационные центры: применение в государственном управлении на региональном и федеральном уровнях [Электронный ресурс]. -Режим доступа: http://www.prognoz.ru/sites/default/files/vera_ivashkevich_situacionnye_centry_1.pdf
35. Ингерсолл, Г. С. Обработка неструктурированных текстов. Поиск, организация, манипулирование / Г. С. Ингерсолл, Т. С. Мортон, Э. Л. Фэррис. -М.: ДМК Пресс, 2015. - 414 с.
36. Иомдин, Б. Л. Словарь бытовой терминологии: новые проблемы и новые методы / Б. Л. Иомдин, А. А. Лопухина, А. Ч. Пиперски и др. // Компьютерная лингвистика и интеллектуальные технологии: материалы ежегодной Международной конференции «Диалог», 2012. - С. 213-227.
37. Как действуют экстремисты и террористы в социальных сетях http://www.stapravda.ru/20171128/kak_deystvuyut_ekstremisty_i_terroristy_v_sotsialn yh_setyah_115030.html
38. Карпенко, М. П. Некоторые методы очистки словаря запросов поиска / М.П. Карпенко, С.В. Протасов // Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегодной Международной конференции «Диалог» (Бекасово, 25-29 мая 2011 г.). Вып. 10 (17). - М.: Изд-во РГГУ, 2011. - С. 280-291.
39. Карпец, А. В. Мониторинг и оценка наркоситуации: монография / А. В. Карпов, И. Е. Махров, Э. М. Виноградов. - М.: ЗАО Юстицинформ, 2010. - 224 с.
40. Кобец, П. Н. Выявление и мониторинг социальных сетей, используемых экстремистскими группировками, - важнейшая основа противодействия их
преступной деятельности / П. Н. Кобец // Вестник ВИПК МВД России. - 2017. -№ 2 (42). - С. 13-19.
41. Козлов, А. С. Интеллектуальные технологии анализа общественно-политической обстановки в ситуационном центре Челябинской области / А. С. Козлов, А. В. Мельников, А. В. Рубцов // Intelligent Technologies for information processing and management (ITIPM'2015): proceedings of the 3rd International Conference, 2015. - С. 74-78.
42. Котлярова В. В. Молодежный экстремизм в социальных сетях: специфика и теоретическое осмысление / В. В. Котлярова, М. М. Шубина, О. Н. Сысоева // ALMA MATER (Вестник высшей школы). - 2016. - № 5. - С. 95-99.
43. Коэльо Л. П. Построение систем машинного обучения на языке Python / Л. П. Коэльо, В. Ричарт. - М.: ДМК Пресс, 2016. - 312 с.
44. Кто стоит за детскими суицидами и «группами смерти» во «ВКонтакте» [Электронный ресурс]. - Режим доступа: https://lenta.ru/articles/2016/05/17/suicidetrue.
45. Коршунов, А. Анализ социальных сетей: методы и приложения / А. Коршунов, И. Белобородов, Н. Бузун, В. Аванесов и др. // Труды Института системного программирования РАН. - 2014. - Т. 26, № 1. - С. 439-456.
46. Коршунов, А. Тематическое моделирование текстов на естественном языке / А. Коршунов, А. Гомзин // Труды института системного программирования РАН. - 2012. - Т. 23. - С. 215-244.
47. Ландэ, Д. В. Интернетика: навигация в сложных сетях: модели и алгоритмы / Д. В. Ландэ, А. А. Снарский, И. В. Безсуднов. - М.: Книжный дом «ЛИБРИКОМ», 2009. - 264 с.
48. Лапаева, М. Г. Регион как пространственная социально-экономическая система государства / М. Г. Лапаева, С. П. Лапаев // Вестник ОГУ. - 2012. - № 8 (144). - С. 133-143.
49. Лапунова, Ю. А. Распространение идеологии экстремизма и терроризма в киберпространстве: проблемы и пути их решения / Ю. А. Лапунова, Н. П.
Голяндин // Труды академии управления МВД России. - 2017. - № 3 (43). - С. 100-104.
50. Лашин, Р. Л. Противодействие экстремизму и терроризму в сети Интернет и образовательной среде / Р. Л. Лашин, С. А. Чурилов // Обзор НЦПТИ. - 2015. - № 7. - С. 34-39.
51. Лесковец, Ю. Анализ больших наборов данных / Ю. Лесковец, А. Раджараман, Дж. Удьман. - М.: ДМК Пресс, 2016. - 498 с.
52. Литневская, Е. И. Письменные формы русской разговорной речи (К постановке проблемы): монография / Е. И. Литневская. - М.: Макс Пресс, 2011. -304 с.
53. Лукашевич, Н. В. Тезаурусы в задачах информационного поиска / Н. В. Лукашевич. - М.: Издательство Московского университета, 2011. - 512 с.
54. Малахаева, С. К Агрессивность и аутоагрессивность в сетевом тексте: контент-анализ страниц социальной сети «Вконтакте» / С. К. Малахаева, Р. С. Потапов // Вопросы теории и практики журналистики. - 2018. - Т. 7, № 4. - С. 724-740.
55. Медиалогия - мониторинг соцсетей [Электронный ресурс]. - Режим доступа: https://www.mlg.ru/products/smm/.
56. Мейта, М. В. Разработка системы мониторинга настроения людей в социальных сетях / М. В. Мейта, В. В. Шиповский, А. С. Романов // Электронные средства и системы управления. - 2015. - № 1-2. - С. 176-180.
57. Мельчук, И. А. Опыт теории лингвистических моделей «СМЫСЛ—ТЕКСТ» / И. А. Мельчук. - М.: Школа «Языки русской культуры», 1999. - 346 с.
58. Методика и порядок осуществления мониторинга, а также критерии оценки развития наркоситуации в Российской Федерации и ее субъектах [Электронный ресурс]. - Режим доступа: https://мвд.рф/upload/site 15/vzaimodestvie_so_vlastyu_i_msu_2017/Metodika_narkosi tuatsii.pdf
59. Молоков В. В. Оперативно-техническое противодействие распространению идей экстремизма и терроризма в социальных сетях / В. В. Молоков // Современные системы безопасности - антитеррор: материалы конгрессной части XIII Всероссийского специализированного форума, 2017. - С. 209-213.
60. Мордовин, А. Ю. «Веб как корпус» или «корпус как веб»: новая реальность корпусной лингвистики / А.Ю. Мордовин // Вестник Московского государственного лингвистического университета. - 2015. - №3 (714). - С. 163172.
61. Морфологический анализатор pymorphy2 [Электронный ресурс]. -Режим доступа: https://pymorphy2.readthedocs.io/en/latest/
62. Национальный корпус русского языка [Электронный ресурс]. - Режим доступа: https://ruscorpora.ru/new/.
63. Нейронные языковые модели в дистрибутивной семантике [Электронный ресурс]. - Режим доступа: https://ling.hse.ru/embeddings.
64. Нелюбин, К. А. Анализ социальных сетей как один из основных алгоритмов раскрытия убийств / К. А. Нелюбин // Актуальные проблемы российского права. - 2015. - № 8 (57). - С. 173-180.
65. Николаев, И. С. Прикладная и компьютерная лингвистика: монография / Т. М. Ландо, И. С. Николаев, О. В. Митренина, Т. М. Ландо. - М.: ЛЕНАНД, 2016. - 320 с.
66. Николенко, С. Глубокое обучение / С. Николенко, А. Кадурин, Е. Архангельская. - Спб.: Питер, 2018. - 480 с.
67. Новиков, Д. А. Структура теории социально-экономическими системами / Д. А. Новиков // Управление большими системами: сборник трудов. - 2009. -№24. - С. 216-258.
68. Новиков, Д. А. Теория управления организационными системами / Д. А. Новиков. - М.: - МПСИ, 2005. - 584 с.
69. Панина, М. Ф. Автоматическое исправление опечаток в поисковых запросах без учета контекста / М. Ф. Панина, А. В. Байтин, И.Е. Галинская //
Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегодной Международной конференции «Диалог» (Бекасово, 29 мая — 2 июня 2013 г.). Вып. 12 (19): В 2 т. Т. 1: Основная программа конференции. — М.: Изд-во РГГУ, 2013. - С. 568-579.
70. Петров, А. И. Анализ контента социальной сети на примере квестовой игры суицидального характера, направленной на детей и подростков / А. И. Петров, О. С. Смирнова, Б. Б. Чумак // International Journal of Open Information Technologies. - 2017. - Vol. 5, No. 6. - С. 16-19.
71. Плас, Дж. В. Python для сложных задач: наука о данных и машинное обучение / Дж. В. Плас. - Спб.: Питер, 2018. - 576 с.
72. Попова, З. Д. Семантико-когнитивный анализ языка: монография / З. Д. Попова, И. А. Стернин. - Воронеж: Изд-во «Истоки», 2007. - 250 с.
73. Пьянков, О. В. Оптимизация процессов принятия решений в ситуационных центрах органов внутренних дел / О. В. Пьянков, М. С. Романов // Вестник Воронежского института МВД России. - 2014. - №1. - С. 120-129.
74. Редичкина К. Реклама наркотиков в соцсетях больше не «всплывет» [Электронный ресурс] // Парламентская газета. - Режим доступа: https://www.pnp.ru/social/reklama-narkotikov-v-socsetyakh-bolshe-ne-vsplyvyot.html
75. Рыцарев, И. А. Кластеризация медиа-контента из социальных сетей с использованием технологий Bigdata / И. А. Рыцарев, Д. В. Кирш, А. В. Куприянов // Компьютерная оптика. - 2018. - Т. 42, № 5. - С. 921-927.
76. Рязанова, Н. Ю. Сравнительный анализ методов определения эмоциональной окраски сообщений в социальных сетях с применением обучения с учителем / Н. Ю. Рязанова, К. М. Сперцян // Новые информационные технологии в автоматизированных системах. - 2018. - № 21. - С. 417-423.
77. Савва, Ю. Б. Модель хранения данных в лингвистической базе данных жаргонизмов, используемых в сфере незаконного оборота наркотических средств и психотропных веществ / Ю. Б. Савва, Ю. В. Давыдова // Искусственный интеллект в решении актуальных социальных и экономических проблем XXI века: материалы Всероссийской научно-практической конференции. - Пермь:
Пермский государственный национальный исследовательский университет, 2016. - С. 138-142.
78. Савва, Ю. Б. Мониторинг и анализ сообщений участников виртуальных социальных сетей как средство обеспечения информационно-психологической безопасности личности / Ю. Б. Савва, Ю. В. Давыдова, В. Т. Еременко // Информационная безопасность и защита персональных данных. Проблемы и пути их реешния: материалы VIII Всероссийской научно-практической конференции. -Брянск: Издательство БГТУ, 2016. - С. 129-135.
79. Савва, Ю. Б. О проблеме лингвистического анализа сленга в задаче автоматизированного поиска угроз распространения наркомании в виртуальных социальных сетях // Ю. Б. Савва, В. Т. Еременко, Ю. В. Давыдова // Информационные системы и технологии. - 2015. - № 6 (92). - С. 68-75.
80. Савва, Ю. Б. Применение объектно-ориентированного подхода к проектированию информационной системы идентификации лиц, причастных к сфере незаконного оборота наркотических средств и психотропных веществ в виртуальных социальных сетях, с использованием базы данных жаргонизмов // Ю. Б. Савва, Ю. В. Давыдова // Объектные системы. - 2015. - № 11. - С. 43-50.
81. Савва, Ю. Б. Проектирование базы данных жаргона в сфере незаконного оборота наркотических средств и психотропных веществ / Ю. Б. Савва, Ю. В. Давыдова // Информатика: проблемы, методология, технологии: материалы XVI международной научно-методической конференции. - Воронеж: Научно-исследовательские публикации, 2016. - С. 470-475.
82. Савва, Ю. Б. Проектирование информационной системы идентификации лиц, причастных к сфере незаконного оборота наркотических средств и психотропных веществ в виртуальных социальных сетях, с использованием базы данных жаргонизмов // Ю. Б. Савва, Ю. В. Давыдова // Информационные системы и технологии. - 2016. - № 1 (93). - С. 34-42.
83. Савченко, В. Алгоритм семантического поиска в больших текстовых коллекциях / В. Савченко // Supplementary proceedings of the 3rd International
conference on analysis of images, social networks and texts (AIST). - 2014. - Режим доступа: http://ceur-ws.org/Vol-1197/paper24.pdf.
84. Ситуационные центры (определение, основные задачи) [Электронный ресурс]. - Режим доступа: https: //www.tadviser.ru/index.php/Статья: Ситуационные_центры_(определение,_ос новные_задачи).
85. Система распределенных ситуационных центров как платформа для стратегического планирования // Connect. - 2015. - № 11. - С. 38-55.
86. Статистика социальных сетей [Электронный ресурс]. - Режим доступа: https://br-analytics.ru/statistics/author/.
87. Тоноян, С. А. Применение инструментов контекстного анализа для исследования психологических направленностей сообществ в социальных сетях [Электронный ресурс] / С. А. Тоноян, А. В. Балдин, А. А. Касикин, Г. И. Афанасьев // Научно-практический электронный журнал Аллея Науки. - 2018. -№ 5 (21). - Режим доступа: https://alley-science.ru/domains_data/files/4544MAY2018/PRIMENENIE%20INSTRUMENT0V% 20K0NTEKSTN0G0%20ANALIZA%20DLYa%20ISSLED0VANIYa%20PSIH0L 0GIChESKIH%20NAPRAVLENN0STEY%20S00BShESTV%20V%20S0CIALNY H%20SETYaH.pdf.
88. Указ Президента РФ от 31.12.2015 № 683 «О Стратегии национальной безопасности Российской Федерации».
89. Филлипович, А. Ситуационные центры: определения, структура и классификация [Электронный ресурс]. - Режим доступа: http://it-claim.ru/Library/Articles/publications_Philippovich_Andrew/sit_centres/sit_centres.ht m.
90. Флах, П. Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных / П. Флах - М.: ДМК Пресс, 2015. - 400 с.
91. Холостов, К. М. Ситуационные центры как инструмент повышения эффективности управления / К. М. Холостов // Труды Академии управления МВД России. - 2013. - №1 (25). - С. 22-25.
92. Чапаргина, А. Н. Регион как социально-экономическая система. Основы функционирования и развития / А. Н. Чапаргина // Развитие территориальных социально-экономических систем: вопросы теории и практики: материалы XIV Международной научно-практической конференции молодых учёных, 2016. - С. 70-73.
93. Шаврина, Т. О. Моделирование расширенной лемматизации для русского языка на основе морфологического парсера TNT-RUSSIAN [Электронный ресурс] / Т. О. Шаврина, А. А. Сорокин // Материалы ежегодной Международной конференции «Диалог». - 2015. - Режим доступа: http://www.dialog-21.ru /digests/dialog2015/materials/pdf/ShavrinaTOSorokinAA.pdf.
94. Шмырова, В. Больше россиян в соцсетях сидят только японцы [Электронный ресурс]. - Режим доступа: http://www.cnews.ru/news/top/2019-02-07_issledovanie_bolshe_rossiyan_v_sotssetyah_sidyat.
95. Aduriz, I. Spelling corrector for Basque based on morphology / I. Aduriz, M. Urkia, I. Alegria, X. Artola, N. Ezeiza, K. Sarasola // Literary and Linguistic Computing. - 1997. - Vol. 12, No. 1. - pp. 31-38.
96. Ahmed, F. Revised N-Gram based automatic spelling correction tool to improve retrieval effectiveness / F. Ahmed, E.W. De Luca, A. Nurnbenger // Polibits. -2009. - Vol. 40. - pp. 39-48.
97. Aliwy, A. H. Word sense disambiguation: survey study / A. H. Aliwy, A. T. Hawraa // Journal of Computer Science. - 2019. - Vol. 15, Issue 7. - pp. 1004-1011.
98. Arefyev, N. How much does a word weight? Weighting word embedding for word sense induction / N. Arefyev, P. Ermolaev, A. Panchenko // Компьютерная лингвистика и интеллектуальные технологии: материалы ежегодной Международной конференции «Диалог», 2018. - С. 68-84.
99. Azarova, I. RussNet: Building a Lexical Database for the Russian Language / I. Azarova, O. Mitrofanova, A. Sinopalnikova, M. Yavorskay, I. Oparin // Proceedings
of the Workshop on Wordnet Structures and Standardisation and How this affect Wordnet Applications and Evaluation, 2002. - pp. 60-64.
100. Babkee - система мониторинга и анализа социальных медиа и СМИ [Электронный ресурс]. - Режим доступа: http://www.babkee.ru/
101. Bassil, Y. Context-sensitive spelling correction using Google Web 1T 5-Gram information // Y. Bassil, M. Alwani // Computer and Information Science. -2012. - Vol. 5, No. 3 - pp. 37-48.
102. Benko, V. Very large Russian corpora: new opportunities and new challenges / V. Benko, V.P. Zakharov // Computational Linguistics and Intellectual technologies: Proceedings of the International Conference "Dialogue 2016", 2016. -pp. 83-98.
103. Boleda, G. Distributional semantics and linguistic theory / G. Boleda // Annual Review of Linguistics. - 2020. - Vol 6. - pp. 213-234.
104. Brand Analytics - система мониторинга и анализа социальных медиа и СМИ [Электронный ресурс]. - Режим доступа: https://br-analytics.ru/.
105. Braslavski, P. YARN: Spining-in-Progress / D. Ustalov, M. Mukhin, Y. Kiselev // Proceedings of the Eight Global Wordnet Conference, 2016. - pp. 58-65.
106. Brill, E. An improved error model for noisy channel spelling correction / E. Brill, R. C. Moore // Proceedings of the 38th Annual Meeting on the Association for Computational Linguistics. - 2000. - pp. 286-293.
107. Carlson, A. Memory-based context-sensitive spelling correction at Web scale / A. Carlson, I. Fette // ICMLA '07 Proceedings of the Sixth International Conference on Machine Learning and Applications. - 2007. - pp. 166-171.
108. Cohen, K. Detecting linguistic markers for radical violence in social media / K. Cohen, F. Johansson, L. Kaati, J. C. Mork // Terrorism and political violence. -2014. - Vol. 26, Issue 1. - pp. 246-256.
109. Daitch-Mokotoff Soundex [Electronic resource]. - Access mode: http: //www.avotaynu.com/soundex.htm.
110. Damerau, F. J. A technique for computer detection and correction of spelling errors // Communications of the ACM. - 1964. - Vol. 7, No. 3. - pp.171-176.
111. Deerwester, S. C. Indexing by latent semantic analysis / S. C. Deerwester, S. T. Dumais, T. K. Landauer, G. W. Furnas, R. A. Harshman // Journal of the American Society for Information Science. - 1990. - No. 41. - pp. 391-407.
112. Donchenko, D. Analysis of comments of users of social networks to access the level of social tension / D. Donchenko, N. Ovchar, N. Sadovnikova et all // Procedia Computer Science. - 2017. - Vol. 119. - pp. 359-367.
113. Farooq, A. Learning a spelling error model from search query logs / A. Farooq, K. Grzegorz // Proceedings of Human Language Technology Conference and Conference on Emperical Methods in Natural Language Processing. - 2005. - pp. 955962.
114. GitHub: the top 10 programming languages for machine learning [Electronic resource]. - Access mode: https://www.techrepublic.com/article/github-the-top-10-programming-languages-for-machine-learning/
115. Graham, A. S. String searching algorithms / A. S. Graham. - World Scientific Publishing Co Pte Ltd, 1994. - 256 p.
116. Holub, J. The finite automata approaches in stringology / J. Holub // Kibernetika. - 2012. - Vol. 48, No. 3. - pp. 386-401.
117. Huang, L. GlossBERT: BERT for word sense disambiguation with gloss knowledge / L. Huang, C. Sun, X. Qiu, X. Huang // Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing, 2019. - pp. 3509-3514.
118. IqBuzz - система мониторинга социальных медиа и СМИ [Электронный ресурс]. - Режим доступа: https://www.iqbuzz.pro/.
119. Jurafsky D. Speech and language processing / D. Jurafsky, J. H. Martin. -Pearson Prentice Hall, 2009. - 988 p.
120. Kalpakis, G. Analysis of suspended terrorism-related content on social media / G. Kalpakis, T. Tsikrika et al. // Community-Oriented Policing and Technological Innovations. SpringerBriefs in Criminology. - Springer, 2018. - pp. 107118.
121. Kernighan, M. D. A spelling correction program based on a noisy channel model / M. D. Rernighan, K. W. Church, W. A. Gale // Proceedings of COLING. -1990. - pp. 205-210
122. Kilgarriff, A. Introduction to the Special Issue on Web as corpus / A. Kilgarriff, G. Grefenstette // Computational linguistics. - 2003. - Vol. 29, No. 3. - pp. 333-348.
123. Konovalov, V. P. Learning word embeddings for low resource languages: the case of Buryat / V. P. Konovalov, Z. B. Tumunbayarova // Компьютерная лингвистика и интеллектуальные технологии: материалы ежегодной Международной конференции «Диалог», 2018. - С. 331-341.
124. Kukich, K. Techniques for automatically correcting words in text / K. Kukich // ACM Computing Surveys. - 1992. - Vol. 24, No. 4. - pp. 377-439.
125. Lawrence Phillips' Metaphone Algorithm [Electronic resource]. - Access mode : http : //aspell. net/metaphone/.
126. Leacock, C. Using corpus statistics and WordNet relations for sence identification / C. Leacock, M. Chodorow, G. A. Miller // Computational Lingiustics. -1998. - Vol. 214, No. 1. - pp. 147-165.
127. Lesk, M. Automatic sense disambiguation using machine readable dictionaries: how to tell a pine cone from an ice cream cone / M. Lesk // SIGDOC '86: Proceedings of the 5th annual international conference on Systems documentation. — New York, NY, USA: ACM Press, 1986. — pp. 24-26.
128. Levenshtein, V. Binary codes capable of correcting deletions, insertions and reversals / V. Levenshtein // Soviet physics doklady. - 1966. - Vol. 10, No. 8. - pp. 707-710.
129. Logacheva, V. Word sense disambiguation for 158 languages using word embeddings only / V. Logacheva // Proceedings 12th Conference on Language Resources and Evaluation, LREC 2020, 2020. - https://arxiv.org/pdf/2003.06651.pdf.
130. Lopukhin, K. A. Word sense induction for Russian: deep study and comparison with dictionaries / K. A. Lopukhin, B. L. Iomdin, A. A. Lopukhina //
Компьютерная лингвистика и интеллектуальные технологии: материалы ежегодной Международной конференции «Диалог», 2017. - С. 121-134.
131. Lopukhin, K. A. Word sense disambiguation for Russian verbs using semantic vectors and dictionary entries / K. A. Lopukhin, A. A. Lopukhina // Компьютерная лингвистика и интеллектуальные технологии: материалы ежегодной Международной конференции «Диалог», 2016. - С. 393-405.
132. Manning, Ch. D. Foundations of statistical natural language processing / Ch. D. Manning, H. Schutze. - The MIT Press, 2000. - 680 p.
133. Manning, Ch. D. Introduction to information retrieval / Ch. D. Manning, P. Raghavan, H. Schutze. - Cambridge University Press, 2008. - 496 p.
134. Mays, E. Context based spelling correction / E. Mays, F. J. Damerau, R. L. Mercer // Information processing and management. - 1991. - Vol. 27, No. 5. - pp. 517522.
135. Melichar, B. Text searching algorithms. Volume I: Forward searching algorithms [Electronic resource] / B. Melichar, J. Holub, T. Polcar // Access mode: https://cw.fel.cvut.cz/old/_media/courses/a4m33pal/melichar-tsa-lectures-1.pdf.
136. Michailidis, P. D. On-line approximate string searching algorithms: survey and experimental results // P. D. Michailidis, K.G. Margaritis // International Journal of Computer Mathematics. - 2002. - Vol. 79. - pp. 867-888.
137. Mikolov, T. Distributed representations of words and phrases and their compositionality / T. Milokov, I. Sutskever, K. Chen, G. Corrado, J. Dean // Proceedings of the 26th of International Conference on Neural Information processing system (NIPS'13), 2013. - pp. 3111-3119.
138. Navarro, G. A guided tour to approximate string matching / G. Navarro // ACM Surveys. - 2001. - Vol. 33, No. 1. - pp. 33-88.
139. Navarro, G. Flexible pattern matching in strings: practical on-line search algorithms for texts and biological sequences / G. Navarro, M. Raffinot. - Cambridge University Press, 2002. - p. 221
140. Navigli, R. A quick tour of word sense disambiguation, inducation and related approaches / R. Navigli // Proceedings of the 38th International Conference on Current Trends in Theory and Practice in Computer Science, 2012. - pp. 115-129.
141. Navigli R. Word sense disambiguation: a survey / R. Navigli // ACM Computing Surveys. - 2009. - Vol. 41, No. 2. - Article 10.
142. Navyar, Z., Hashmi, N., Rafique, N., Mahmood, K. Keyword based searching in social networks / Z. Navyar, N. Hashmi, N. Rafique, K. Mahmood // Proceedings of the SAI Computing Conference. - 2016. - pp. 701-705.
143. Oracle vs. PostgeSQL: какую СУБД выбрать? [Электронный ресурс]. -Режим доступа: https://www.performance-lab.ru/press-releases/oracle-vs-postgresql-kakuyu-subd-vybrat.
144. Pennington, J. GloVe: global vectors for word representation / J. Pennington, R. Socher, Ch. Manning // Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP), 2014. - 1532-1543 pp.
145. Petrovsky, M., Tsarev, D., Pospelova, I. Pattern based information retrieval approach to discover extremist information on the Internet / M. Petrovsky, D. Tsarev, I. Pospelova // Mining Intelligence and Knowledge Exploration. MIKE 2017. Lecture Notes in Computer Science. - 2017 - Vol. 10682. - pp. 240-249.
146. PgConf.Russia 2020 - 10 лет PostgreSQL в Avito [Электронный ресурс]. - Режим доступа: https://pgconf.ru/2020/265279.
147. Pollock, J. J. Automatic spelling correction in scientific and scholarly texts // J.J. Pollock, A. Zamora // Communications of the ACM. - 1984. - Vol. 27, No. 4. - pp. 358-368.
148. RCO Fact Extractor [Электронный ресурс]. - Режим доступа: http://www.rco.ru/?page_id=3554.
149. Savva, Yu. B. Linguistic database for monitoring system of online social networks in providing information and psychological security / Yu. B. Savva, Yu. V. Davydova // European integration: justice, freedom and security: proceedings of VII scientific and professional conference with international participation: in 3 volumes. -Belgrade: "Crimmalistic-Police Academy" Publisher, 2016. - Vol. 1. - pp. 145-154.
150. Savva, Yu. B. Modeling of online social networks for automated monitoring system [Электронный ресурс] / Yu. B. Savva, Yu. V. Davydova // Proceedings of the International Conference Information Technology and Nanotechnology. Session data science, 2017. - pp. 76-79. - Режим доступа: http://ceur-ws.org/Vol-1903/paper16.pdf
151. Sellers, P.H. The theory of computation of evolutionary distances: pattern recognition / P. H. Sellers // Journal of Algorithms. - 1980. - Vol. 1, No. 4. - pp. 359373.
152. Smyth, B. Computing patterns in strings / B. Smyth. - Pearson Addison-Wesley, 2003. - 423 p.
153. Sykora, M. D. National security and social media monitoring: a presentation of the EMOTIVE and related systems / M. D. Sykora, T. W. Jackson, A. O'Brien, S. Elayan // Proceedings of European Intelligence and Security Informatics Conference. -2013. - pp. 172-175.
154. Toutanova, K. Pronunciation modeling for improved spelling correction / K. Toutanova, R.C. Moore // Proceedings of the 40th Annual Meeting on Association for Computational Linguistics. - 2002, pp. 144-151.
155. «Twitter-революция» в Молдове: оценка восемь лет спустя [Электронный ресурс]. - Режим доступа: https://digital.report/twitter-revolyutsiya-v-moldove-otsenka-vosem-let-spustya/.
156. YouScan - система мониторинга социальных медиа [Электронный ресурс]. - Режим доступа: https://youscan.io/ru/.
157. Uslu, T. fast-Sense: an efficient word sense disambiguation classifier / T. Uslu, A. Mehler, D. Baumartz, W. Hemati // Proceedings of the 11th International Conference on Language Resources and Evaluation, 2018. - pp. 1042-1046.
158. Van Berkel, B. Triphone analysis: a combined method for the correction of orthographical and typographical errors / B. Van Berkel, K. De Smedt // Proceedings of the Second Conference on Applied Natural Language Processing. - 1988, pp. 77-83.
159. Wang, Y. Word sense disambiguation: a comprehensive knowledge exploitation framework [Electronic resource] / Y. Wang, M. Wang, H. Fujita //
Knowledge-based systems, 2020. - Vol. 190. - Access mode: https://www.sciencedirect.com/science/article/pii/S0950705119304344.
160. Whitelaw, C. Using the Web for language independent spellchecking and autocorrection / C. Whitelaw, B. Hutchinson, G. Y. Chung, G. Ellis // Proceedings of the 2009 Conference on empirical methods in natural language processing. - 2009, pp. 890-899.
161. Wordnet: a lexical database for English [Electronic resource] - Access mode: https://wordnet.princeton.edu/.
162. Yannakoudakis, E. An intelligent spelling corrector / E. J. Yannakoudakis, D. Fawthrop // Information processing and management. - 1983. - Vol. 19, No. 2. - pp. 101-108.
163. Yannakoudakis, E. The rules of spelling errors / E. J. Yannakoudakis, D. Fawthrop // Information processing and management. - 1983. - Vol. 19, No. 2. - pp. 87-99.
164. Zhang, C. A word sense disambiguation system based on Bayesian model / C. Zhang, S. He, X. Gao // Proceedings of the 4th International Conference on Computer Science and Network Technology (ICCSNT-2015), 2015. - pp. 124-127.
Приложение А Визуализация дерева решений после обучения
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.