С 28 июля по 2 августа во Флоренции прошла 57-я ежегодная конференция Ассоциации компьютерной лингвистики (Association for Computational Linguistics (ACL)), в которой приняли участие ученые из Высшей школы ИТИС (кафедра интеллектуальных технологий поиска) и НИЛ «Хемоинформатика и молекулярное моделирование»: Елена Тутубалина, Ильсеяр Алимова, Зульфат Мифтахутдинов.
Кроме основной программы, конференция включала постерную сессию, семинары, воркшопы и соревнования по поиску заданной информации.
На постерной сессии ученые из ИТИС и НИЛ «Хемоинформатика и молекулярное моделирование» представили два доклада: «Exploring the potential of Neural Networks for Extracting Adverse Drug Reactions from Biomedical Texts» и «Deep Neural Models for Medical Concept Normalization in User-Generated Texts».
Первый доклад посвящен поиску упоминаний о побочных эффектах в отзывах пользователей о лекарственных препаратах в интернете, в электронных карточках пациентов, «Твиттере» и научных статьях.
Основная цель исследования – найти новые побочные эффекты, которые не упоминались в инструкциях к препарату. Данная информация может быть полезна фармацевтам для улучшения качества лекарства и поиска новых гипотез о перепрофилировании препарата - применению лекарства для лечения нового заболевания.
Для решения этой задачи применялась нейронная сеть с интерактивным вниманием (Interactive Attention Network). Результаты экспериментов показали превосходство разработанной модели по сравнению с существующими на данный момент решениями.
Задача нормализации медицинских концептов подразумевает приведение фраз о болезнях, симптомах и лекарствах, извлеченных из текстов биомедицинской тематики, к единой медицинской терминологии. Для этого каждой фразе сопоставляется соответствующий медицинский концепт - код в одной из медицинских систем кодирования (например, SNOMED, ICD-10, MESH, MEDDRA и др.). Решение данной задачи позволит, во-первых, автоматизировать медицинский документооборот, а во-вторых, привести выявленные на первом этапе побочные эффекты к медицинским терминам.
Все работы были выполнены при поддержке Российского научного фонда (номер гранта 18-11-00284).
В рамках конференции прошли сравнительные тестирования систем компьютерного анализа, результаты которых обсуждались на воркшопе. Тестирование включало различные задачи по извлечению информации о побочных эффектах из «Твиттера», на котором ученые из КФУ выступили с докладом и заняли первое место в двух секциях: извлечение именованных сущностей (нужно было выделить в тексте слова и фразы, описывающие побочный эффект) и нормализация медицинских концептов.
ACL является ведущей конференцией в области компьютерной лингвистики, охватывающей широкий спектр различных областей исследований, связанных с вычислительными подходами к естественному языку.