Александр Пиперски прочитал лекцию для школьников на Малом мехмате
Тема лекции – «Измерение расстояний между текстами»
Научный сотрудник Лаборатории лингвистической конфликтологии и современных коммуникативных практик Александр Пиперски прочитал лекцию для школьниках на Малом мехмате МГУ. Лекция была посвящена измерению расстояний между текстами.
В своей лекции Александр Пиперски попытался ответить на вопрос «что значит фраза "тексты похожи?"». С точки зрения математики обычно имеется в виду, что в этих текстах встречаются одни и те же слова с примерно одинаковыми частотами.
На лекции обсуждались следующие вопросы:
— какие бывают меры расстояния между текстами и что вообще значит «расстояние» в бытовом и математическом смысле?
— как узнать, насколько хорошо эти меры работают и какая мера самая правильная?
— правда ли, что надо смотреть на слова или лучше взять что-нибудь другое, например частоту отдельных букв?
— как с помощью этих мер обрабатывать поисковые запросы, изучать историю литературы, объединять новости в тематические сюжеты и определять авторство текста?
Презентации лекции доступна здесь, а видеозапись – здесь.
Пиперски Александр Чедович
Научно-учебная лаборатория лингвистической конфликтологии и современных коммуникативных практик: Научный сотрудник