Д. С. Бухаров О поиске эквивалентных текстов

Д. С. Бухаров О поиске эквивалентных текстов

скачать

Задача такого вида возникает при поиске дубликатов текста, определении авторства и возможного плагиата, организации библиотечного поиска, а также при создании поисковых систем Интернета. Разработанная программа протестирована на наборе данных, в число которых включены как оригиналы текстов, так и их специальным образом модифицированные варианты. В статье описан подход к формированию поискового множества, используемого при определении эквивалентов текста. Приведены варианты по улучшению разработанного программного средства и схема взаимодействия модулей разработанной программы после модификации. В результате проведенного эксперимента определены слабые стороны подхода! В подходе, представленном в статье, учитывается ряд особенностей: частотность слов, пунктуация, морфемная структура слов, регистр букв и артефакты текста (специфические цифро-буквенные сочетания).

Caroline Akinyi,Dan Kaseje and Rose Olayo Economic Evaluation of Community Health Strategy in Rural Kenya

Andy Rathbone Windows VistaTM For Dummies®

Граннеман С. Linux. Карманный справочник

Комментарии к Д. С. Бухаров О поиске эквивалентных текстов

1 ответа

  1. andreahrndt 10.04.2017 at 18:39

    Он и выл к творцу. В землянку вернулся абориген.