STUDENT MODELING BASED ON THE TRAINING TEXT CLUSTERING METHOD ISLAND
Abstract
The most famous way of representing knowledge about the student is the overlay model, the structure of which is based on the domain. Such a model is called the subject student model. Building a model is usually done by hand, as it is not universal. In this paper we propose to automate the process of constructing the subject of the student model using labeled training text and keywords. In addition, the allocation problem is solved logically related fragments subject the model to customize the presentation of the material, as well as the thematic evaluation. Fragments used to identify clustering idea island, which is used for the thematic grouping of larger corpus and information in their hierarchical structure. The method works with the subject area, broken into disjoint text area. The method consists in the fact that the first field are called centers of the islands, and then selected based on a measure of proximity to the centers of other areas are added to form a thematic fragment.
References
Виноградова Н. В. Автоматическая классифи¬кация терминов в русскоязычном корпусе текстов по корпусной лингвистике / Н. В. Виноградова, О. А. Митрофанова, П. В. Паничева // Труды девятой Всероссийской научной конференции «Электронные библиотеки : Перспективные методы и технологии, электронные коллекции» (RCDL–2007). Переславль-Залесский, 2007 : [Электронный ресурс]. – Режим доступа : http://www.rcdl.ru//papers/2007/paper_31_v1.pdf
Ермаков А. Е. Автоматизация онтологического инжиниринга в системах извлечения знаний из текста / А. Е Ермаков //Материалы международной конференции «Диалог 2008». – М. – С. 154-159.
Киселев М. В. Метод кластеризации текстов, учитывающий совместную встречаемость ключевых терминов, и его применение к анализу тематической структуры новостного потока, а также ее динамики / М. В. Киселев, В. С. Пивоваров, М. М. Шмулевич // Интернет-математика. Автоматическая обработка веб-данных. – М., 2005. – С. 412-435.