Preview

Вестник Казахстанско-Британского технического университета

Расширенный поиск

ОБРАБОТКА НАУЧНЫХ РЕСУРСОВ ВУЗА В СИСТЕМАХ УПРАВЛЕНИЯ ЗНАНИЯМИ

Аннотация

В данной статье описан онтологически-ориентированный подход текстовой обработки информационных ресурсов вуза, связанных с научной деятельностью. В качестве информационной модели научных знаний используется онтология. Описаны информационная модель научных ресурсов вуза, методы классификации текстов по научным направлениям и тематического аннотирования текстов. Онтологически-ориентированный подход позволяет организовать, структурировать информационные ресурсы вуза, связанные с научной деятельностью, и разработать методы поиска знаний. В качестве языка описания онтологии используется язык OWL DL (англ. Web Ontology Language). При разработке онтологии для описания различных характеристик классов и свойств были составлены OWL аксиомы классов и отношений, установлены ограничения атрибутов. Для классификации научных ресурсов используется kNN-классификация. Задачей классификации в машинном обучении является отнесение объекта к одному из заранее определенных классов на основании его формализованных признаков. Метод kNN (метод k ближайших соседей) – модель векторной классификации. kNN-классификатор относит документ к преобладающему классу ближайших соседей. Параметр k в методе kNN устанавливается предварительно на основании знаний о решаемой задаче классификации. В данной работе метод kNN используется для задачи многозначной классификации. Классификация для классов, которые не являются взаимоисключающими, называется многозначной (англ. Multilabel Classification) классификацией. Классификация документа состоит из следующих действий: лингвистический анализ, извлечение терминов и формирование векторного пространства документа, вычисление k ближайших соседей, ранжирование классов. Для тематического аннотирования текстов используются классы онтологии предметной области. В онтологическом словаре термины сгруппированы по классам предметной области.

Об авторах

Г. Жомарткызы
Восточно-Казахстанский государственный технический университет им. Д. Серикбаева
Казахстан

PhD, доцент



С. К. Кумаргажанова
Восточно-Казахстанский государственный технический университет им. Д. Серикбаева
Казахстан

к. т. н. 



Г. В. Попова
Восточно-Казахстанский государственный технический университет им. Д. Серикбаева
Казахстан

к. ф.-м. н., доцент



Список литературы

1. Ceci F., Pietrobon R., Gon9alves, A. L. (2012) Turning Text into Research Networks: Information Retrieval and Computational Ontologies in the Creation of Scientific Databases. PLoS ONE, Vol. 7 (1), P. 1-9.

2. Kryukov K. V., Kuznetsov O. P., Suhoverov V. S. (2013). On the notion of a formal competency researchers. In Proceedings of III International Scientific and Technical Conference- OSTIS-2013, Russia, Moscow, P. 143-146.

3. Ma J., Xu W., Sun Y., Turban E., Wang Sh., and Liu O. (2012). An Ontology-Based Text-Mining Method to Cluster Proposals for Research Project Selection. IEEE Transactions on Systems, Man, and Cybernetics — Part A: Systems and Humans, Vol. 42( 3), P. 784-790.

4. Thiagarajan R., Manjunath G., Stumptner M. (2008). Finding Experts By Semantic Matching of User Profiles. HP Laboratories, URL: http://www.hpl.hp.com/techreports/2008/HPL-2008-172.pdf

5. Lukashevich N. V (2011). Thesauri in information retrieval tasks. Moscow University Publishing House, ISBN 978-5-211-05926-0, Russia, P. 415.

6. Manning Ch. D., Raghavan P., Schutze H. (2009). Introduction to Information Retrieval.1

7. Bolshakov E. I., Klyshinsky E. S., Lande D. V., Noskov, A. A, Peskov O. V, Yagunova E. V. (2011). Automatic processing of natural language text and computational linguistics. MIEM Publishing House, ISBN 978-5-94506-294-8, Russia, P. 272.

8. Du M., Chen X. (2013). Accelerated k-nearest neighbors algorithm based on principal component analysis for text categorization. In Journal of Zhejiang University-Science C-Computers & Electronics, Vol. 14 (6), P. 407-416.

9. Shengyi Jiang, Guansong Pang, Meiling Wu, Limin Kuang. (2012). An improved K-nearest-neighbor algorithm for text categorization. In Proceedings of the Expert Systems with Applications 39, pp: 1503-1509.

10. Jiang J., Tsai Sh., Lee Sh. (2012). FSKNN: Multi-label text categorization based on fuzzy similarity and k nearest neighbors. In Proceedings of the Expert Systems with Applications 39, P. 2813-2821.

11. Allemang D., Hendler J.(2011). Semantic Web for the Working Ontologist. ISBN-13: 978-0-12­-373556-0, USA.

12. Guarino N. (2009). The Ontological Level: Revisiting 30 Years of Knowledge Representation. Conceptual Modeling: Foundations and Applications, P. 52-67.

13. Malarvizhi P., Ramachandra V. P. (2013). Multilabel classification of documents with MAPREDUCE. In International Journal of Engineering and Technology (IJET), ISSN : 0975­-4024, P. 1260-1267.

14. Cherman E. A., Monard M. C., Metz J. (2011). Multi-label Problem Transformation Methods: a Case Study. In Electronic Journal CLEI, Vol. 14 (1), P. 4-13.

15. Liu Y., Loh Han T., Sun A. (2009). Imbalanced text classification: A term weighting approach. In Proceedings of the Expert Systems with Applications, Vol. 36, P. 690-701.


Рецензия

Для цитирования:


Жомарткызы Г., Кумаргажанова С.К., Попова Г.В. ОБРАБОТКА НАУЧНЫХ РЕСУРСОВ ВУЗА В СИСТЕМАХ УПРАВЛЕНИЯ ЗНАНИЯМИ. Вестник Казахстанско-Британского технического университета. 2019;16(3):122-128.

For citation:


Zhomartkyzy G., Kumargazhanova S.K., Popova G.V. UNIVERSITY’S SCIENTIFIC RESOURCES PROCESSING IN KNOWLEDGE MANAGEMENT SYSTEMS. Herald of the Kazakh-British technical university. 2019;16(3):122-128. (In Russ.)

Просмотров: 293


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1998-6688 (Print)
ISSN 2959-8109 (Online)