СРАВНЕНИЕ АЛГОРИТМОВ ОБУЧЕНИЯ С УЧИТЕЛЕМ И БЕЗ УЧИТЕЛЯ ДЛЯ ОБНАРУЖЕНИЯ ДЕПРЕССИВНЫХ ПОСТОВ
Аннотация
Согласно последним данным ВОЗ, опубликованным в 2017 году, количество самоубийств в Казахстане составило 4855 или 3,55 % от общего числа смертей. Уровень смертности с поправкой на возраст составляет 27,74 на 100 000 населения. Казахстан занимает четвертое место в мире по этому показателю. В этой статье представлено сравнение алгоритмов машинного обучения с учителем и без учителя для выявления депрессивного контента в постах в социальных сетях с
акцентом на безнадежность и психологическую боль для семантического анализа в качестве ключевых причин самоубийства. Самоубийство не является спонтанным, и подготовка к самоубийству может длиться около года, в течение которого человек будет демонстрировать признаки своего состояния, в нашем случае, публикуя депрессивный контент в своем профиле в социальной сети. Этот алгоритм помогает в обнаружении депрессивного контента, который может вызвать самоубийство, чтобы помочь людям найти уверенную помощь от психологов национального центра по предотвращению самоубийств в Казахстане. Получив наивысший результат для 95 % оценки f 1 для случайного леса (обучение с учителем) с моделью векторизации tf-idf. В заключение можно сказать, что алгоритм K-means (обучение без учителя) с использованием tf-idf показывает впечатляющие результаты, которые ниже только на 4 % f 1 и точности.
Ключевые слова
Об авторах
С. С. НарыновКазахстан
PhD
Д. Мухтарханулы
Казахстан
ученый по данным
И. М. Керимов
Казахстан
менеджер проектов
Список литературы
1. World Health Organization. Preventing suicide. A resource for counsellors. Geneva 2006.
2. Oksana Lysenko. “The number of suicides among children in Kazakhstan continues is growing”, [http://www.zakon.kz/4524024-kolichestvo-suicidov-sredi-detejj-v.html]
3. Klonsky E. D., May A. M. “Assessing Motivations for Suicide Attempts: Development and psychometric properties of the Inventory of Motivations for Suicide Attempts (IMSA).” Suicide and Life-Threatening Behavior, October 2013: 1-3.
4. Mukhtarkhanuly D., Abishev A. “Suicidal Post Detection in Social Networks using NLP.” Natural Sciences Publishing, August 2018.
5. Marouane Birjali, Abderrahim Beni-Hssane, and Mohammed Erritali. “Prediction of Suicidal Ideation in Twitter Data using Machine Learning algorithms.” International Arab Conference on Information Technology (ACIT’2016), 2016: 1-5.
6. Hardik A. Patel, Cheng-Yuan Hsieh - Knowledge Systems Institute. “Early Detection of Suicide Using Big-Data Analytics in Real Time.” Journal of Visual Languages and Sentient Systems, 2016:1
7. Liu, Tong, Qijin Cheng, Christopher M. M. Homan, and Vincent M. B. Silenzio. “Learning from various labeling strategies for suicide-related messages on social media: An experimental study.” arXiv: 1701.08796v1 [cs.LG] 17, no. 01 (Jan 2017): 1-8.
8. Receiver Operating Characteristic with cross-validation [http://scikit-learn.org/stable/auto_examples/model_selection/plot_roc_crossval.html#sphx-glr-auto-examples-model-selection-plot-roc-crossval-py]
9. https://github.com/DaniyarML/Publications/tree/master/Supervised_vs_Unsupervised
Рецензия
Для цитирования:
Нарынов С.С., Мухтарханулы Д., Керимов И.М. СРАВНЕНИЕ АЛГОРИТМОВ ОБУЧЕНИЯ С УЧИТЕЛЕМ И БЕЗ УЧИТЕЛЯ ДЛЯ ОБНАРУЖЕНИЯ ДЕПРЕССИВНЫХ ПОСТОВ. Вестник Казахстанско-Британского технического университета. 2019;16(3):478-484.
For citation:
Narynov S.S., Muhtarhanuly D., Keser I.M. COMPARISON OF SUPERVISED LEARNING WITH UNSUPERVISED LEARNING ALGORITHMS IN DEPRESSIVE POST DETECTION. Herald of the Kazakh-British Technical University. 2019;16(3):478-484. (In Russ.)