Preview

Вестник Казахстанско-Британского технического университета

Расширенный поиск

КАК ИЗМЕНЕНИЯ В БАЗЕ ДАННЫХ ВЛИЯЮТ НА ТОЧНОСТЬ КЛАССИФИКАТОРА

Аннотация

Сверточные нейронные сети произвели революцию в компьютерном зрении и распознавании образов. Их используют для распознавания речи, генерирования различных образов, обработки аудиосигналов, обработки временных рядов, для анализа смысла текстов. Разрабатывается все более сложная и глубокая архитектура нейронных сетей, наряду с несомненными преимуществами общих проблем этого подхода существуют некие недостатки. Одним из них выступает скрытый внутренний принцип нейронной сети. Правильно обученная сеть не предоставляет исследователям информацию о выявленных зависимостях данных и структуре проблемы. Обученная нейронная сеть представляет собой набор весовых матриц. С этой точки зрения нейронные сети являются лишь инструментом для решения конкретной проблемы машинного обучения, но они не предоставляют экспертам аналитическую информацию для изучения проблемы. Как давно известно, принцип работы нейронной сети был взят из принципа работы нейронов в нашем мозгу. Внутрь мозга мы научились заглядывать посредством УЗИ, ПЭТ, МРТ и фМРТ. А для сверточных нейронных сетей будут использоваться такие показатели как точность и для визуализации тепловые карты. Цель работы – выяснить влияние тренировочного датасета на точность нейронной сети, и какое количество данных в значительной степени изменит устойчивость нейронной сети. В первую очередь были подобраны гиперпараметрами: скорость обучения, размер партии и количество эпох, а также размер изображений. Затем были проведены ряд тренировок с использованием оригинальных данных и лишь потом добавляли изображения, которые прошли предобработку. Как показали результаты работы датасет, в котором содержится примерно 15% предобработанных данных, положительно сказывается на точности модели. При использовании большего количества данных не было выявлено значительного увеличения точности

Об авторе

Д. М. Ильчубаева
Казахстанско-Британский технический университет
Казахстан

магистрант



Список литературы

1. Tensor processing unit. Available at: https://cloud.google.com/blog/products/gcp/cloud-tpu-machine-learning-accelerators-now-available-in-beta

2. Christoph Molnar. Interpretable Machine Learning : A Guide for Making Black Box Models Explainable, 2018.

3. ImageNet. Available at: http://www.image-net.org/

4. Labeled Faces in the Wild. Availabe at: http://vis-www.cs.umass.edu/lfw/

5. LabelImg. Available at: https://github.com/tzutalin/labelImg

6. Augmentation sequence. Available at: https://imgaug.readthedocs.io/en/latest/source/examples_basics.html

7. VGGFace2. Available at: http://www.robots.ox.ac.uk/~vgg/data/vgg_face2/

8. Alex Krizhevsky. ImageNet Classification with Deep Convolutional Neural Networks

9. Aharon Azulay and Yair Weiss. Why do deep convolutional networks generalize so poorly to small image transformations?, 2018

10. Dan Hendrycks, Thomas G. Dietterich. Benchmarking Neural Network Robustness to Common Corruptions and Surface Variations, 2019.


Рецензия

Для цитирования:


Ильчубаева Д.М. КАК ИЗМЕНЕНИЯ В БАЗЕ ДАННЫХ ВЛИЯЮТ НА ТОЧНОСТЬ КЛАССИФИКАТОРА. Вестник Казахстанско-Британского технического университета. 2020;17(4):155-160.

For citation:


Ilchubayeva D. HOW CHANGES IN THE DATASET AFFECTS THE ACCURACY OF THE BODY CLASSIFIER. Herald of the Kazakh-British technical university. 2020;17(4):155-160.

Просмотров: 297


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1998-6688 (Print)
ISSN 2959-8109 (Online)