НЕЙРОМЕРЕЖЕВИЙ КЛАСИФІКАТОР АВТОМАТИЧНОЇ СИСТЕМИ ОБРОБКИ ДОКУМЕНТІВ

10.33815/2313-4763.2021.2.25.083-091

  • О. А. Жученко Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», м. Київ https://orcid.org/0000-0001-5611-6529
  • А. П. Коротинський Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», м. Київ https://orcid.org/0000-0002-6309-5970
  • В. С. Цапар Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», м. Київ https://orcid.org/0000-0002-8347-7941
  • В. В. Федотов Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», м. Київ https://orcid.org/0000-0001-7821-0989
Ключові слова: нейронні мережі, аргументація, автоенкодер, переднавчання, класифікатор

Анотація

Робота спрямована на вирішення прикладної задачі розробки автоматичної системи обробки електронних документів, а саме однієї з її частин ‑ класифікатора. Для вирішення поставленої задачі запропоновано використовувати підходи машинного навчання та штучного інтелекту. Вирішення поставленої задачі при звичайних умовах не складає труднощів, проте в даній роботі розглядається випадок обмеженості навчальної вибірки, що є поширеним випадком при розробці систем на базі запропонованих підходів. У роботі проведено дослідження початкових даних на основі яких буде проведено навчання моделі та визначено кількість класів, що будуть розпізнаватись, кількість представників у кожному класі та досліджено особливості їх представлення. У роботі представлено підходи, застосування яких дозволяє збільшити точність систем такого типу, в умовах обмеженості початкової начальної вибірки. Серед запропонованих підходів розглядається принцип мінімізації параметрів при формуванні архітектури штучної нейронної мережі, аугментація даних, переднавчання штучної нейронної мережі шляхом застосування автоенкодера. Отримана точність у 94-95 %, після застосування запропонованих підходів на відміну від 70 % початкових, підтверджує можливість оперативної розробки аналогічних класифікаторів такого типу, при обмеженій вибірці та в умовах мінімізації часу, з досягненням високих показників точності.

Посилання

1. Fransua Sholle. Hlubokoe obuchenye na Python. SPb.: Pyter, 2018. 400 s.: (Seryia «Byblyoteka prohrammysta»). ISBN 978-5-4461-0770-4.
2. Sokolenko D. H., Kornaha Ya. I. «Systema rozpiznavannia pysemnykh symvoliv za dopomohoiu neironnoi merezhi», Vcheni zapysky TNU imeni V.I. Vernadskoho. Seriia Tekhnichni nauky Tom 29 (68) Ch. 2 # 5 2018 s. 56-58.
3. Karpovych Artem Valeriiovych «Vykorystannia zghortkovykh neironnykh merezh dlia zadachi klasyfikatsii tekstiv», International scientific journal «Internauka» # 14(54), 2018 // Technical sciences s. 69–73.
4. Orhan G. Yalçın Image Classification in 10 Minutes with MNIST Dataset, URL: https://towardsdatascience.com/image-classification-in-10-minutes-with-mnist-dataset-54c35b 77a38d.
5. Feiyang Chen, Nan Chen, Hanyang Mao, Hanlin Hu Assessing Four Neural Networks on Handwritten Digit Recognition Dataset (MNIST) / Сhuangxinban journal of computing, june 2018, URL: https://arxiv.org/pdf/1811.08278. pdf.
6. Yifan Wang, Fenghou Li, Hai Sun, Wenbo Li, Cheng Zhong, Xuelian Wu, Hailei Wang, Ping Wang Improvement of MNIST Image Recognition Based on CNN, 7th Annual International Conference on Geo-Spatial Knowledge and Intelligence IOP Conf. Series: Earth and Environmental Science 428 (2020), URL: https://iopscience.iop.org/article/10.1088/1755-1315/428/1/012097/pdf.
7. Wan Zhu Classification of MNIST Handwritten Digit Database using Neural Network, URL : http://users.cecs.anu.edu.au/~Tom.Gedeon/conf/ABCs2018/paper /ABCs 2018_paper_117.pdf.
8. Korotynskyi, A., Zhuchenko, O. Development of a classifier for the system of automatic document processing with limited sampling, ATIT 2020 – Proceedings: 2020 2nd IEEE International Conference on Advanced Trends in Information Theory, 2020, р. 349–352.
9. A. Korotynskyi, O. Zhuchenko A system of automated control for the baking process that minimizes the probability of defects, Eastern-European Journal of Enterprise Technologies, 2020, (2-103), р. 58–67.
Опубліковано
2022-01-27
Розділ
АВТОМАТИЗАЦІЯ ТА КОМП’ЮТЕРНО-ІНТЕГРОВАНІ ТЕХНОЛОГІЇ