НЕЙРОМЕРЕЖЕВИЙ КЛАСИФІКАТОР АВТОМАТИЧНОЇ СИСТЕМИ ОБРОБКИ ДОКУМЕНТІВ
10.33815/2313-4763.2021.2.25.083-091
Анотація
Робота спрямована на вирішення прикладної задачі розробки автоматичної системи обробки електронних документів, а саме однієї з її частин ‑ класифікатора. Для вирішення поставленої задачі запропоновано використовувати підходи машинного навчання та штучного інтелекту. Вирішення поставленої задачі при звичайних умовах не складає труднощів, проте в даній роботі розглядається випадок обмеженості навчальної вибірки, що є поширеним випадком при розробці систем на базі запропонованих підходів. У роботі проведено дослідження початкових даних на основі яких буде проведено навчання моделі та визначено кількість класів, що будуть розпізнаватись, кількість представників у кожному класі та досліджено особливості їх представлення. У роботі представлено підходи, застосування яких дозволяє збільшити точність систем такого типу, в умовах обмеженості початкової начальної вибірки. Серед запропонованих підходів розглядається принцип мінімізації параметрів при формуванні архітектури штучної нейронної мережі, аугментація даних, переднавчання штучної нейронної мережі шляхом застосування автоенкодера. Отримана точність у 94-95 %, після застосування запропонованих підходів на відміну від 70 % початкових, підтверджує можливість оперативної розробки аналогічних класифікаторів такого типу, при обмеженій вибірці та в умовах мінімізації часу, з досягненням високих показників точності.
Посилання
2. Sokolenko D. H., Kornaha Ya. I. «Systema rozpiznavannia pysemnykh symvoliv za dopomohoiu neironnoi merezhi», Vcheni zapysky TNU imeni V.I. Vernadskoho. Seriia Tekhnichni nauky Tom 29 (68) Ch. 2 # 5 2018 s. 56-58.
3. Karpovych Artem Valeriiovych «Vykorystannia zghortkovykh neironnykh merezh dlia zadachi klasyfikatsii tekstiv», International scientific journal «Internauka» # 14(54), 2018 // Technical sciences s. 69–73.
4. Orhan G. Yalçın Image Classification in 10 Minutes with MNIST Dataset, URL: https://towardsdatascience.com/image-classification-in-10-minutes-with-mnist-dataset-54c35b 77a38d.
5. Feiyang Chen, Nan Chen, Hanyang Mao, Hanlin Hu Assessing Four Neural Networks on Handwritten Digit Recognition Dataset (MNIST) / Сhuangxinban journal of computing, june 2018, URL: https://arxiv.org/pdf/1811.08278. pdf.
6. Yifan Wang, Fenghou Li, Hai Sun, Wenbo Li, Cheng Zhong, Xuelian Wu, Hailei Wang, Ping Wang Improvement of MNIST Image Recognition Based on CNN, 7th Annual International Conference on Geo-Spatial Knowledge and Intelligence IOP Conf. Series: Earth and Environmental Science 428 (2020), URL: https://iopscience.iop.org/article/10.1088/1755-1315/428/1/012097/pdf.
7. Wan Zhu Classification of MNIST Handwritten Digit Database using Neural Network, URL : http://users.cecs.anu.edu.au/~Tom.Gedeon/conf/ABCs2018/paper /ABCs 2018_paper_117.pdf.
8. Korotynskyi, A., Zhuchenko, O. Development of a classifier for the system of automatic document processing with limited sampling, ATIT 2020 – Proceedings: 2020 2nd IEEE International Conference on Advanced Trends in Information Theory, 2020, р. 349–352.
9. A. Korotynskyi, O. Zhuchenko A system of automated control for the baking process that minimizes the probability of defects, Eastern-European Journal of Enterprise Technologies, 2020, (2-103), р. 58–67.