Rozpoznawanie komend głosowych w j. polskim z wykorzystaniem głębokich sieci neuronowych

nr katalogowy: 150174
10.15199/13.2024.8.4

Streszczenie
Artykuł dotyczy opracowania narzędzia umożliwiającego automatyczne rozpoznawanie komend głosowych z wykorzystaniem głębokich sieci neuronowych. W projekcie wykorzystane zostały odmiany sieci rekurencyjnych – LSTM (ang. Long-Short Term Memory) [2] oraz GRU (ang. Gated Recurrent Unit) [3]. Do implementacji sieci w postaci programu użyty został język programowania python, z zestawem niezbędnych pakietów programistycznych, w tym pakietów platformy TensorFlow 2. Dane uczące zostały podzielone na trzy podzbiory: zbiór danych uczących, danych walidacyjnych oraz danych egzaminacyjnych. Przyjęto, że metodą uczenia sieci będzie metodą uczenia z nadzorowanego.

Abstract
The article concerns the development of a tool for automatic recognition of voice commands using deep neural networks. The project employed variations of recurrent networks—LSTM (Long-Short Term Memory) [2] and GRU (Gated Recurrent Unit) [3]. The neural networks were implemented using the Python programming language, along with a set of necessary software packages, including those from the TensorFlow 2 platform. The training data was divided into three subsets: the training set, validation set, and test set. The network was trained using supervised learning methods.

Kamil ZBRÓG
Andrzej Poniecki