bars

Ciekawostki ze świata tłumaczeń. Rozpoznawanie słów w języku migowym niezależne od rotacji, translacji i skalowania za pomocą głębokiego uczenia.

07/07/2023
Autor: Advance MK

Ciekawostki ze świata tłumaczeń. Rozpoznawanie słów w języku migowym niezależne od rotacji, translacji i skalowania za pomocą głębokiego uczenia.

Artykuł “Rotation, Translation and Scale Invariant Sign Word Recognition Using Deep Learning” autorstwa Abu Saleh Musa Miah, Jungpil Shin, Md. Al Mehedi Hasan, M. Rahim, Y. Okuyama skupia się na rozpoznawaniu słów w języku migowym za pomocą głębokiego uczenia się. Autorzy proponują nowatorską metodę, która jest niezależna od rotacji, translacji i skalowania (RTS).

W pracy wykorzystano dwa zestawy danych do oceny proponowanego modelu rozpoznawania słów migowych. Następnie wygenerowano wersję RTS tych dwóch zestawów danych i użyto jej do oceny proponowanego modelu. Autorzy stworzyli wersję RTS dla obu zestawów danych, aby pokonać zależność modelu od obrazów wariantu RTS. Zastosowano techniki rotacji, translacji i skalowania, aby zwiększyć liczbę obrazów, uwzględniając różne widoki, kształty i pozycje z istniejącego zestawu danych.

Autorzy proponują połączony proces segmentacji wraz z siecią neuronową konwolucyjną (CNN) niezależną od RTS. Po zastosowaniu techniki RTS na obrazach wejściowych, na obrazach w wersji RTS zastosowano połączoną technikę segmentacji. Model osiągnął maksymalną dokładność wynoszącą 99,30% dla oceny zestawu danych Twenty sign word i 100% dla oceny zestawu danych Five sign word.

Wnioski z pracy sugerują, że obrazy RTS zapewniają optymalną wydajność, a model stał się modelem niezależnym od RTS. Ogólne wyniki pokazują, że proponowana metoda znacznie przewyższa rozpoznawanie słów migowych z obrazami RTS lub bez nich w porównaniu z najnowszymi metodami.

Źródło.

https://www.techscience.com/csse/v44n3/49179

https://file.techscience.com/ueditor/files/csse/TSP_CSSE-44-3/TSP_CSSE_29336/TSP_CSSE_29336.pdf

Autor wpisu

Advance MK