Фахівці Національного корпусу кримськотатарської мови опрацювали понад 700 матеріалів
Під час роботи над створенням Національного корпусу кримськотатарської мови, яке ініціювало Міністерство з питань реінтеграції тимчасово окупованих територій, фахівці вже опрацювали понад 700 матеріалів.
Про це повідомляє пресслужба Мінреінтеграції.
– Збір друкованих та електронних текстів кримськотатарською мовою для їх подальшого імпорту на платформу Sketch Engine розпочався з жовтня 2022 року. За майже півроку були опрацьовані та внесені до каталогу понад 700 матеріалів. Серед них – твори кримськотатарських авторів, журнали, газети, підручники, документи міжнародних організацій, субтитри фільмів тощо, – йдеться у повідомленні.
Зазначається, що за цей час також розроблено словник лематизації – йдеться про створення реєстру (бази даних) слів з позначенням їх початкової форми та мовних характеристик, що потрібно для запуску модуля з пошуку слів на онлайн-платформі.
Розробка відповідного програмного забезпечення триває.
Мінреінтеграції ініціювало створення Національного корпусу кримськотатарської мови (НККМ) у межах реалізації Стратегії розвитку кримськотатарської мови на 2022-2032 роки. Національного корпусу кримськотатарської мови – це онлайн-платформа для дослідження мови, що працюватиме на даних із текстових матеріалів кримськотатарською.