Презентована смарт - база "национальный корпус казахского языка"

Презентована смарт - база "национальный корпус казахского языка"

В Атырауском университете имени Х. Досмухамедова состоялась встреча с директором Института языкознания имени Ахмета Байтурсынова Анар Фазылжановой. Ученый представила профессорско-преподавательскому составу и студентам смарт-базу казахских текстов - «Национальный корпус казахского языка».

Объем текстовой базы ресурса с поисковой системой, объединяющей грамматику и словарный запас языка в одну базу и созданную в соответствии с возможными запросами пользователя, составляет 50 миллионов словоупотреблений. Из них в текст, состоящий из 14 миллионов словоупотреблений, включены 16-21 параметрических метаразметок. Собранные тексты охватывают 5 стилей казахского языка.

"Наш онлайн-ресурс, в отличие от других платформ, через метаразметки показывает, из какого текста взято слово, которое вы ищете, автора текста, тему, дату публикации, источник, стиль, тип распространения и т. д. Возьмем, к примеру, корпус параллельных текстов. Русский перевод одного из предложений «Слов назидания» Абая приводится рядом. Вы можете получить полную лингвистическую информацию, щелкнув любое слово в тексте. Этот сайт доступен любому пользователю. Этим корпусом могут пользоваться и те, кто намерен изучать казахский язык", - говорит кандидат филологических наук Анар Муратовна.

Этот важный проект разработан специалистами Института языкознания имени Ахмета Байтурсынова. Также полностью переведен в цифровой формат картотечный фонд казахских слов.

Возврат к списку