- Главная
- Медиа-ресурсы
- Новости
- Презентована смарт - база "национальный корпус казахского языка"
Презентована смарт - база "национальный корпус казахского языка"
Объем текстовой базы ресурса с поисковой системой, объединяющей грамматику и словарный запас языка в одну базу и созданную в соответствии с возможными запросами пользователя, составляет 50 миллионов словоупотреблений. Из них в текст, состоящий из 14 миллионов словоупотреблений, включены 16-21 параметрических метаразметок. Собранные тексты охватывают 5 стилей казахского языка.
"Наш онлайн-ресурс, в отличие от других платформ, через метаразметки показывает, из какого текста взято слово, которое вы ищете, автора текста, тему, дату публикации, источник, стиль, тип распространения и т. д. Возьмем, к примеру, корпус параллельных текстов. Русский перевод одного из предложений «Слов назидания» Абая приводится рядом. Вы можете получить полную лингвистическую информацию, щелкнув любое слово в тексте. Этот сайт доступен любому пользователю. Этим корпусом могут пользоваться и те, кто намерен изучать казахский язык", - говорит кандидат филологических наук Анар Муратовна.
Этот важный проект разработан специалистами Института языкознания имени Ахмета Байтурсынова. Также полностью переведен в цифровой формат картотечный фонд казахских слов.