Бектенов поручил ускорить разработку казахстанской языковой модели KazLLM

Испытание первой модели должно быть проведено уже в III квартале 2024 года

Павел Седых 17.07.2024 | 11:04

Бектенов поручил ускорить разработку казахстанской языковой модели KazLLM

Фото: t.me/KZgovernment

Глава правительства поручил форсировать разработку казахстанской языковой модели и обозначил сроки для проведения первых испытаний.

«МЦРИАП совместно с министерством науки и Назарбаев университетом - завершить до конца текущего года сбор данных для большой языковой модели KazLLM. Тренировка первой модели должна быть проведена уже в III квартале текущего года»,

– отметил Олжас Бектенов на заседании правительства 16 июля.

По информации министра науки и высшего образования Саясата Нурбека министерство проводит сбор массива данных для разработки проекта большой языковой модели KazLLM. В результате общего сбора данных будет создана высококачественная модель обработки казахского языка. В будущем это поможет не только улучшить автоматический перевод, но и повысить качество и точность обработки текстов на казахском языке в целом.

Для сбора данных министерством сформирован консорциум, куда вошли Институт информационных и вычислительных технологий, Satbayev University, Nazarbayev University, ННПЦ «Тіл-Қазына» имени Ш.Шаяхметова, Институт языкознания им. А. Байтурсынова и КазНУ.

По программе целевого финансирования данного проекта министерством объявлен конкурс на общую сумму 3,9 млрд тенге.

Для наполнения массивов данных для KazLLM консорциумом, вузами и государственными органами ведется передача данных в информационно-аналитическую систему «Smart Data Ukimet».

Разработка KazLLM ведется во исполнение поручения Касым-Жомарта Токаева для развития культурного и языкового наследия народа Казахстана.