Бектенов поручил ускорить разработку казахстанской языковой модели KazLLM
Испытание первой модели должно быть проведено уже в III квартале 2024 года
Глава правительства поручил форсировать разработку казахстанской языковой модели и обозначил сроки для проведения первых испытаний.
«МЦРИАП совместно с министерством науки и Назарбаев университетом - завершить до конца текущего года сбор данных для большой языковой модели KazLLM. Тренировка первой модели должна быть проведена уже в III квартале текущего года»,
– отметил Олжас Бектенов на заседании правительства 16 июля.
По информации министра науки и высшего образования Саясата Нурбека министерство проводит сбор массива данных для разработки проекта большой языковой модели KazLLM. В результате общего сбора данных будет создана высококачественная модель обработки казахского языка. В будущем это поможет не только улучшить автоматический перевод, но и повысить качество и точность обработки текстов на казахском языке в целом.
Для сбора данных министерством сформирован консорциум, куда вошли Институт информационных и вычислительных технологий, Satbayev University, Nazarbayev University, ННПЦ «Тіл-Қазына» имени Ш.Шаяхметова, Институт языкознания им. А. Байтурсынова и КазНУ.
По программе целевого финансирования данного проекта министерством объявлен конкурс на общую сумму 3,9 млрд тенге.
Для наполнения массивов данных для KazLLM консорциумом, вузами и государственными органами ведется передача данных в информационно-аналитическую систему «Smart Data Ukimet».
Разработка KazLLM ведется во исполнение поручения Касым-Жомарта Токаева для развития культурного и языкового наследия народа Казахстана.