В Казахстане разработали аналог ChatGPT, Павел Дуров прилетел в Астану, а ICQ официально отключили

28 июня 2024
3 мин.

Собрали в техно-дайджесте главные новости за минувшую неделю на случай, если вы что-то пропустили.

MOST Holding и Gen2b.ai зарелизили первую национальную языковую модель с открытым исходным кодом

Она называется IrbisGPT, а протестировать ее, и заодно внести вклад в обучение LLM на казахском языке, может каждый казахстанец. Как отмечает фаундер проекта Бахт Ниязов, главная цель IrbisGPT – сохранение и распространение казахского языка и его интеграция в современные цифровые технологии для развития общества, экономики и науки в Казахстане.

“Мы выложили проект в открытый доступ для того, чтобы собрать вокруг него коммьюнити и дать возможность энтузиастам развития казахского языка протестировать его и сделать свой вклад в обучение модели”, – отмечает Бахт Ниязов.

По словам разработчиков, подобные опенсорсные модели либо пытаются ответить на английском, либо просто “сыпят” случайными словами на казахском. Благодаря длительному обучению на вопросы без контекста IrbisGPT отвечает достаточно развернуто и правильно. Например, она может ответить на вопрос “шөп неге жасыл”, знает кто президент Казахстана и количество дней в году. А еще может пофилософствовать о смысле жизни.

“Irbis LLM не просто разобралась с построением слов и грамматикой казахского языка, она умеет обрабатывать входящую информацию, натренирована отвечать на простые вопросы, способна работать с контекстом, что дает возможность ее подключения к актуальным базам знаний, налоговому кодексу и т.д. За счет этого она может стать полезным инструментом по получению релевантной информации. Также благодаря более эффективному токенизатору, скорость генерации текста на государственном языке увеличилась от 3 до 5 раз раз по сравнению с моделями GPT», – поделился Армен Атаян, CEO Gen2b.ai.

К слову, для обучения модели разработчики собрали 20 гигабайтов “сырых” данных из новостей и статей на казахском языке, расширив ее словарь почти в три раза. Правда, этого им все равно недостаточно, и команда надеется получить качественные данных со стороны госорганов для усовершенствования IrbisGPT. Сейчас диалоговое окно LLM содержит более 60 тысяч токенов, а ее разработчики планируют создать следующую модель на более совершенной архитектуре.

АО «НИТ» объявило о сборе данных для обучения AI-модели Kaz LLM

Это второй проект по созданию аналога Chat GPT, с поддержкой казахского языка. Пользователи могут отправлять образцы текстов на казахском через платформу Hugging Face в форматах .txt, .csv и .json.

Павлу Дурову планируют показать технологические достижения Казахстана

Глава МЦРИАП Жаслан Мадиев сообщил о планах показать Павлу Дурову технологические достижения Казахстана. Мадиев подчеркнул, что визит Дурова может быть взаимовыгодным, предоставив возможность изучить местные тренды и поделиться опытом. В Казахстане много внимания уделяется развитию человеческого капитала и образования, а также есть продукты, которые могут быть выведены на экспорт. К слову, Дуров уже посетил Astana Hub и МФЦА.

ICQ официально прекратила работу

Популярный в начале нулевых мессенджер ICQ, который вдохновил польского писателя Януша Вишневского на создание романа «Одиночество в сети», официально прекратил свою работу. О закрытии сервиса VK объявляла еще в мае, но пользователи продолжали использовать ICQ до недавнего времени. Мессенджер, запущенный израильской компанией Mirabili в 1996 году, оставил значимый след в истории интернет-коммуникаций.