LLM от Apple, клонирование голоса и конкурент Sora от казахстанца

5 апреля 2024
3 мин.

Делимся самыми интересными новостями за минувшую неделю из мира информационных технологий.

Amazon закроет супермаркеты без касс 

Формат таких магазинов позволял совершать покупки без привычных форм оплаты. Вместо этого система из камер и датчиков отслеживала, какие покупки брал человек и автоматически списывала сумму товаров с карты. 

Компания несколько лет развивала технологию, но она так и не стала автономной. В помощь AI изображение с камер в магазинах также отслеживало более 1000 сотрудников в Индии. При этом у клиентов часто возникали проблемы с покупками. Прежнюю систему заменят умные корзины со встроенными сканерами для оплаты.

ChatGPT без регистрации и клонирование голоса 

Популярный чат-бот больше не требует наличия аккаунта. Правда, в таком формате он не будет отвечать на некоторые промпты, как и сохранять историю чатов и предлагать часть других функций.

Одной LLM OpenAI не ограничивается и разрабатывает другие генеративные сервисы. Так, недавно компания отложила релиз модели для генерации голоса Voice Engine. Разработчики решили, что из-за популярности дипфейков открывать доступ к технологии всем желающим слишком рискованно. Особенно, накануне выборов. Сервис может воссоздать голос любого человека, получив 15-секундный образец. Тем не менее, компания уже предлагает его бизнес-клиентам. Они обязаны предупреждать своих пользователей, что используют сгенерированный контент. 

Apple анонсировала первую языковую модель 

Она называется ReaLM (Reference Resolution As Language Modeling) и предназначена для смартфонов. LLM может улучшить работу голосовых помощников, и ее разработчики считают, что их прототип превосходит GPT-4 в некоторых задачах. В частности, ReaLM совершеннее в понимании контекста и интерпретации текстовых и визуальных элементов. Как скоро модель появится в открытом доступе, компания пока не сообщает. 

Казахстанский стартап CerebraAI переехал в США 

Компания известна IT-решением по выявлению инсультов, и ее разработкой пользуются 47 больниц в Казахстане. Недавно руководство стартапа решило перебазироваться в Кремниевую долину. Теперь будет базироваться в Silkroad Innovation Hub, где продолжит улучшать технологию для бесконтрастных систем КТ. Кроме того компании еще предстоит получить. Также компании предстоит получить лицензию от американских властей на внедрение своей системы в местных больницах.  

Казахстанец запустил AI-стартап по генерации видео и привлек $8 млн инвестиции 

Об успехах проекта Higgsfield AI казахстанца Ерзата Дулата и его партнера Алекса Машрабов на днях написал TechCrunch. Их стартап привлек инвестиции на pre-seed раунде от американского венчурного фонда Menlo Ventures.

Ерзат Дулат – AI-исследователь с фокусом на генерацию видео, а Алекс Машрабов – бывший топ отдела генеративного ИИ в Snap Inc. Несколько месяцев назад партнеры запустили платформу для генерации видео в приложении Diffuse для iOS и Android (нашли пока только iOS-версию). Сервис позволяет создавать и редактировать клипы на основе текстовых промптов и подсказок. Также в него можно загрузить селфи и получить реалистичное видео со своим участием. Видеоредактор пока доступен бесплатно и заточен на создание контента для соцсетей. 

Заглавное изображение: Unsplash