Sora, Gemini 1.5 и PlayStation Network: главные техноновости к середине февраля

OpenAI продемонстрировала модель для генерации видео Sora

Она позволяет генерировать одноминутные видео на основе текстовых заданий пользователя. С 15 февраля компания открыла доступ к программе для тестировщиков и нейродизайнеров. Sora умеет создавать сложные сцены с несколькими персонажами, реалистичными движениями и деталями объектов и фона. Кроме того, она способна анимировать статичные изображения и дополнять существующие ролики.

Без ограничений тоже не обошлось. Например, в точном моделировании физики в сложных сценах. Еще модель не всегда корректно понимает причинно-следственные связи и может путаться в направлении движения. В скором будущем OpenAI планирует разработать инструменты для выявления сгенерированного нейросетями видеоконтента. Также она будет проверять текстовые промпты и сгенерированные ролики на соответствие этических нормам. 

NVIDIA разработала чат-бот для ПК, работающий  без подключения к интернету

Chat with RTX использует генеративный ИИ и работает на основе мощной языковой модели, позволяя выбирать одну из двух LLM: Mistral или Llama 2. В отличие от аналогов чат-бот работает локально на компьютере. Он способен отвечать на вопросы, анализируя документы, сохраненные на ПК. Пользователь может предоставить ему доступ к различным форматам документов, таким как txt, pdf, doc, docx и xml. Для использования Chat with RTX необходимо иметь операционную систему Windows 11, не менее 16 ГБ оперативной памяти, а также видеокарту из линейки RTX 30 или 40 с объемом видеопамяти не менее 8 ГБ.

Google представила Gemini 1.5

LLM cпособна обрабатывать несколько часов видео и пока доступна только для разработчиков и корпоративных пользователей. Google позиционирует Gemini 1.5 как полезный инструмент для бизнеса и личного использования. Она обладает огромным контекстным окном, что позволяет модели обрабатывать более сложные запросы и анализировать значительно больше информации одновременно. Оно включает в себя колоссальные 1 миллион токенов. Это значительно больше по сравнению с 128 000 в GPT-4 и 32 000 в предыдущей версии Gemini Pro.

Сундар Пичаи, генеральный директор Google, поясняет: «Это, например, 10 или 11 часов видео или десятки тысяч строк кода». Также AI-исследователи тестируют контекстное окно с 10 миллионами токенов, что сравнимо с просмотром всех серий «Игры престолов» одновременно. В перспективе нейросеть может оказаться чрезвычайно полезной для бизнеса. Например, компании смогут использовать Gemini для одновременного анализа множества финансовых записей.

В перспективе новая LLM будет доступна на gemini.google.com, заменив предыдущую модель, а версия 1.5 Pro будет обладать контекстным окном в 128 000 токенов. Для доступа к миллиону токенов потребуется дополнительная оплата. Также Google активно проверяет безопасность модели и ее этические аспекты.

Group-IB выявила новый вирус, нацеленный на iOS

iOS

Он занимается кражей биометрических данных, документов и SMS. Вредоносный код получил название GoldPickaxe.iOS. Его создание присваивают китайскому хакеру с псевдонимом GoldFactory, известному своими сложными банковскими троянами. Злоумышленники используют похищенную биометрию для создания дипфейков и подмены лиц. Этот метод позволяет киберпреступникам получать доступ  к банковским счетам жертв. GoldFactory преимущественно ориентирован  на Таиланд и Вьетнам. 

Евгений Чебатков подписал петицию по внесению Казахстана в PlayStation Network (PSN) 

Участие стендап-комика помогло собрать 1000 новых подписей за один день. Инициаторы этой акции хотят привлечь внимание компании Sony, чтобы у казахстанских пользователей появился доступ к новым сервисам. Для этого они нацелились набрать 50 тысяч подписей. Пока их более 5 тысяч – или 11% от нужного числа, но в последние недели темп ускорился. Ранее казахстанские пользователи оставили 40 тысяч комментариев и около 150 тысяч лайков под одним из постов в Instagram-аккаунте PlayStation.

Автор: Роман Лукьянчиков