Llama 4: встречайте новую модель искусственного интеллекта от Meta

7 апреля 10:11

Компания Meta Platforms представила новейшие версии своей большой языковой модели (LLM) — Llama 4 Scout и Llama 4 Maverick. Эти релизы являются частью стратегии технологического гиганта по усилению своих позиций на рынке искусственного интеллекта, сообщает Коммерсант украинский со ссылкой на Reuters.

По информации от Meta, новые модели относятся к мультимодальным системам искусственного интеллекта. Такие системы способны обрабатывать и интегрировать различные типы данных, включая текст, видео, изображения и аудио, а также конвертировать содержимое между этими форматами.

В своем официальном заявлении компания охарактеризовала Llama 4 Scout и Llama 4 Maverick как «самые совершенные модели на сегодня» и «лучшие в своем классе по мультимодальности». Meta также подчеркнула, что обе модели будут выпущены с открытым исходным кодом, что позволит разработчикам со всего мира использовать и совершенствовать их.

Кроме того, Meta анонсировала предварительный обзор Llama 4 Behemoth, которую компания называет «одной из самых умных LLM в мире и самой мощной на сегодня», которая будет служить как «учитель» для новых моделей компании.

Выпуск новых моделей происходит на фоне агрессивных инвестиций крупных технологических компаний в инфраструктуру искусственного интеллекта после успеха ChatGPT от OpenAI, который существенно изменил технологический ландшафт и стимулировал значительные вложения в машинное обучение.

По сообщению издания The Information, опубликованным в пятницу, Meta ранее отложила запуск новейшей версии своей LLM из-за того, что во время разработки Llama 4 не соответствовала ожиданиям компании по техническим показателям, особенно в задачах по логическому мышлению и математике. Также сообщалось, что компания была обеспокоена тем, что Llama 4 оказалась менее способной, чем модели OpenAI, в проведении голосовых разговоров, подобных человеческим.

Meta планирует потратить до 65 миллиардов долларов в этом году на расширение своей инфраструктуры искусственного интеллекта, что происходит на фоне давления со стороны инвесторов на крупные технологические компании по демонстрации прибыльности их инвестиций.

Читайте нас у Telegram: головні новини коротко

Что такое LLM (Large Language Model)

LLM (Large Language Model) — это тип искусственного интеллекта, который относится к большим языковым моделям, обученным на огромных объемах текстовых данных для понимания, генерации и обработки человеческой речи. Эти модели используют архитектуру трансформеров и миллиарды или даже триллионы параметров для анализа контекста и генерации релевантных ответов. Современные LLM, такие как GPT (от OpenAI), Llama (от Meta), Claude (от Anthropic) и другие, могут писать тексты, отвечать на вопросы, обобщать информацию, переводить между языками и выполнять многие другие задачи, связанные с обработкой естественной речи.

Процесс обучения LLM включает этап предварительной тренировки (pre-training), во время которого модель обрабатывает огромные массивы текстов из интернета, книг, статей и других источников, изучая статистические закономерности языка и накапливая знания о мире. После этого многие модели проходят этап настройки (fine-tuning) с использованием методов обучения с подкреплением с помощью обратной связи от человека (RLHF), чтобы сделать их более полезными, точными, безопасными и согласованными с человеческими ценностями и потребностями.

С развитием технологий, современные LLM эволюционировали от простых текстовых моделей до мультимодальных систем, которые могут работать не только с текстом, но и с изображениями, аудио, видео и другими типами данных. Это расширяет их возможности и позволяет использовать их для создания контента, программирования, анализа данных, автоматизации бизнес-процессов, образования, развлечений и многих других отраслей. Несмотря на впечатляющие возможности, LLM имеют ограничения, в частности возможность галлюцинаций (выдача ложной информации), предвзятость, зависимость от качества учебных данных и этические вызовы, связанные с их использованием.

Читайте нас у Telegram: головні новини коротко

Дзвенислава Карплюк
Редактор