Microsoft нарешті взялися за 7B інтелектуального агента, Fara-7B безпосередньо дивиться на зображення, керує браузером, MIT відкрили код — це досить цікаво

Переглянути оригінал
MeNews
Microsoft випустила першу модель інтелектуального агента для управління комп’ютером з 7 мільярдами параметрів Fara-7B
AIMPACT повідомлення, 16 травня (UTC+8), Microsoft випустила Fara-7B, це її перша 7B параметрична інтелектуальна модель, спеціально розроблена для сценаріїв використання комп’ютера. Ця модель використовує архітектуру мультимодального декодера, здатна приймати знімки екрана та текстовий контекст, безпосередньо прогнозуючи параметризовані ланцюги мислення та операційні дії. Побудована на основі Qwen 2.5-VL (7B), підтримує довжину контексту 128k, тренувалася протягом 2.5 днів на 64 GPU H100, випущена під ліцензією MIT 24 листопада 2025 року. Fara-7B через знімки екрана сприймає введення браузера, поєднуючи внутрішнє мислення та запис історичних станів для прогнозування наступних дій та параметрів (наприклад, координат кліку), тренування базується на масштабному повністю синтезованому наборі даних. Модель здатна планувати та виконувати складні завдання (наприклад, бронювання ресторану, подача заявки на роботу, планування
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено