Стандартный подход к спутниковым снимкам заключается в том, чтобы делать огромные партии изображений и передавать их обратно на Землю, где они могут быть проанализированы людьми-операторами и лучшими доступными алгоритмами.
До сих пор все работало хорошо, но время, пропускная способность передачи и необходимая энергия начинают становиться узкими местами. Современные спутники просто захватывают больше пикселей, чем у ученых есть время рассмотреть.
Однако спутник YAM-9 только что сделал нечто иное: он идентифицировал и описал особенности на сканированных изображениях без необходимости сверяться с наземным контролем.
Мало того, ему можно давать инструкции с помощью естественных подсказок, которые вы можете использовать с помощью Google Gemini или Siri, например «найдите мне все железнодорожные узлы в этой стране».
Прогресс достигается благодаря программе НАСА под названием NAVI-Orbital, разработанной исследователями Лаборатории реактивного движения НАСА (JPL) и технологическим стартапом Loft Orbital.
«Задание спутнику на распознавание новой функции исторически требовало написания последовательностей команд, повторной проверки бортового программного обеспечения и передачи новых двоичных файлов», — пишут исследователи в своем препринте arXiv, который еще не прошел рецензирование.
«В соответствии с парадигмой NAVI-Orbital перенацеливание сводится к редактированию и загрузке нового запроса. Это сокращает цикл повторного задания и расширяет возможности набор потенциальных авторов задач, помимо тех, кто обладает специализированным опытом работы с последовательностями команд».
В большинстве случаев, когда вы взаимодействуете с чат-ботом на базе искусственного интеллекта, таким как Claude или ChatGPT, ваши запросы отправляются в энергоемкие центры обработки данных, где они обрабатываются и отправляется ответ.
Если вместо этого разместить модели искусственного интеллекта на устройстве, обработка происходит намного быстрее без этих обратных действий, а если вы спутник, это означает меньшую потребность в земле
«Обычно пользователь должен дать задание спутнику с помощью API, дождаться сбора изображений и нисходящей связи, а затем проанализировать изображение с помощью предварительно обученного алгоритма на земле», — рассказала журналу ScienceAlert старший менеджер по маркетингу Loft Orbital Сара Престон.
«Этот ИИ действительно может «видеть» то, что находится на изображении, и идентифицировать то, что ищет аналитик, например, мосты, шоссе, определенные водоемы или признаки стихийных бедствий, таких как наводнения и т. д. лесные пожары.»
При использовании этого спутника локально установленным ИИ является Google DeepMind Gemma 3, серия «легких» моделей, которые достаточно малы для работы на ноутбуках. Это модель языка видения (VLM), что означает, что она обрабатывает как текст, так и Изображения.
Важно отметить, что он может работать на небольшом спутнике, где физический размер, энергопотребление и вычислительная мощность должны тщательно контролироваться.
«Этот конвейер организован с помощью многоагентной архитектуры, состоящей из трех автономных агентов, которые передают работу друг другу: оркестратора, который координирует выполнение, детектора, который анализирует, классифицирует и суммирует изображения, и диалогового агента, который позволяет операторам задавать вопросы о результатах», — пишут в отчете. исследователи.
Другими словами, технические специалисты могут задавать вопрос программному обеспечению спутника, а не программировать его для каждого отдельного задания.
«Такая конструкция позволяет NAVI адаптироваться к различным миссиям без необходимости перестройки с нуля».
В ходе наземных базовых испытаний система смогла широко распознать то, что было примерно на 7960 изображениях с точностью 88,2 процента, классифицируя их по таким категориям, как жилые районы, пляжи, сельскохозяйственные зоны и горы.
На данный момент на орбите было выполнено только две живые съемки, и запланировано еще больше.
В будущем этот вид технологии может найти применение далеко за пределами околоземной орбиты. Простой и быстрый подход быстрого анализа, подобный показанному здесь, можно использовать с марсоходами, исследующими поверхность Луны или Марса.
«Мы думаем: хорошо, у вас есть астронавты. В герметичных скафандрах, и вы знаете, что они не могут стучать по клавиатуре, все, что они хотят сделать, сложно», — рассказал старший системный инженер Хуан Дельфа Виктория Тиму Фернхольцу в TechCrunch.
«Итак, как насчет того, чтобы предоставить помощника, как в видеоиграх и в фильмах, где вы видите интерактивный искусственный интеллект?»
При наличии около 100 спутников, таких как YAM-9, можно обеспечить покрытие в реальном времени по всей нашей планете, говорят исследователи. Лофт Orbital, безусловно, нацелена на предоставление такой услуги.
«Идея состоит в том, чтобы спутники работали вместе для непрерывного и глобального мониторинга в реальном времени, чему будет способствовать рынок агентов искусственного интеллекта», — сказал Престон.
По большому счету, спутниковые снимки не нужно было бы отправлять обратно на Землю, чтобы выяснить, что изображено, если бы такая технология была развернута. Это могло бы быть полезно для всего: от отслеживания дыма от лесных пожаров до мониторинга необычной активности в портах или границах. в режиме реального времени.
Конечно, это также потенциально вызывает беспокойство с точки зрения уровня наблюдения, которое это повлечет за собой.
«Компания работает над масштабированием этих возможностей, поддерживая миссии, которые требуют быстрого и оперативного принятия решений, будь то гражданские, коммерческие или оборонные случаи использования», — сказал Престон ScienceAlert.
«Цель состоит в том, чтобы спутники работали как непрерывный наблюдатель — вы приказываете ему контролировать береговую линию на предмет разливов нефти. или отметьте новое строительство возле границы. Спутник будет оценивать то, что он видит, и сообщать об этом только в том случае, если что-то соответствует этим критериям».
По теме: Спутник НАСА показывает, насколько быстро тонет Мехико
Еще есть возможности для улучшения с точки зрения точности и надежности, а также огромные вопросы относительно этики передачи ИИ интерпретации важных изображений на аутсорсинг.
Исследователи не исследовали, что может произойти, если будут введены какие-либо «противоречивые подсказки», поэтому их результаты должны «поэтому» следует рассматривать как технико-экономическое обоснование, а не как характеристику надежности», — заключают они.
Несмотря на эти препятствия, исследователи уверены, что эта революционная технология скоро станет нормой.
«Она открывает двери для постоянно работающих слоев патрулирования в космосе», — рассказал TechCrunch руководитель отдела искусственного интеллекта Loft Orbital Пол Лассерр.
Отчет об исследовании доступен на сервере препринтов arXiv.
Эта статья была проверена Джессом Кокериллом и отредактирована Клэр Уотсон. Мы гордимся своим процессом, но мы всего лишь люди. Если вы заметили ошибку, сообщите нам об этом.
Резервуар с чистейшей водой, погребенный под километровыми камнями в Онтарио, Канада, вспыхнул, когда едва заметные…
Из всех странных миров в нашей галактике Млечный Путь одни из самых загадочных — те,…
Обнаруженная в далекой Вселенной массивная структура бросает вызов нашему пониманию того, как развивалась Вселенная.В 2024…
НАСА вскоре попытается сделать то, чего никогда раньше не делало: спасти космический телескоп от падения…
Подумайте о последнем смартфоне, планшете или умных часах, которыми вы перестали пользоваться.Скорее всего, он не…
Невероятно чужие миры будоражат наше коллективное космическое воображение, как ничто другое.Это бесконечное разнообразие включает в…