Министерство обороны Индии (МО) объявило 2025 год «Годом реформ», уделяя особое внимание новым технологиям, таким как робототехника, машинное обучение и искусственный интеллект (ИИ). Эта инициатива является логическим продолжением темы 2024 года – «Год технологического внедрения, расширение возможностей солдата».
Распространено мнение, что солдату требуется поддержка только на поле боя и во время боевых действий. Однако это не совсем так. Помощь солдату в различных небоевых задачах, таких как внутреннее администрирование, распределение бизнес-правил, логистика, закупки на уровне командования и бригады, переподготовка и обучение личного состава, военные игры, поисково-спасательные операции при стихийных бедствиях, военная доктрина и технологическая этика, значительно повышает эффективность вооруженных сил. Индийские вооруженные силы уже начали внедрять искусственный интеллект для решения небоевых задач. Но они не могут быть просто пользователями ИИ; необходимо использовать его способность развивать и укреплять национальный потенциал ИИ.
С момента своего создания в 2018 году Агентство оборонных проектов в области искусственного интеллекта (DAIPA) Министерства обороны Индии совместно с индийскими вооруженными силами разработало ряд специализированных инструментов ИИ, таких как чат-боты, аудиботы и видеоботы, которые используются в качестве виртуальных помощников солдат в небоевых ситуациях, не уступая аналогам в армиях других стран. В апреле 2024 года Южное командование индийской армии в рамках программы внедрения технологий создало чат-бот с искусственным интеллектом под названием SAMADHAN, который помогает офицерам отвечать на вопросы, связанные с государственными закупками и соответствующими политиками.
Другой чат-бот, созданный индийской армией, SAMBANDH, предназначен для помощи ветеранам войны и вдовам погибших военнослужащих, предоставляя им информацию и ответы на вопросы в режиме индивидуального общения. Подобно SAMADHAN и SAMBANDH, в 2023 году американская компания World Wide Technology Inc., предоставляющая услуги в области информационных технологий, представила SergeantAI, виртуального помощника на базе ИИ, который помогает солдатам, особенно сержантскому составу, соблюдать правила армии США.
Объединенный оперативный колледж Национального университета обороны Китая создал «Виртуального командира ИИ» – аватар реального китайского командира, который помогает солдатам младших званий в настольных симуляциях и виртуальных военных играх, когда реальный командир недоступен. Академия военных наук Народно-освободительной армии Китая (НОАК) также разработала чат-бот с искусственным интеллектом под названием ChatBIT, который помогает солдатам и сотрудникам разведки в проведении разведывательных операций и улучшении процесса принятия решений.
После внедрения виртуальных помощников на базе ИИ на первом этапе, второй этап предполагает создание специализированных больших языковых моделей (LLM) для оборонной сферы. В ноябре 2024 года американская компания Scale AI, специализирующаяся на ИИ, объявила о запуске Defense Llama, LLM, построенной на базе Llama 3 от Meta, которая адаптирована для выполнения задач национальной безопасности США, в частности, для проведения разведывательных операций, подготовки к контр-операциям и анализа уязвимостей противников.
Сообщается, что LLM Defense Llama была обучена на огромном массиве данных, включающем военные доктрины, политики Министерства обороны, руководства и этические принципы искусственного интеллекта. Конечными пользователями Defense Llama являются операторы платформ управления и контроля, разведывательные службы и системы поддержки принятия решений. НОАК, обладая опытом успешного использования собственной LLM DeepSeek V3, возможно, не захочет зависеть от Meta или других американских базовых моделей для своих военных приложений.
LLM на мандаринском языке, созданные китайскими компаниями, такими как Yi, Qwen, Baichuan, XVERSE, уже демонстрируют хорошие результаты в упрощенном мандаринском, традиционном мандаринском, языках китайских этнических меньшинств, таких как казахский, цзинпо, лхасский тибетский, а также в некоторых других восточноазиатских языках. НОАК может вскоре использовать свое превосходство в китайских языках для создания собственных оборонных LLM. Такие оборонные LLM на китайских языках могут быть использованы для решения широкого спектра небоевых задач в оборонной сфере. Исходя из этого, Министерству обороны Индии следует рассмотреть возможность поддержки создания специализированных многоязычных оборонных LLM на индийских языках.
Любая языковая модель ИИ обычно основана на таких параметрах, как онтологии, грамматика, лексика и корпуса, полученные из баз данных общеизвестных фактов, написанных на определенном разговорном и письменном языке. В зависимости от масштаба и размера баз данных определяются параметры модели. По состоянию на январь 2025 года современные LLM имеют до 1,56 триллиона параметров, основанных, разумеется, на базах данных на английском языке.
Однако Индия находится в выгодном положении, чтобы иметь лучшие в мире LLM на индийских языках, созданные в Индии. Для достижения такого преимущества важно предоставить этим LLM огромное количество параметров из богатых текстовых и аудиовизуальных данных, находящихся в распоряжении государственных учреждений. Министерство обороны, являясь крупнейшим работодателем в стране, могло бы инициировать собственную программу создания оборонных LLM на индийских языках, учитывая огромные объемы данных на индийских и английском языках, которыми оно располагает.
Несмотря на некоторый необоснованный скептицизм в отношении разработки собственных LLM в Индии, индийские компании, занимающиеся ИИ, имеют значительный потенциал для доминирования в нише индийских языков. В контексте данной статьи и ее идеи индийские языки включают хинди и другие 21 официальных языка страны.
Индийский стартап Sarvam 2B, занимающийся разработкой ИИ с открытым исходным кодом, создал небольшую языковую модель (SLM) на индийских языках, которая, хотя и основана на модифицированной архитектуре Llama, работает с индийскими языками гораздо лучше, чем модели от американских базовых SLM. Таким образом, если Министерство обороны решит выступить спонсором создания LLM на индийских языках – в качестве моделей с закрытым исходным кодом, учитывая конфиденциальность данных и сетевую безопасность – и предоставит свою огромную базу данных для настройки параметров, это не только приведет к созданию оборонной LLM с закрытым исходным кодом для внутреннего использования, но и будет способствовать широкому использованию индийских языков в других секторах. Но как Министерство обороны должно это сделать?
Первые серьезные шаги индийских военных в области повышения квалификации и наращивания потенциала в сфере новых технологий, включая ИИ, были объявлены в 2025 году, когда индийская армия заявила о планах по привлечению специалистов в области новых технологий с середины 2025 года через Армейский образовательный корпус, который недавно был переименован в Армейский корпус знаний и возможностей. Специалисты с высшим образованием будут приниматься на офицерские должности, а эксперты со степенью бакалавра – на должности младших офицеров.
В Министерстве обороны именно младший офицерский и сержантский состав, значительная часть гражданского персонала Министерства обороны, военнослужащие по программе «Агнивир», Территориальная армия и Национальный кадетский корпус генерируют и потребляют большие объемы официального контента и данных на индийских языках, в частности, на хинди. Это потребление и генерация данных соответствуют Закону об официальном языке 1963 года, и именно этот объемный контент, собранный за многие десятилетия во всех учреждениях Министерства обороны и других индийских государственных учреждениях, может быть оцифрован и использован для настройки параметров для оборонных LLM на индийских языках с закрытым исходным кодом. Разумеется, репозиторий данных на английском языке может быть переведен так же, как учебники по STEM-дисциплинам переводятся на хинди и другие индийские языки в рамках проекта AI Project Udaan, осуществляемого Индийским технологическим институтом Бомбея. Это еще больше увеличит количество параметров, что необходимо для LLM с богатым наполнением.
Армейский корпус знаний и возможностей мог бы создать экосистему в партнерстве с DAIPA, DRDO, частными компаниями, занимающимися ИИ, и гражданскими правительственными лабораториями. Если наши солдаты должны сражаться в войнах времени, пространства, силы и информации, если они должны быть «человеком в контуре» сложных систем, их знакомство с работой систем ИИ имеет решающее значение. Система ИИ, с которой они работают, должна работать на том языке, на котором они думают и говорят.
Кроме того, оборонная LLM на индийских языках могла бы также принести пользу проекту Udbhav – программе индийской армии по синтезу древних знаний о ведении войны, государственном управлении, исторических миссиях и этике с современными военными операциями. Включение таких текстов на санскрите и других индийских языках в учебную программу Командования подготовки армии и Колледжа управления обороной окажет огромное влияние на расширение возможностей солдат. LLM на индийских языках станет важной вехой на пути к выполнению существующего обязательства индийского правительства по продвижению индийских языков.