Нынешние нейросети вроде Claude или ChatGPT «функциклируют» по весьма небыстрой схеме: пользователь пишет «промпт», он улетает куда-то за тысячи километров в огромный дата-центр, там обрабатывается там и потом возвращается обратно. Это занимает секунды, но ИИ следующих поколений такая схема — слишком медленная и небезопасная.
Поэтому технологии ИИ уже — на пороге большого сдвига, все самые нужные для эффективной работы алгоритмы скоро «переедут» на персональные устройства конечных пользователей.
Не пропустите! Рынок технологий ИИ: когда он станет китайским?
Три причины уйти из облака
Скорость — это главный двигатель перемен в сфере ИИ. Если новый ИИ, к примеру, в умных очках должен предупредить о препятствии на дороге, то у него нет ни одной лишней секунды на общение с сервером. Реакция должна быть мгновенной.
Второй критический фактор — конфиденциальность данных. Одно дело — просить нейросеть сочинить стишок, и совсем другое — доверять облаку свои банковские счета или медицинские показатели. Локальный ИИ позволяет хранить все персональные данные в зашифрованном виде на самом смартфоне, не раскидывая их по Сети.
Наконец, это банально дешевле. Содержание гигантских дата-центров обходится в миллиарды. Если переложить часть работы на процессоры смартфонов, разработчики получат возможность быстрее масштабировать сервисы без космических затрат на электричество и «железо».

ИИ — уже в смартфонах, но это только начало
Локальный ИИ — давно не новость. Еще в 2017 году Face ID в iPhone работал на базе нейросетей прямо в самом устройстве. Разница в том, что современные чипы вроде Apple A-серии или Google Tensor G5 стали на порядок мощнее. Они позволяют запускать компактные языковые модели вроде Gemini Nano прямо «на борту».
У таких моделей (пока только 3 млрд параметров против сотен миллиардов у облачных гигантов) узкая специализация. Они не обязаны знать все на свете — их задача быстро и эффективно обрабатыаать сообщения, искать информацию в письмах или распознавать объекты на фото без интернета.
Не пропустите! ИИ генерирует триллионы долларов нового долга
Проблема «перегрузки» и гибридный подход
Пока что даже самые мощные смартфоны не могут тянуть все задачи. Когда запрос слишком сложен, устройство обращается к облаку. Здесь кроется главная техническая задача: как сделать этот переход безопасным?
Решения уже есть. Apple использует технологию Private Cloud Compute — данные отправляются на их серверы временно, не сохраняются там и недоступны даже самой компании. Это попытка усидеть на двух стульях: использовать мощь облака, сохранив приватность локального устройства. Однако попытка не бесперспективная.
Не пропустите! Perplexity AI: как «ответ-движок» меняет подход к поиску информации
Всего через каких-то 5 лет…
Есть вполне обоснованное научное мнение, что идеальная модель для ИИ — это человеческий мозг, который не отправляет задачи на «внешний сервер», а обрабатывает все внутри.
Сейчас смартфоны отлично справляются с простой классификацией изображений за доли секунды, но пасуют перед сложным отслеживанием объектов в реальном времени.
Поэтому в ближайшие пять лет эволюция двинет сразу двумя путям: «железо» будет активнее затачиваться под нейросети, а алгоритмы станут более эффективными и менее жадными до ресурсов.
В перспективе это даст устройства, которые смогут в реальном времени подсказывать контекст разговора с собеседником или буквально вести за руку по улице, анализируя каждый ваш шаг.
ИИ очень скоро перестанет быть «старым» чат-ботом, с которым нужно переписываться. Он превратится в невидимый слой реальности, работающий быстро, анонимно и прямо у вас в кармане. Что отчасти даже пугает. Но это уже совсем другая история…
Не пропустите! Автономные ИИ-агенты: борьба за контроль уже началась