Google офіційно виходить на стежку війни з Nvidia у сегменті інференсу (процесу виконання запитів уже навченою моделлю). На конференції Cloud Next у Лас-Вегасі компанія презентувала нове покоління TPU (Tensor Processing Units), фокусуючись на швидкості роботи чат-ботів та ШІ-агентів. Це не просто оновлення «заліза», а стратегічний зсув: ринок переходить від енерговитратного навчання моделей до їх масового практичного застосування. Google стає єдиним гравцем, який контролює весь стек — від софту до напівпровідників.
Кремнієва автономія: Google масштабує випуск власних ШІ-чипів
Експансія TPU: Anthropic та Meta вже в черзі за потужностями
Google робить ставку на спеціалізацію, розділяючи залізо для навчання моделей і для інференсу. Це логічний крок: інференс вимагає миттєвої реакції, тоді як навчання — величезної пропускної здатності пам'яті. Головний науковець Google Джефф Дін підтверджує, що така диверсифікація критична для підтримки масштабу сучасних ШІ-сервісів (за даними Bloomberg). Компанія вже має 10-річний досвід розробки власних процесорів, що дозволяє їй уникати дефіциту, з яким стикаються покупці топових H100 від Nvidia.
Попит на рішення від Google демонструє реальний масштаб гри:
Anthropic забронювала доступ до 1 млн TPU для роботи своїх моделей Claude.
Meta підписала багаторічний контракт на мільярди доларів для використання інфраструктури Google Cloud.
Citadel Securities та G42 вже тестують нові потужності для фінансового моделювання та обробки даних (за даними компаній).
Для користувача це означає, що відповіді ШІ стануть дешевшими та швидшими. Для індустрії — це прецедент «вертикальної інтеграції», де хмарний провайдер перестає залежати від зовнішніх постачальників чипів, замикаючи прибуток всередині власної екосистеми.
DNS ШІ-індустрії: Чому Google Cloud стає головним хабом
Історично Nvidia домінувала завдяки CUDA (платформі для паралельних обчислень), яка стала стандартом для розробників. Але Google руйнує цю монополію, дозволяючи використовувати сторонні фреймворки, як-от PyTorch, на своїх TPU. Ба більше, компанія почала тестувати розміщення своїх чипів безпосередньо в дата-центрах клієнтів, виходячи за межі власної хмари.
Аналітики ETFocus вбачають у цьому чіткий сигнал: ми спостерігаємо «комодитизацію» обчислювальних потужностей. Якщо раніше Nvidia могла диктувати ціни через дефіцит, то тепер Google створює життєздатну альтернативу. Це нагадує перехід традиційних банків від закупівлі серверів IBM до використання гнучких хмарних рішень: контроль над «залізом» стає головною конкурентною перевагою у TradFin (традиційних фінансах) та криптосфері.
Ера ШІ-агентів та майбутнє ринку обчислень
Ринок ШІ остаточно зміщується від фази «ми будуємо велику модель» до фази «ми запускаємо мільйон мікросервісів». Саме тут інференс стає ключовим полем битви. Витрати на підтримку роботи ШІ (inference costs) вже зараз починають перевищувати витрати на його розробку. Для криптопроєктів, що впроваджують ШІ для аналізу мереж або автоматизації трейдингу, це означає зниження бар'єру входу.
Успіх Google змушує Nvidia реагувати: компанія Дженсена Хуанга вже представила нові чипи, заточені під швидкий інференс, але у Google є фора у вигляді інтегрованих сервісів Cloud Next. Це протистояння прискорить розвиток AI-fintech рішень, де швидкість виконання ордера або аналізу ризиків вимірюється мілісекундами.
Google перетворюється з софтверного гіганта на повноцінного напівпровідникового важковаговика, створюючи реальну загрозу домінуванню Nvidia. Переможцем у цій битві вийде той, хто забезпечить найнижчу вартість одного токена (одиниці тексту/даних) при максимальній швидкості видачі.
А поки Google масштабує залізо для ШІ-агентів, Coinbase уже тестує їх на місці живих менеджерів — розбираємо кейс у свіжому матеріалі "Coinbase замінює менеджмент ШІ-агентами".