Найдешевша топова відеонейронка 2026: тестуємо Grok Imagine Video 1.5

17 червня xAI випустили Grok Imagine Video 1.5 у відкритий доступ. Модель одразу обійшла в рейтингу Seedance 2.0, Kling і Veo 3.1 — і це при ціні, яка в 7 разів нижча за тарифи OpenAI.
Ми проаналізували можливості і протестували модель на реальних задачах — результати у статті.
Чим цікава Imagine Video 1.5
Головне що з’явилось у 1.5 — нативне аудіо. Діалоги, ліпсинк і звукові ефекти генеруються разом без окремого пост-продакшну. Раніше це була додаткова задача — треба було склеїти відео з аудіо вручну або через сторонні сервіси.
Базова механіка — image-to-video: треба дати стартовий кадр і описати рух, модель анімує сцену з урахуванням фізики, руху камери і атмосфери. Кожен кадр генерується послідовно на основі попередніх, що дає стабільні рухи і більш-менш плавну картинку.
6-секундний кліп у 720p генерується приблизно за 25 секунд. За даними xAI, це в 2-4 рази швидше за конкурентів. Для тих, хто тестує десятки варіантів креативів — різниця відчутна. Максимальна тривалість кліпу — 15 секунд за один прохід. Довші сцени збираються через Extend from Frame: модель продовжує відео від фінального кадру попереднього кліпу, зберігаючи освітлення і рух.
Якість поки 720p, 24fps, 1080p ще не додали. В інтерфейсі з’явились три нові фічі: папки у лівому сайдбарі, кілька генерацій паралельно і пошук по архіву без ручного скролу.

По факту, поки це найдешевша топова модель на ринку. Поточний рейтинг ставить Grok Imagine 1.5 вище Seedance 2.0, Kling 3.0 і Veo 3.1 у тестах від реальних юзерів.
Тести Grok Imagine Video 1.5
Протестувати нейронку можна через офіційний сайт на комп’ютері та через мобільний застосунок. Без оплаченого тарифу генерація відео недоступна. Одне відео через fal.ai на 15 секунд обійдеться в $0.84, а підписка SuperGrok коштує від $30 на місяць. Якщо не потрібен AI-агент, вибір формату роботи очевидний.

При підготовці статті ми використовували Replicate, де немає міндепу і одна секунда відео коштує 0.008$. Відео на 15 секунд обходиться приблизно в $1.5.
Промпт під нутру
(0-4s) Extreme close-up of a woman’s face — tired eyes, dull skin, no makeup. She sighs. Kitchen background, morning light. A white supplement bottle sits blurred in the foreground.
(4-8s) Time-lapse dissolve — same woman, same kitchen, 30 days later. Skin glows, eyes bright, she smiles naturally. The bottle now in sharp focus — label readable, nearly empty.
(8-12s) Medium shot — she steps on a scale, looks down, looks up with a genuine smile. Not overdone. Real.
(12-15s) Slow push-in to the supplement bottle on the counter. Clean white label, green accent. Morning sunlight hits it. Ambient uplifting music swells softly. Single text overlay fades in: «30 days. Real results.»
Audio: soft ambient morning sounds, birds, subtle motivational swell. No voiceover.
Результат вийшов непоганим, але на деяких кадрах відео стискається і виглядає трохи крінжово.
Промпт під гемблу
(0-3s) Guy on a couch late at night, phone in hand. Screen shows Chicken Road — chicken jumping across frying pans. He leans in, tense. Low beat starts.
(3-7s) Chicken lands the last pan — x47 multiplier flashes. He shoots up from the couch, both hands in the air. «NO WAY!» Face — pure shock turning into a huge grin.
(7-10s) Close-up of phone screen. Coins cascade, balance ticking up in real time. He tilts the phone toward camera — balance visible. Coin sounds, celebration jingle kicks in.
(10-13s) He looks straight at camera, points at the phone. «Bro. Just play it.» Laughs. Thumbs up.
(13-15s) Cut to black. Chicken Road logo center frame. Text fades in:
«Think you can go further?»
«Play now →»
Single punchy audio sting on cut to black.
Audio arc: low tension beat (0-6s) → sharp win sound (7s) → coin cascade + celebration (7-10s) → casual laugh (10-13s) → one clean final sting (13-15s).
Результат під гемблу вийшов на аналогічному рівні. Якщо дивитися на відео очима звичайного користувача, то воно точно пробиває банерну сліпоту.
Промпт під крипту
(0-4s) Extreme close-up — green candles pumping on a dark trading screen. Numbers climbing. Reflection of the chart visible in someone’s eyes. Tense ambient electronic hum builds slowly.
(4-8s) Camera pulls back — young guy in a modern apartment, city lights through floor-to-ceiling windows behind him. He’s still, focused. One hand on the desk. Chart still rising on screen.
(8-11s) Phone buzzes on the desk. He glances down — push notification: «Your position is up 340%». He exhales slowly. Leans back. Half-smile. Not screaming — just knowing.
(11-13s) Close-up of phone screen — portfolio balance, green across the board. His thumb hovers over «Withdraw». Single clean notification ping cuts through the music.
(13-15s) Cut to dark background. Minimal logo center. Text appears:
«The move was obvious.
Were you in?»
«Start trading →»
Low electronic sting fades out.
Audio arc: dark ambient build (0-8s) → phone buzz (8s) → single notification ping (11s) → clean fade to silence with final sting (13-15s).
Під крипту ролик вийшов би плюс-мінус ідеальним, якби не повторні проблеми з форматом та вступний кадр.
Промпт під товарку
(0-3s) White box on a clean white surface, soft studio light. Hands enter frame — deliberate, unhurried. Fingers find the pull tab. Satisfying paper-on-paper sound as the lid slides off.
(3-7s) First reveal — iPhone 17 Pro lying in white foam. Camera slow push-in. Titanium finish catches the light. No rush. Just the phone and the silence before the music hits.
(7-10s) Hands lift the phone. Rotate it slowly — side profile, back camera block, front screen. Each angle held for a beat. Screen lights up automatically. Soft chime. Studio light reflects off the chassis like jewelry.
(10-12s) Phone placed center frame, screen facing camera. Wallpaper glows. Close-up on the camera lens cluster — sharp, premium, cinematic rack focus.
(12-15s) Cut to white background. iPhone 17 Pro silhouette. Text fades in clean:
«New drop. Zero compromises.»
«Get yours now →»
Gentle product reveal music swells and cuts clean.
Audio arc: paper unboxing ASMR (0-3s) → near silence with soft ambient (3-7s) → single chime on screen wake (7s) → music swell (10-15s) → clean cut.
На думку редакції, у цьому випадку нейронка впоралася із задачею найкраще, але є пару моментів, де рухи виглядали неприродньо. В цілому, результат заслуговує уваги і тесту на реальних промптах.
Підсумки
Grok Imagine Video 1.5 — поки не виглядає як революція у світі відеогенерацій, але це реально топовий інструмент для швидкого тесту відеокреативів. За $1-1.5 на Replicate можна отримати 15-секундний кліп, який за якістю обходить більшість AI-відео.
Основна проблема поки — нестабільний формат на деяких кадрах і артефакти. Але це можна пофіксити зміною налаштувань та ітераціями.










Відгуки (0)
Ще немає відгуків!