Látványosan felgyorsult a verseny az AI-képgenerálás piacán. A Microsoft szerint az új MAI-Image-2.5 modelljük már felzárkózott a Google Nano Banana 2 rendszeréhez, legalábbis a népszerű Arena leaderboard eredményei alapján. A modell jelenleg a harmadik helyen áll a szövegből képet generáló rendszerek rangsorában. A hírről a The Decoder számolt be.
A Microsoft egyre komolyabban építi a saját AI-modelljeit
A MAI (Microsoft AI) modellcsalád eredetileg inkább háttérprojektnek tűnt, mostanra viszont egyértelművé vált, hogy a vállalat saját AI-stack építésén dolgozik — részben az OpenAI-függőség csökkentése miatt is.
A most bemutatott MAI-Image-2.5 a Microsoft szerint:
- pontosabb promptkövetést,
- jobb szövegmegjelenítést,
- erősebb stilizált illusztrációkat,
- valamint konzisztensebb fény- és térkezelést kínál az előző verziókhoz képest.
A vállalat főként:
- reklámgrafikákhoz,
- brandanyagokhoz,
- termékfotókhoz,
- és professzionális kreatív workflow-khoz pozicionálja a modellt.
A Nano Banana továbbra is az egyik legerősebb rivális
A Google „Nano Banana” néven ismert modellje valójában a Gemini 3.1 Flash Image rendszerre épül, amelyet a Google gyors, alacsony késleltetésű képgenerálásra optimalizált.
A Nano Banana 2 egyik legnagyobb erőssége:
- a karakterkonzisztencia,
- a multi-image fusion,
- valamint a gyors iteráció.
A Google szerint a rendszer:
- képes több kép intelligens kombinálására,
- természetes nyelvű lokális szerkesztésre,
- és erős „world knowledge” alapú képgenerálásra is.


Prompt:
A breathtaking ultra-realistic photograph of the Tree of Life — an enormous, ancient tree with a massive, gnarled trunk and sprawling roots, its canopy filling the sky with golden light filtering through the leaves. In the foreground, a couple walks hand in hand toward the tree along a soft meadow path, slightly backlit by warm sunset light. The woman leans her head gently against the man’s shoulder, their steps slow and unhurried. Their silhouettes are partially outlined in golden-hour glow, clothes slightly windswept. The scene radiates warmth, tenderness, and timelessness. Soft bokeh background, cinematic depth of field, shot on a Sony A7R IV with a 35mm lens, f/1.8, golden hour lighting, photorealistic, 8K resolution, no filters, natural colors with warm amber and soft green tones.
Az OpenAI továbbra is előrébb jár
Bár a Microsoft és a Google közötti különbség egyre kisebbnek tűnik, az Arena leaderboard alapján az OpenAI képgeneráló rendszere továbbra is az első helyen áll.
Ez azért különösen érdekes helyzet, mert:
- a Microsoft közben továbbra is az OpenAI egyik legfontosabb partnere,
- ugyanakkor párhuzamosan saját foundation modelleket is fejleszt.

Az elmúlt hónapokban egyre több jel utalt arra, hogy a redmondi vállalat hosszabb távon szeretné csökkenteni a külső AI-modellektől való függését.
A képgenerálás lett az AI-piac új frontvonala
2026-ra az AI-verseny már messze nem csak chatbotokról szól.
A nagy szereplők:
- saját multimodális rendszereket,
- videógenerálást,
- agentic workflow-kat,
- és professzionális kreatív eszközöket építenek.
Közben a képgeneráló modellek egyre fontosabb szerepet kapnak:
- reklámiparban,
- játékfejlesztésben,
- dizájnban,
- marketingben,
- és tartalomgyártásban is.
A MAI-Image-2.5 ezért nem egyszerű technológiai frissítés — hanem annak a jele, hogy a Microsoft már saját jogon is komoly szereplő akar lenni a generatív AI-piacon.