Spoločnosť OpenAI oznámila uvedenie svojho najnovšieho modelu o3 mini a jeho výkonnejšej verzie o3 mini high. Nový model prináša významné zlepšenie v oblasti programovania, matematiky a logických úloh a je dostupný zadarmo v službe ChatGPT. Platené verzie umožňujú prístup k vyššej výpočtovej kapacite a tá bezplatná má určité obmedzenia. Aké sú hlavné novinky tohto modelu a ako sa mu darí oproti konkurentom ako DeepSeek R1 či Claude 3.5 Sonnet?
OpenAI uvádza, že o3 mini prináša rýchlejšie odpovede ako jeho predchodca o1 mini a zároveň dosahuje vyššiu presnosť. Model je navrhnutý tak, aby exceloval v úlohách vyžadujúcich krokové logické uvažovanie, čo zahŕňa napríklad zložité matematické problémy alebo analýzu programového kódu. Zároveň obsahuje tzv. „reťazec myslenia“, čo znamená, že model pri odpovedi reflektuje vlastné úvahy a dokáže jasne vysvetliť svoj postup.
Tento princíp spočíva v tom, že model najprv rozdelí problém na menšie kroky, analyzuje jednotlivé časti samostatne, vykoná vnútorné výpočty a potom na základe tejto postupnej analýzy zostaví finálnu odpoveď. Vďaka tomu je možné lepšie pochopiť, ako AI dospela k svojmu záveru, a zároveň sa zvyšuje presnosť a konzistencia odpovedí.
Podľa benchmarkových testov OpenAI model o3 mini zodpovedá až o 24 % rýchlejšie ako o1 mini a v rade úloh dosahuje vyššiu presnosť. Medzi platenými verziami je potom k dispozícii aj o3 mini high, ktorý je optimalizovaný pre zložité programátorské a logické úlohy.
V praxi sa toto zlepšenie prejaví napríklad pri riešení zložitých matematických úloh, kde model teraz dokáže efektívnejšie rozkladať problémy na jednotlivé kroky a eliminovať chyby v medzivýpočtoch. Používatelia tiež ocenia vyššiu presnosť v generovaní kódu, čo znamená menej nutných opráv a ladenia. Pri bežnom používaní ChatGPT sa o3 mini osvedčuje aj v rýchlejšom poskytovaní súhrnných odpovedí na komplexné otázky, ako sú vedecké vysvetlenia alebo podrobné analýzy rôznych tém.
O3 mini high sa ukázal ako najvýkonnejší model na kódovanie v súčasnosti. Podľa LiveBench dosahuje skóre 82,74, čo výrazne prevyšuje výkonnosť DeepSeek R1 (66,74), Claude 3.5 Sonnet (67,13) aj staršieho modelu OpenAI o1 (69,69). Aj na ďalších platformách a benchmarkoch model dosahuje výnimočné výsledky a radí sa medzi najlepších programátorov na svete.
Model | Celkový priemer | Logické uvažovanie | Tvorba kódu | Matematika | Analýza dát | Jazyk | Dodržanie inštrukcií |
---|---|---|---|---|---|---|---|
o3 mini high
(31.1.2025) OpenAI |
75.88 ✓ | 89.58 | 82.74 ✓ | 77.29 | 70.64 ✓ | 50.68 | 84.36 |
o1 high
(17.12.2024) OpenAI |
75.67 | 91.58 ✓ | 69.69 | 80.32 | 65.47 | 65.39 ✓ | 81.55 |
Deepseek R1 | 71.57 | 83.17 | 66.74 | 80.71 ✓ | 69.78 | 48.53 | 80.51 |
o3 mini
(31.1.2025 medium) OpenAI |
70.01 | 86.33 | 65.38 | 72.37 | 66.56 | 46.26 | 83.16 |
Gemini 2.0 Flash
(thinking exp 01-21) |
66.92 | 78.17 | 53.49 | 75.85 | 69.37 | 42.18 | 82.47 |
Gemini 2.0 Pro
(exp 02-05) |
65.13 | 60.08 | 63.49 | 70.97 | 68.02 | 44.85 | 83.38 |
Gemini
(exp 1206) |
64.09 | 57.00 | 63.41 | 72.36 | 63.16 | 51.29 | 77.34 |
o3 mini
(31.01.2025 low) OpenAI |
62.45 | 69.83 | 61.46 | 63.06 | 62.04 | 38.25 | 80.06 |
Gemini
2.0 flash |
61.47 | 55.25 | 53.92 | 65.62 | 67.55 | 40.69 | 85.79 ✓ |
Deepseek v3
DeepSeek |
60.45 | 56.75 | 61.77 | 60.54 | 60.94 | 47.48 | 75.25 |
Gemini 2.0 flash
(exp) |
59.26 | 59.08 | 54.36 | 60.39 | 61.67 | 38.22 | 81.86 |
Claude 3.5 Sonnet
(22.10.2024) Anthropic |
59.03 | 56.67 | 67.13 | 52.28 | 55.03 | 53.76 | 69.30 |
ChatGPT 4o
(29.1.2025) OpenAI |
57.79 | 57.92 | 60.56 | 48.02 | 66.00 | 49.14 | 65.07 |
Porovnanie o3 mini a o3 mini high s modelmi ako Gemini, DeepSeek a Claude. Zdroj: LiveBench.
Hoci je novinka vysoko efektívna v programovaní a matematických úlohách, jej využitie sa neobmedzuje iba na technické odbory. O3 mini je vhodný aj pre bežných používateľov, ktorí hľadajú rýchle a presné odpovede na každodenné otázky, či už ide o plánovanie, vzdelávanie, alebo všeobecné znalosti. Napríklad, pri vyhľadávaní odporúčaní ohľadom kariéry, financií alebo osobného rozvoja model poskytuje jasné a štruktúrované odpovede, ktoré sú ľahko zrozumiteľné.
Navyše, vďaka schopnosti analyzovať zložitejšie texty a poskytovať prehľadné zhrnutia je o3 mini skvelým nástrojom pre študentov, ktorí potrebujú rýchle porozumenie komplikovaným témam alebo pomoc s písaním textov.
V priamom porovnaní s čínskym DeepSeek R1, ktorý bol nedávno uvedený ako bezplatný model s dôrazom na uvažovanie, sa ukazuje zásadný rozdiel v prístupe k odpovediam. Zatiaľ čo o3 mini poskytuje stručnejšie a jasne štruktúrované odpovede s náhľadom do svojej logiky, DeepSeek R1 ponúka rozsiahlejší uvažovací proces, v ktorom používateľovi ukazuje svoje pochybnosti a možnosti alternatívnych prístupov.
Napríklad pri otázke, či je lepšie ísť na univerzitu alebo rovno do práce, o3 mini najprv vyhodnotí faktory ako záujmy, finančnú situáciu a budúci trh práce, a následne poskytne súhrnnú analýzu. DeepSeek R1 oproti tomu rozpracuje svoj myšlienkový proces do väčšieho detailu, pričom častejšie zvažuje viacero hypotetických scenárov a možné protichodné argumenty.
Výsledky nezávislých testov ukazujú, že o3 mini poskytuje jasnejšie a priamejšie odpovede s transparentným vysvetlením svojho postupu, zatiaľ čo DeepSeek R1 sa viac zameriava na širší kontext, možné nuansy a otvorenejšiu analýzu rozhodovacieho procesu.
i
Mohlo by vás zaujímať
O3 mini je prvýkrát dostupný aj pre neplatiacich používateľov ChatGPT. V bezplatnej verzii ho možno aktivovať tlačidlom „Mysli“ v chate. Pre používateľov Plus a Team platí limit 150 správ denne, zatiaľ čo predplatitelia Pro (cca 200 € mesačne) získajú neobmedzený prístup k o3 mini a o3 mini high.
Poskytovateľ | Názov plánu | Cena | Kľúčové vlastnosti |
---|---|---|---|
OpenAI | Free | 0 USD | GPT‑4o mini zadarmo, navyše obmedzený prístup k verziám GPT‑4o a o3‑mini, rovnako ako k funkciám nahrávania súborov, analýzy dát, generovania obrázkov a hlasového režimu. |
ChatGPT Plus | 20 USD | Všetko z Free verzie, prístup k o1 a o3-mini. Vyššie limity na analýzy, správy, nahrávanie súborov, generovanie obrázkov a hlasový režim. | |
ChatGPT Pro | 200 USD | Určené pre pokročilých používateľov – takmer neobmedzený prístup, vyšší výpočtový výkon, pokročilý hlasový režim a pod. | |
Google (Gemini) | Gemini Standard | Zadarmo | Prístup k základným modelom Gemini 2.0 Flash a Flash Thinking Experimental, možnosť prepojiť s ďalšími aplikáciami Google. |
Gemini Advanced/Google One AI Premium | ~20 USD | Plná verzia (Gemini 2.0 Pro) s rozšíreným kontextovým oknom (až 1 milión tokenov), prednostný prístup k novým funkciám, integrácia s Google Workspace a 2 TB cloudového úložiska. | |
Anthropic (Claude) | Claude Free | Zadarmo | Základný prístup ku Claude s obmedzeným denným počtom správ (cca 30 – 50 správ/deň), vhodný pre začiatočníkov. |
Claude Pro | 20 USD | Vyššie limity, prístup k pokročilejším modelom (napr. Claude 3 Opus), prednostný prístup k novinkám. | |
DeepSeek | DeepSeek (R1) | Zadarmo | Zadarmo, vhodná na osobné použitie, občasné problémy so stabilitou (preťaženie serverov). |
i
Aktuálne k februáru 2025, ponuka funkcií a modelov sa pravidelne mení. Pre prehľadnosť sme uviedli iba základnú cenu pri pravidelnej mesačnej platbe. Pri voľbe ročného predplatného je možné získať nižšiu cenu. Súčasne náš zoznam neobsahuje firemné plány.
Aktuálne informácie k cenovým plánom viď Google Gemini, OpenAI ChatGPT, Anthropic Claude.
Bezplatná verzia má však oproti plateným variantom aj ďalšie obmedzenia. Napríklad, prístup k výkonnejšej verzii o3 mini high je exkluzívny iba pre platiacich používateľov. Ďalej sa môžu líšiť dostupné funkcie, latencia odpovedí a priorita serverov, čo znamená, že bezplatní používatelia môžu občas zaznamenať pomalší čas odozvy.
Model je taktiež dostupný v OpenAI API a integruje sa do Microsoft Azure OpenAI Service, GitHub Copilot a ďalších nástrojov spoločnosti Microsoft.
Uvedenie modelu o3 mini predstavuje zásadný krok vpred v oblasti modelov pre logické uvažovanie a kódovanie. Vďaka rýchlym odpovediam, pokročilému logickému mysleniu a presnosti v programátorských úlohách ide o najsilnejší model v tejto kategórii.
i
Mohlo by vás zaujímať
Navyše, jeho dostupnosť v bezplatnej verzii umožňuje širokému spektru používateľov využiť jeho schopnosti aj mimo technických odborov. Konkurencia v podobe DeepSeek-R1 síce ponúka rozsiahlejšie odpovede, ale o3 mini naopak poskytuje štruktúrovanejší a transparentnejší náhľad na svoj vlastný uvažovací proces. S voľne dostupnou verziou v ChatGPT má teraz každý možnosť otestovať schopnosti tohto modelu na vlastnej koži.