Porovnanie AI modelov: O3 mini vs. DeepSeek R1 a Claude 3.5 Sonnet

Aktualizované 28. februára 2025 • Autor: Peter Vnuk

Spoločnosť OpenAI oznámila uvedenie svojho najnovšieho modelu o3 mini a jeho výkonnejšej verzie o3 mini high. Nový model prináša významné zlepšenie v oblasti programovania, matematiky a logických úloh a je dostupný zadarmo v službe ChatGPT. Platené verzie umožňujú prístup k vyššej výpočtovej kapacite a tá bezplatná má určité obmedzenia. Aké sú hlavné novinky tohto modelu a ako sa mu darí oproti konkurentom ako DeepSeek R1 či Claude 3.5 Sonnet?

O3 mini vs. DeepSeek R1 a Claude 3.5 Sonnet – OBSAH

O3 mini: Rýchlejšie odpovede a lepšia presnosť
Výsledky testov: O3 mini high prekonáva konkurenciu v programovaní
Porovnanie s DeepSeek R1: Stručnosť vs. hĺbková analýza
Dostupnosť a cenové plány
Záver: O3 mini prináša pokrok hlavne pre programátorov a logické úlohy

O3 mini: Rýchlejšie odpovede a lepšia presnosť

OpenAI uvádza, že o3 mini prináša rýchlejšie odpovede ako jeho predchodca o1 mini a zároveň dosahuje vyššiu presnosť. Model je navrhnutý tak, aby exceloval v úlohách vyžadujúcich krokové logické uvažovanie, čo zahŕňa napríklad zložité matematické problémy alebo analýzu programového kódu. Zároveň obsahuje tzv. „reťazec myslenia“, čo znamená, že model pri odpovedi reflektuje vlastné úvahy a dokáže jasne vysvetliť svoj postup.

Tento princíp spočíva v tom, že model najprv rozdelí problém na menšie kroky, analyzuje jednotlivé časti samostatne, vykoná vnútorné výpočty a potom na základe tejto postupnej analýzy zostaví finálnu odpoveď. Vďaka tomu je možné lepšie pochopiť, ako AI dospela k svojmu záveru, a zároveň sa zvyšuje presnosť a konzistencia odpovedí.

Podľa benchmarkových testov OpenAI model o3 mini zodpovedá až o 24 % rýchlejšie ako o1 mini a v rade úloh dosahuje vyššiu presnosť. Medzi platenými verziami je potom k dispozícii aj o3 mini high, ktorý je optimalizovaný pre zložité programátorské a logické úlohy.

V praxi sa toto zlepšenie prejaví napríklad pri riešení zložitých matematických úloh, kde model teraz dokáže efektívnejšie rozkladať problémy na jednotlivé kroky a eliminovať chyby v medzivýpočtoch. Používatelia tiež ocenia vyššiu presnosť v generovaní kódu, čo znamená menej nutných opráv a ladenia. Pri bežnom používaní ChatGPT sa o3 mini osvedčuje aj v rýchlejšom poskytovaní súhrnných odpovedí na komplexné otázky, ako sú vedecké vysvetlenia alebo podrobné analýzy rôznych tém.

Výsledky testov: O3 mini high prekonáva konkurenciu v programovaní

O3 mini high sa ukázal ako najvýkonnejší model na kódovanie v súčasnosti. Podľa LiveBench dosahuje skóre 82,74, čo výrazne prevyšuje výkonnosť DeepSeek R1 (66,74), Claude 3.5 Sonnet (67,13) aj staršieho modelu OpenAI o1 (69,69). Aj na ďalších platformách a benchmarkoch model dosahuje výnimočné výsledky a radí sa medzi najlepších programátorov na svete.

Model	Celkový priemer	Logické uvažovanie	Tvorba kódu	Matematika	Analýza dát	Jazyk	Dodržanie inštrukcií
o3 mini high (31.1.2025) OpenAI	75.88 ✓	89.58	82.74 ✓	77.29	70.64 ✓	50.68	84.36
o1 high (17.12.2024) OpenAI	75.67	91.58 ✓	69.69	80.32	65.47	65.39 ✓	81.55
Deepseek R1	71.57	83.17	66.74	80.71 ✓	69.78	48.53	80.51
o3 mini (31.1.2025 medium) OpenAI	70.01	86.33	65.38	72.37	66.56	46.26	83.16
Gemini 2.0 Flash (thinking exp 01-21) Google	66.92	78.17	53.49	75.85	69.37	42.18	82.47
Gemini 2.0 Pro (exp 02-05) Google	65.13	60.08	63.49	70.97	68.02	44.85	83.38
Gemini (exp 1206) Google	64.09	57.00	63.41	72.36	63.16	51.29	77.34
o3 mini (31.01.2025 low) OpenAI	62.45	69.83	61.46	63.06	62.04	38.25	80.06
Gemini 2.0 flash Google	61.47	55.25	53.92	65.62	67.55	40.69	85.79 ✓
Deepseek v3 DeepSeek	60.45	56.75	61.77	60.54	60.94	47.48	75.25
Gemini 2.0 flash (exp) Google	59.26	59.08	54.36	60.39	61.67	38.22	81.86
Claude 3.5 Sonnet (22.10.2024) Anthropic	59.03	56.67	67.13	52.28	55.03	53.76	69.30
ChatGPT 4o (29.1.2025) OpenAI	57.79	57.92	60.56	48.02	66.00	49.14	65.07

Porovnanie o3 mini a o3 mini high s modelmi ako Gemini, DeepSeek a Claude. Zdroj: LiveBench.

Hoci je novinka vysoko efektívna v programovaní a matematických úlohách, jej využitie sa neobmedzuje iba na technické odbory. O3 mini je vhodný aj pre bežných používateľov, ktorí hľadajú rýchle a presné odpovede na každodenné otázky, či už ide o plánovanie, vzdelávanie, alebo všeobecné znalosti. Napríklad, pri vyhľadávaní odporúčaní ohľadom kariéry, financií alebo osobného rozvoja model poskytuje jasné a štruktúrované odpovede, ktoré sú ľahko zrozumiteľné.

Navyše, vďaka schopnosti analyzovať zložitejšie texty a poskytovať prehľadné zhrnutia je o3 mini skvelým nástrojom pre študentov, ktorí potrebujú rýchle porozumenie komplikovaným témam alebo pomoc s písaním textov.

Porovnanie s DeepSeek R1: Stručnosť vs. hĺbková analýza

V priamom porovnaní s čínskym DeepSeek R1, ktorý bol nedávno uvedený ako bezplatný model s dôrazom na uvažovanie, sa ukazuje zásadný rozdiel v prístupe k odpovediam. Zatiaľ čo o3 mini poskytuje stručnejšie a jasne štruktúrované odpovede s náhľadom do svojej logiky, DeepSeek R1 ponúka rozsiahlejší uvažovací proces, v ktorom používateľovi ukazuje svoje pochybnosti a možnosti alternatívnych prístupov.

Napríklad pri otázke, či je lepšie ísť na univerzitu alebo rovno do práce, o3 mini najprv vyhodnotí faktory ako záujmy, finančnú situáciu a budúci trh práce, a následne poskytne súhrnnú analýzu. DeepSeek R1 oproti tomu rozpracuje svoj myšlienkový proces do väčšieho detailu, pričom častejšie zvažuje viacero hypotetických scenárov a možné protichodné argumenty.

Výsledky nezávislých testov ukazujú, že o3 mini poskytuje jasnejšie a priamejšie odpovede s transparentným vysvetlením svojho postupu, zatiaľ čo DeepSeek R1 sa viac zameriava na širší kontext, možné nuansy a otvorenejšiu analýzu rozhodovacieho procesu.

Mohlo by vás zaujímať

DeepSeek: Nový hráč na poli umelej inteligencie konkuruje ChatGPT a Gemini. Ukazuje, že to ide oveľa lacnejšie

Dostupnosť a cenové plány

O3 mini je prvýkrát dostupný aj pre neplatiacich používateľov ChatGPT. V bezplatnej verzii ho možno aktivovať tlačidlom „Mysli“ v chate. Pre používateľov Plus a Team platí limit 150 správ denne, zatiaľ čo predplatitelia Pro (cca 200 € mesačne) získajú neobmedzený prístup k o3 mini a o3 mini high.

Cenová plány: Porovnanie

Poskytovateľ	Názov plánu	Cena	Kľúčové vlastnosti
OpenAI	Free	0 USD	GPT‑4o mini zadarmo, navyše obmedzený prístup k verziám GPT‑4o a o3‑mini, rovnako ako k funkciám nahrávania súborov, analýzy dát, generovania obrázkov a hlasového režimu.
	ChatGPT Plus	20 USD	Všetko z Free verzie, prístup k o1 a o3-mini. Vyššie limity na analýzy, správy, nahrávanie súborov, generovanie obrázkov a hlasový režim.
	ChatGPT Pro	200 USD	Určené pre pokročilých používateľov – takmer neobmedzený prístup, vyšší výpočtový výkon, pokročilý hlasový režim a pod.
Google (Gemini)	Gemini Standard	Zadarmo	Prístup k základným modelom Gemini 2.0 Flash a Flash Thinking Experimental, možnosť prepojiť s ďalšími aplikáciami Google.
Google (Gemini)	Gemini Advanced/Google One AI Premium	~20 USD	Plná verzia (Gemini 2.0 Pro) s rozšíreným kontextovým oknom (až 1 milión tokenov), prednostný prístup k novým funkciám, integrácia s Google Workspace a 2 TB cloudového úložiska.
Anthropic (Claude)	Claude Free	Zadarmo	Základný prístup ku Claude s obmedzeným denným počtom správ (cca 30 – 50 správ/deň), vhodný pre začiatočníkov.
Anthropic (Claude)	Claude Pro	20 USD	Vyššie limity, prístup k pokročilejším modelom (napr. Claude 3 Opus), prednostný prístup k novinkám.
DeepSeek	DeepSeek (R1)	Zadarmo	Zadarmo, vhodná na osobné použitie, občasné problémy so stabilitou (preťaženie serverov).

Aktuálne k februáru 2025, ponuka funkcií a modelov sa pravidelne mení. Pre prehľadnosť sme uviedli iba základnú cenu pri pravidelnej mesačnej platbe. Pri voľbe ročného predplatného je možné získať nižšiu cenu. Súčasne náš zoznam neobsahuje firemné plány.

Aktuálne informácie k cenovým plánom viď Google Gemini, OpenAI ChatGPT, Anthropic Claude.

Bezplatná verzia má však oproti plateným variantom aj ďalšie obmedzenia. Napríklad, prístup k výkonnejšej verzii o3 mini high je exkluzívny iba pre platiacich používateľov. Ďalej sa môžu líšiť dostupné funkcie, latencia odpovedí a priorita serverov, čo znamená, že bezplatní používatelia môžu občas zaznamenať pomalší čas odozvy.

Model je taktiež dostupný v OpenAI API a integruje sa do Microsoft Azure OpenAI Service, GitHub Copilot a ďalších nástrojov spoločnosti Microsoft.

Záver: O3 mini prináša pokrok hlavne pre programátorov a logické úlohy

Uvedenie modelu o3 mini predstavuje zásadný krok vpred v oblasti modelov pre logické uvažovanie a kódovanie. Vďaka rýchlym odpovediam, pokročilému logickému mysleniu a presnosti v programátorských úlohách ide o najsilnejší model v tejto kategórii.