IA Finance — Benchmarks des modèles IA pour la finance 2026

Classement live des meilleurs modèles d'intelligence artificielle sur 4 benchmarks de finance publiés par vals.ai : Finance Agent (raisonnement d'agent), CorpFin (finance d'entreprise), MortgageTax (fiscalité immobilière), TaxEval (fiscalité personnelle). Données rafraîchies automatiquement toutes les 24h.

4 benchmarks40 modèles9 providers

CorpFin v2

Mesure la performance sur des questions de finance d'entreprise (M&A, valuation, fiscalité corporate).

#ModèleProviderAccuracy
1GPT 5.5OpenAI68.42%
2Kimi K2.5 (Thinking)Moonshot AI68.26%
3Qwen 3 MaxAlibaba68.03%
4Claude Opus 4.6 (Thinking)Anthropic67.02%
5Grok 4 Fast ReasoningxAI66.90%
6Kimi K2.6 (Thinking)Moonshot AI66.74%
7Gemini 3 Flash PreviewGoogle66.43%
8Claude Opus 4.7Anthropic66.08%
9Grok 4.0709xAI66.05%
10Grok 4.1 Fast ReasoningxAI65.97%
11GPT 5.2OpenAI65.89%
12Claude Sonnet 4.6Anthropic65.31%
13Qwen 3.5 Plus (Thinking)Alibaba65.31%
14GPT 5.4OpenAI65.27%
15Muse SparkMeta65.11%
16Claude Opus 4.5 (Thinking)Anthropic65.07%
17Gemini 3.1 Pro PreviewGoogle64.49%
18GLM 5.1 (Thinking)Zhipu AI64.45%
19GPT 5.1OpenAI63.83%
20Grok 4.20.0309 ReasoningxAI63.68%

Mis à jour le 26 avril 2026

Finance Agent v1.1

Évalue la capacité d'un modèle à raisonner sur des tâches d'agent financier (analyse de portefeuille, recherche, synthèse).

#ModèleProviderAccuracy
1Qwen 3.6 Max PreviewAlibaba86.67%
2Claude Opus 4.7Anthropic64.37%
3Claude Sonnet 4.6Anthropic63.33%
4Muse SparkMeta60.60%
5DeepSeek V4 ProDeepSeek60.39%
6Claude Opus 4.6 (Thinking)Anthropic60.05%
7GPT 5.5OpenAI59.96%
8Gemini 3.1 Pro PreviewGoogle59.72%
9Claude Opus 4.5 (Thinking)Anthropic58.81%
10GPT 5.2OpenAI58.54%
11GLM 5.1 (Thinking)Zhipu AI57.66%
12GPT 5.4OpenAI57.15%
13Kimi K2.6 (Thinking)Moonshot AI57.06%
14GPT 5.1OpenAI55.31%
15Gemini 3 Pro PreviewGoogle55.15%
16Qwen 3.6 PlusAlibaba54.63%
17Claude Sonnet 4.5 (Thinking)Anthropic54.50%
18Qwen 3.5 Plus (Thinking)Alibaba54.48%
19Grok 4.0709xAI53.51%
20GPT 5.4 MiniOpenAI53.41%

Mis à jour le 26 avril 2026

MortgageTax

Tests sur la fiscalité immobilière (déductibilité d'intérêts, abattements, plus-values).

#ModèleProviderAccuracy
1Claude Opus 4.7Anthropic70.27%
2Gemini 3.1 Pro PreviewGoogle69.40%
3Gemini 3 Pro PreviewGoogle69.08%
4Gemini 2.5 ProGoogle68.92%
5GPT 5.5OpenAI68.76%
6Gemini 3 Flash PreviewGoogle68.72%
7Claude 3.7 SonnetAnthropic68.68%
8Claude Opus 4.5Anthropic68.68%
9Claude Opus 4.6 (Thinking)Anthropic68.52%
10GPT 5.4OpenAI68.32%
11Gemini 3.1 Flash Lite PreviewGoogle68.04%
12Qwen 3.6 PlusAlibaba67.97%
13Claude Sonnet 4.6Anthropic67.73%
14Claude Opus 4.5 (Thinking)Anthropic67.69%
15Qwen 3.5 FlashAlibaba67.37%
16Gemini 2.5 Pro Exp 03.25Google67.17%
17GPT 5.2OpenAI67.13%
18GPT 5 MiniOpenAI66.89%
19Claude 3.7 Sonnet (Thinking)Anthropic66.85%
20Kimi K2.5 (Thinking)Moonshot AI66.53%

Mis à jour le 26 avril 2026

TaxEval v2

Évaluation sur la fiscalité personnelle (impôt sur le revenu, abattements, niches fiscales).

#ModèleProviderAccuracy
1Muse SparkMeta77.68%
2Claude Sonnet 4.6Anthropic77.11%
3Claude Opus 4.6 (Thinking)Anthropic75.96%
4Grok 3xAI75.88%
5GPT 5.2OpenAI75.76%
6Grok 4 Fast ReasoningxAI75.70%
7Claude Opus 4.7Anthropic75.27%
8GPT 5 MiniOpenAI75.22%
9GPT 4.1OpenAI75.06%
10GPT 5.5OpenAI74.98%
11GPT 5.1OpenAI74.86%
12Claude Opus 4.5 (Thinking)Anthropic74.86%
13o4 MiniOpenAI74.78%
14Qwen 3.6 PlusAlibaba74.73%
15Kimi K2.6 (Thinking)Moonshot AI74.65%
16o3OpenAI74.57%
17GPT 4oOpenAI74.53%
18Claude Opus 4.5Anthropic74.33%
19o1OpenAI74.29%
20Kimi K2.5 (Thinking)Moonshot AI74.20%

Mis à jour le 26 avril 2026

Source : vals.ai. Pour aller plus loin, lis notre article Alpha Arena : 6 LLM tradés en crypto réelle.