IBM Granite 3.2 est une mise à jour majeure dans la famille des modèles d’IA d’IBM. Elle marque un tournant vers des capacités plus avancées et plus spécialisées. Voici les grandes nouveautés :
Raisonnement amélioré
- Chain of Thought (CoT) : Granite 3.2 introduit un raisonnement en plusieurs étapes, permettant aux modèles de décomposer des problèmes complexes comme le ferait un humain.
- Modèles 2B et 8B Instruct : Ces versions peuvent suivre des instructions complexes avec une efficacité comparable à celle de modèles bien plus grands comme GPT-4o ou Claude 3.5 Sonnet.
Modèle multimodal Granite Vision 3.2
- Capable de comprendre des documents visuels (PDF, graphiques, OCR, etc.) avec des performances équivalentes à celles de modèles cinq fois plus volumineux3.
- Optimisé avec l’outil Docling d’IBM, qui a traité 85 millions de fichiers PDF pour générer des paires de questions/réponses synthétiques.
Sécurité et efficacité
- Granite Guardian 3.2 : Modèle plus compact (réduction de 30 % de la taille) avec une efficacité maintenue pour la détection des risques.
- Ajout d’une fonction de “confidence verbalisée” pour des interprétations plus précises lors de l’évaluation des menaces.
Prévisions et embeddings
- Granite Timeseries : Nouvelles capacités de prévision quotidienne et hebdomadaire.
- Granite Embedding Sparse : Nouveau modèle d’embedding épars, plus efficace et évolutif selon les ressources disponibles.
Disponibilité et open source
- Tous les modèles Granite 3.2 sont disponibles en open source sous licence Apache 2.0.
- Déployés sur IBM watsonx.ai, Hugging Face, Ollama, LMStudio et Replicate.
Granite 3.2 montre clairement qu’IBM mise sur des modèles compacts, puissants et adaptés aux besoins des entreprises, tout en restant accessibles et modulables.
Au départ de cette aventure, voici ce que IBM annonçait
Avec Granite 3.0, IBM entendait fournir aux entreprises une IA plus performante, efficace et accessible. Granite 3.2, lancé ce 27 février 2025, introduit des avancées majeures en matière de raisonnement, de sécurité et de compréhension documentaire, tout en restant fidèle à la philosophie d’IBM : une IA open-source, optimisée pour l’usage professionnel. Comme leurs prédécesseurs, les modèles sont distribués sous la licence Apache 2.0 et peuvent être téléchargés sur HuggingFace.
Avec Granite 3.2, IBM renforce sa position sur le marché de l’IA en proposant une gamme de modèles capables de rivaliser avec des concurrents plus volumineux tout en optimisant la consommation de ressources.
Cette mise à jour introduit :
- Un modèle de langage visuel avancé (VLM) :le nouveau modèle multimodal, Granite Vision 3.2 2B, entraîné pour gérer à la fois les entrées d’images et de texte, excelle dans la compréhension et l’analyse de documents, surpassant des modèles comme Llama 3.2 11B et Pixtral 12B sur des benchmarks clés (DocVQA, ChartQA, AI2D et OCRBench). IBM a exploité son kit d’outils Docling pour traiter 85 millions de PDF et générer 26 millions de paires de questions-réponses, renforçant ainsi la robustesse du modèle.
- Une flexibilité inédite dans le raisonnement :Les modèles Granite 3.2 Instruct 2B et Instruct 8B permettent d’activer ou désactiver leur capacité de raisonnement (« chaîne de pensée ») afin d’optimiser leur efficacité. Grâce à cette innovation, le modèle 8B obtient des performances améliorées à deux chiffres par rapport à son prédécesseur sur des benchmarks tels que ArenaHard et Alpaca Eval, et rivalise avec Claude 3.5-Sonnet et GPT-4o en raisonnement mathématique (AIME2024 et MATH500).
- Un renforcement de la sécurité :La gamme Granite Guardian 3.2, spécialement conçuse pour répondre aux besoins critiques de sécurité et de conformité des entreprises, réduit la taille de ses modèles de 30 % tout en maintenant leur fiabilité. Elle introduit une nouvelle approche appelée confiance verbalisée, qui affine l’évaluation des risques en tenant compte des zones d’incertitude.
Une IA plus adaptée aux besoins des entreprises
En parallèle, IBM lance une nouvelle génération de ses modèles TinyTimeMixers (TTM), des modèles de moins de 10 millions de paramètres qui permettent d’analyser les tendances financières et économiques , de planifier la gestion des stocks et d’optimiser les chaînes d’approvisionnement. Le dernier ajout, TTM-R2.1, étend les prévisions à une semaine.
Sriram Raghavan, VP, IBM AI Research, commente :
« La prochaine ère de l’IA est celle de l’efficacité, de l’intégration et de l’impact sur le monde réel – où les entreprises peuvent obtenir des résultats puissants sans dépenses excessives en calcul.Les derniers développements de Granite d’IBM, axés sur des solutions ouvertes, constituent une nouvelle avancée pour rendre l’IA plus accessible, plus rentable et plus porteuse de valeur pour les entreprises modernes. »
Les modèles Granite 3.2 sont disponibles IBM watsonx.ai, Ollama, Replicate et LM Studio, et devraient l’être prochainement sur RHEL AI 1.5 .