HaYba WEEKEND MAGAZINE®. Technologies

Révélation de Claude 2 : l’IA Générative d’Anthropic Dévoile Ses Atouts Face À GPT-4

Dans le marché en constante évolution de l’IA générative, Anthropic et son modèle Claude ainsi que Google avec PaLM sont universellement reconnus comme les concurrents les plus proches d’OpenAI. Chaque nouvelle version de ces modèles suscite de grandes attentes et entraîne inévitablement des comparaisons avec GPT-4. Et bien, la semaine dernière, Anthropic a pris la parole avec la sortie très attendue de son modèle Claude 2. Cette nouvelle version s’appuie sur les réussites de ses prédécesseurs en suivant la méthodologie de l’IA constitutionnelle d’Anthropic.

Beaucoup d’articles ont été rédigés sur la sortie de Claude 2 en mettant l’accent sur les grandes lignes, mais voici quelques faits essentiels à connaître afin d’éviter tout malentendu :

•Au niveau architectural, Claude 2 présente une grande similarité avec Claude 1.3.

•Claude 2 permet de traiter jusqu’à 100 000 jetons (environ 75 000 mots) par requête, ce qui est nettement supérieur aux alternatives disponibles. Cependant, cette capacité n’est pas nouvelle pour Claude 2. La version précédente, Claude 1.3, proposait également un support pour 100 000 jetons.

•Des tests ont démontré que Claude 2 est capable de traiter jusqu’à 200 000 jetons tout en affichant des gains de performances. C’est réellement impressionnant.

•Claude 2 a été pré-entraîné à l’aide de données mises à jour jusqu’au début de 2023, le rendant plus récent que GPT-4.

•Lors des évaluations effectuées auprès d’utilisateurs, Claude 2 a amélioré sa pertinence et l’honnêteté de ses réponses par rapport à ses prédécesseurs. Toutefois, il a obtenu des scores similaires à Claude 1.3 en termes de vulnérabilité à produire des réponses potentiellement préjudiciables.

•Claude 2 a vraiment renforcé ses compétences en matière de programmation, obtenant un score de 71% dans l’évaluation humaine du benchmark Codex, contre 56% pour son prédécesseur.

•En ce qui concerne la résolution de problèmes mathématiques, les améliorations apportées par Claude 2 ne sont pas aussi remarquables, avec un score de 88% dans le benchmark GSM8K, comparé à 85% pour Claude 1.3.

•De manière surprenante, Claude 2 a obtenu des scores de 76% et 68% respectivement aux tests de l’examen du barreau multijuridictionnel et de l’examen de licence médicale.

Dans l’ensemble, Claude 2 représente une sortie impressionnante et une alternative très viable à GPT-4. Ce modèle est déjà utilisé dans des applications essentielles à de nombreux secteurs d’activité, et nous prévoyons d’en voir davantage à l’avenir.

Arlenis Ali

Dans la même rubrique :

•La Percée Des Challengers Bouscule l’Ordre Établi De l’IA Générative Pour les Entrepriseshttps://m.facebook.com/story.php?story_fbid=830671445092259&id=100044482332232&mibextid=qC1gEa

•Fusion-Acquisition Entre Databricks Et MosaicML: Un Coupe De Maître Pour l’Intelligence Artificielle Générative Open Sourcehttps://m.facebook.com/story.php?story_fbid=826576375501766&id=100044482332232&mibextid=qC1gEa

#generativeart #generativeai #generativedesign #techecosystem #claude2 #anthropic #haybaweekend

HaYba FM la Radio Moronienne du Monde

Related Posts

HaYba WEEKEND MAGAZINE®. Monde Swahili

HaYba WEEKEND MAGAZINE®. Around Us

HaYba WEEKEND MAGAZINE®. Monde Swahili

Laisser un commentaire Annuler la réponse