Par Eric
Herzog, CMO chez Infinidat
Les données stockées
dans les bases de données vectorielles sont la clé du succès de l'IA générative
(GenAI) pour les entreprises de tous les secteurs. Les données privées et
actualisées des sources de données de l'entreprise, y compris les données non structurées
et les données structurées, sont nécessaires lors de l'inférence de l'IA pour
rendre les modèles de GenAI plus précis et plus pertinents.
Pour que les données
restent utiles à la GenAI après l'entraînement initial, l'architecture RAG
(Retrieval-Augmented Generation) s'impose comme le cadre de référence.
Le RAG renforce les
modèles d'IA en exploitant les données pertinentes et exclusives des bases de
données d'entreprise pour améliorer la précision. Un déploiement RAG efficace
regroupe toutes les données sélectionnées pour maintenir le processus d'IA à jour.
Concrètement, le RAG
permet aux entreprises de générer automatiquement des réponses plus précises
aux questions clients ou employés. Il permet aux modèles d'IA, incluant les LLM
comme ChatGPT, de référencer des informations dépassant leurs données de formation
initiale, en accédant aux données propriétaires stockées dans l'infrastructure
d'entreprise.
Laissés à eux-mêmes,
les LLM et SLM sont soit statiques, soit n'exploitent que des informations
accessibles au public, telles que les informations disponibles sur Internet.
Ces applications en langage naturel, axées sur les données et utilisées pour
répondre aux questions des utilisateurs, doivent être en mesure de croiser des
sources d'information faisant autorité dans l'ensemble de l'entreprise. Cette
dynamique a placé le stockage d'entreprise au centre de l'adoption de la GenAI
dans les environnements d'entreprise par le biais de l'architecture RAG.
Exigences relatives à
l'infrastructure de stockage avec GenAI
L'infrastructure de
stockage doit être cybersécurisée et disponible à 100%. Pas de temps d'arrêt !
Pas de compromis sur les données ! Elle doit être flexible, rentable et capable
de fonctionner dans un environnement hybride multi-cloud, qui est de plus en
plus l'environnement standard des grandes entreprises aujourd'hui.
Vous devez également rechercher un système de stockage qui offre la latence la plus faible possible. Croyez-moi, vous voulez que votre infrastructure de stockage soit très performante et ultra-fiable lorsque vous aurez lancé votre projet d'IA et que vous passerez en mode production. Par ailleurs, il est essentiel de disposer d'une configuration RAG permettant d'obtenir toutes les sources de données dont vous avez besoin à travers plusieurs fournisseurs, ainsi que vos données dans votre environnement hybride
multi-cloud, afin d'obtenir une IA précise.
Le fait de disposer
d'un système de stockage d'entreprise doté d'une architecture de déploiement de
workload RAG - et des capacités appropriées pour les déploiements d'IA - vous
donnera, à vous et à votre organisation, la certitude que votre infrastructure
informatique est capable d'exploiter de vastes ensembles de données et
d'extraire rapidement des informations pertinentes. Les bases de données
vectorielles utilisées dans les systèmes de stockage d'entreprise optimisés par
RAG extraient les données de toutes les sources de données sélectionnées et
fournissent aux modèles d'IA des moyens simples et efficaces de les rechercher
et d'en tirer des enseignements.
Il a été dit que la
façon dont l'IA apprend est l'apprentissage sémantique. Il s'agit
essentiellement d'accroître les connaissances sur la base des connaissances
antérieures. Le modèle d'IA a son « cerveau » qui a été formé sur des quantités
gigantesques d'informations accessibles au public - la formation à l'IA,
généralement effectuée dans un environnement hyperscalaire - mais lorsqu'il
arrive dans l'entreprise, vous devez obtenir ces données à partir de vos
sources de données d'entreprise, de sorte que l'IA puisse être mise à jour et
personnalisée - l'inférence de l'IA. Ainsi, le modèle d'IA peut donner un sens
non seulement aux mots, mais aussi au contexte approprié. Au cours de la phase
d'inférence de l'IA, le modèle d'IA applique les connaissances qu'il a
acquises. Vous ne voulez pas que votre IA ait des hallucinations, n'est-ce pas
?
L'évolution de
l'infrastructure de stockage de l'entreprise ne peut pas non plus être ignorée
dans cette situation. Il est certain que l'entreprise typique n'aura pas la
capacité ou les moyens d'effectuer la formation initiale d'un LLM ou d'un SLM
de manière autonome, comme le font les hyperscalers. La formation d'un LLM
nécessite un système informatique robuste et hautement évolutif.
Néanmoins,
l'interconnexion entre un hyperscaler et une entreprise - un transfert
transparent qui est nécessaire pour que la GenAI devienne plus utile aux
entreprises dans le monde réel - exige que les entreprises disposent d'un
stockage de données à l'échelle du pétaoctet, de qualité professionnelle. Même
les entreprises de taille moyenne doivent envisager un stockage à l'échelle du
pétaoctet pour s'adapter aux changements rapides de l'IA.
La valeur des données augmente lorsque vous transformez votre infrastructure de stockage d'un support statique en une plateforme dynamique et super-intelligente de nouvelle génération pour accélérer et améliorer la transformation numérique de l'IA.