Qu'est-ce que PandasAI ?
PandasAI est une plateforme Python innovante conçue pour révolutionner la façon dont vous interagissez avec vos données. En tirant parti de la puissance des grands modèles linguistiques (LLMs), PandasAI rend l'analyse de données conversationnelle et accessible à tous les utilisateurs, quel que soit leur niveau technique. Dites adieu à la programmation complexe et bonjour à une interface intuitive où vous pouvez simplement poser des questions sur vos données et recevoir des réponses perspicaces en langage naturel.
Quelles sont les caractéristiques de PandasAI ?
- Analyse de données conversationnelle : Les utilisateurs peuvent interagir avec leurs bases de données de manière naturelle et intuitive. En posant simplement des questions, vous pouvez obtenir des informations et des analyses sans avoir à écrire de requêtes complexes.
- Prise en charge multi-format : PandasAI interagit de manière transparente avec divers formats de données, y compris les bases de données SQL, les fichiers CSV, les DataFrames pandas, polars, MongoDB et d'autres bases de données NoSQL. Cette flexibilité permet aux utilisateurs de différents horizons d'utiliser l'outil.
- Intégration des LLMs : La plateforme prend en charge des LLMs avancés comme GPT-3.5, GPT-4, les modèles d'Anthropic et VertexAI, garantissant ainsi que les utilisateurs reçoivent des réponses précises et contextuellement pertinentes à leurs demandes.
- Visualisation des données : Avec PandasAI, vous pouvez générer automatiquement des graphiques et des visualisations pour mieux comprendre vos données. Il vous suffit de demander un graphique spécifique, et il sera créé en quelques commandes.
- Gestion de plusieurs DataFrames : Les utilisateurs peuvent interroger plusieurs DataFrames simultanément, permettant des analyses de données complexes impliquant l'agrégation ou la comparaison de jeux de données côte à côte.
- Fonctionnalités de confidentialité : Afin de proteger les informations sensibles, PandasAI inclut une option pour garantir la confidentialité, s'assurant que seules les données essentielles sont analysées sans exposer des détails confidentiels.
Quelles sont les caractéristiques de PandasAI ?
- Interface conviviale : Conçu pour les utilisateurs techniques et non techniques, PandasAI comble le fossé entre l'analyse de données complexe et un accès facile.
- Déploiement rapide : La plateforme peut être déployée sans effort dans divers environnements, y compris les notebooks Jupyter, les applications Streamlit, ou même comme API REST via FastAPI ou Flask.
- Fiabilité : Avec une architecture robuste basée sur Docker, les utilisateurs peuvent compter sur des performances fluides, que ce soit sur des machines locales ou dans le cloud.
- Support communautaire : Une communauté dynamique entoure PandasAI, offrant des ressources telles que la documentation, des exemples de frameworks et des forums de discussion pour le dépannage et la collaboration.
Quels sont les cas d'utilisation de PandasAI ?
- Analyse commerciale : Les entreprises peuvent utiliser PandasAI pour analyser les données de ventes, les retours d'expérience client et les mesures opérationnelles en posant simplement des questions pour obtenir des informations qui améliorent la prise de décision.
- Recherche académique : Les chercheurs peuvent parcourir de grands ensembles de données liés à leurs études et obtenir rapidement des résumés, des tendances et des modèles, accélérant ainsi le processus de recherche.
- Analyse de données financières : Les analystes financiers peuvent tirer parti de l'outil pour explorer les flux de revenus, les tendances de dépenses et les tendances du marché, permettant ainsi des décisions d'investissement plus éclairées.
- Reporting de données : Créez des rapports informatifs en interrogeant des données et en visualisant automatiquement les résultats, rationalisant ainsi le processus de reporting sans le tracas de la manipulation des données.
- Préparation de machine learning : Les data scientists peuvent rapidement obtenir des informations sur les ensembles de données et préparer des données pour d'autres analyses dans des tâches d'apprentissage automatique, améliorant ainsi les flux de travail globaux.
Comment utiliser PandasAI ?
-
Installation : Pour commencer, clonez le dépôt et naviguez vers le répertoire du projet :
git clone https://github.com/sinaptik-ai/pandas-ai/ cd pandas-ai docker-compose build
-
Exécution de la plateforme : Lancez le service avec :
docker-compose up
Une fois en cours d'exécution, accédez à l'interface client à
http://localhost:3000
. -
Utilisation de base : Importez la bibliothèque PandasAI, définissez votre clé API et initialisez un agent avec vos données :
import os import pandas as pd from pandasai import Agent # DataFrame d'exemple ventes_par_pays = pd.DataFrame({ "pays": ["États-Unis", "Royaume-Uni", "France", "Allemagne", "Italie", "Espagne", "Canada", "Australie", "Japon", "Chine"], "revenu": [5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500, 7000] }) os.environ["PANDASAI_API_KEY"] = "VOTRE_CLÉ_API" agent = Agent(ventes_par_pays) print(agent.chat('Quels sont les 5 pays avec les ventes les plus élevées ?'))
-
Requêtes avancées : Vous pouvez poser des questions complexes impliquant plusieurs DataFrames :
données_employés = { 'ID_Employé': [1, 2, 3, 4, 5], 'Nom': ['John', 'Emma', 'Liam', 'Olivia', 'William'], 'Département': ['RH', 'Ventes', 'TI', 'Marketing', 'Finance'] } données_salaires = { 'ID_Employé': [1, 2, 3, 4, 5], 'Salaire': [5000, 6000, 4500, 7000, 5500] } df_employés = pd.DataFrame(données_employés) df_salaires = pd.DataFrame(données_salaires) agent = Agent([df_employés, df_salaires]) print(agent.chat("Qui est le mieux payé ?"))