O que é PandasAI?
PandasAI é uma plataforma inovadora em Python projetada para revolucionar a forma como você interage com seus dados. Ao aproveitar o poder de grandes modelos de linguagem (LLMs), o PandasAI torna a análise de dados conversacional e acessível a todos os usuários, independentemente de seu nível técnico. Diga adeus à codificação complexa e dê boas-vindas a uma interface intuitiva onde você pode simplesmente fazer perguntas sobre seus dados e receber respostas perspicazes em linguagem natural.
Quais são as características de PandasAI?
- Análise de Dados Conversacional: Os usuários podem interagir com seus bancos de dados de maneira natural e intuitiva. Ao simplesmente fazer perguntas, você pode recuperar insights e análises sem precisar escrever consultas complexas.
- Suporte a Múltiplos Formatos: O PandasAI interage sem costura com vários formatos de dados, incluindo bancos de dados SQL, arquivos CSV, DataFrames do pandas, polars, MongoDB e outros bancos de dados NoSQL. Essa flexibilidade permite que usuários de diferentes origens utilizem a ferramenta.
- Integração de LLMs: A plataforma suporta LLMs avançados, como GPT-3.5, GPT-4, modelos da Anthropic e VertexAI, garantindo que os usuários recebam respostas precisas e contextualizadas às suas perguntas.
- Visualização de Dados: Com o PandasAI, você pode gerar automaticamente gráficos e visualizações para entender melhor seus dados. Basta solicitar um gráfico específico e ele será criado com apenas alguns comandos.
- Manuseio de Múltiplos DataFrames: Os usuários podem consultar vários DataFrames simultaneamente, permitindo análises de dados complexas que envolvem agregação ou comparação de conjuntos de dados lado a lado.
- Recursos de Privacidade: Para proteger informações sensíveis, o PandasAI inclui uma opção para impor privacidade, garantindo que apenas dados essenciais sejam analisados sem expor detalhes confidenciais.
Quais são as características de PandasAI?
- Interface Amigável: Projetada para usuários tanto técnicos quanto não técnicos, o PandasAI preenche a lacuna entre a análise de dados complexa e o acesso fácil.
- Implantação Rápida: A plataforma pode ser implantada sem esforço em vários ambientes, incluindo notebooks Jupyter, aplicativos Streamlit ou até mesmo como uma API REST através do FastAPI ou Flask.
- Confiabilidade: Com uma arquitetura robusta baseada em Docker, os usuários podem contar com desempenho contínuo, seja em máquinas locais ou na nuvem.
- Suporte da Comunidade: Uma comunidade vibrante existe em torno do PandasAI, oferecendo recursos como documentação, frameworks de exemplo e fóruns de discussão para resolução de problemas e colaboração.
Quais são os casos de uso de PandasAI?
- Análise Empresarial: As empresas podem usar o PandasAI para analisar dados de vendas, feedbacks de clientes e métricas operacionais, simplesmente fazendo perguntas para descobrir insights e melhorar a tomada de decisões.
- Pesquisa Acadêmica: Pesquisadores podem filtrar grandes conjuntos de dados relacionados aos seus estudos e obter resumos, tendências e padrões rapidamente, acelerando significativamente o processo de pesquisa.
- Análise de Dados Financeiros: Analistas financeiros podem aproveitar a ferramenta para explorar fluxos de receita, padrões de despesas e tendências de mercado, permitindo decisões de investimento mais informadas.
- Relatórios de Dados: Crie relatórios informativos consultando dados e visualizando resultados automaticamente, simplificando o processo de relatórios sem a complicação da manipulação de dados.
- Preparação para Aprendizado de Máquina: Cientistas de dados podem rapidamente obter insights sobre conjuntos de dados e preparar dados para análise adicional em tarefas de aprendizado de máquina, melhorando fluxos de trabalho gerais.
Como usar PandasAI?
-
Instalação: Para começar, clone o repositório e navegue até o diretório do projeto:
git clone https://github.com/sinaptik-ai/pandas-ai/ cd pandas-ai docker-compose build
-
Executando a Plataforma: Inicie o serviço usando:
docker-compose up
Uma vez em execução, acesse a interface do cliente em
http://localhost:3000
. -
Uso Básico: Importar a biblioteca PandasAI, definir sua chave de API e inicializar um agente com seus dados:
import os import pandas as pd from pandasai import Agent # DataFrame de Exemplo vendas_por_pais = pd.DataFrame({ "pais": ["Estados Unidos", "Reino Unido", "França", "Alemanha", "Itália", "Espanha", "Canadá", "Austrália", "Japão", "China"], "receita": [5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500, 7000] }) os.environ["PANDASAI_API_KEY"] = "SUA_CHAVE_DE_API" agente = Agent(vendas_por_pais) print(agente.chat('Quais são os 5 países com mais vendas?'))
-
Consultas Avançadas: Você pode fazer perguntas complexas envolvendo vários DataFrames:
dados_funcionarios = { 'ID_Funcionario': [1, 2, 3, 4, 5], 'Nome': ['John', 'Emma', 'Liam', 'Olivia', 'William'], 'Departamento': ['RH', 'Vendas', 'TI', 'Marketing', 'Finanças'] } dados_salarios = { 'ID_Funcionario': [1, 2, 3, 4, 5], 'Salario': [5000, 6000, 4500, 7000, 5500] } df_funcionarios = pd.DataFrame(dados_funcionarios) df_salarios = pd.DataFrame(dados_salarios) agente = Agent([df_funcionarios, df_salarios]) print(agente.chat("Quem recebe mais?"))