Projeto de Sumarizador de Texto com GPT

Posted Dec 15, 2023 Updated Apr 21, 2024

By Gallileu Genesis 6 min read

Introdução

Projetos de sumarização de documentos são uns dos mais comuns no universo de aplicações de LLMs. Nesse tutorial iremos desenvolver um projeto simples de um sumarizador de texto alimentado pelos modelos de linguagem natural da OpenAI, o GPT-3.5 e GPT-4.

Visão Geral do Projeto

O objetivo deste projeto é criar uma ferramenta que possa resumir textos extensos de maneira eficiente e eficaz, utilizando a capacidade de compreensão e geração de texto dos modelos GPT. O projeto é composto por duas partes principais:

Backend (summarizer_model.py): Integração com a API da OpenAI para processamento e sumarização de texto.
Frontend (summarizer_app.py): Uma interface web construída com Streamlit, oferecendo aos usuários uma forma interativa de usar a ferramenta.

Backend

O backend deste projeto é construído em Python e faz uso da API da OpenAI para acessar os modelos GPT. O script summarizer_model.py é responsável por configurar a conexão com a API e definir a função de sumarização. Veja abaixo o código-chave do backend:

  
from openai import OpenAI
import os
from dotenv import load_dotenv

load_dotenv()
client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

def generate_summarizer(
    model,
    max_tokens,
    top_p,
    frequency_penalty,
    temperature,
    prompt,
    person_type,
):
    chat = client.chat.completions.create(
        model=model,
        max_tokens=max_tokens,
        temperature=temperature,
        top_p=top_p,
        frequency_penalty=frequency_penalty,
        messages=[
         {"role": "system", "content": "You are a helpful assistant for text summarization."},
         {"role": "user", "content": f"Summarize this for a {person_type}: {prompt}"},
        ],
    )
    return chat.choices[0].message.content

A função generate_summarizer utiliza vários parâmetros para gerar resumos usando a API da OpenAI. Cada parâmetro tem um propósito específico para controlar como a geração de texto é realizada:

model: Este parâmetro especifica qual modelo de linguagem da OpenAI será usado para gerar o texto. Modelos diferentes podem incluir versões como “gpt-3.5-turbo” ou “gpt-4”, que se referem às versões e capacidades do modelo de linguagem da OpenAI.
max_tokens: Define o número máximo de tokens (palavras ou peças de palavras) que podem ser gerados pelo modelo. Um “token” pode ser uma palavra inteira ou parte de uma palavra, por isso não é exatamente o mesmo que a contagem de palavras. Este limite ajuda a controlar o comprimento do texto de saída.
top_p (Nucleus Sampling): É um método de amostragem que considera apenas as previsões mais prováveis do modelo. O valor de top_p define o limite para essas previsões. Por exemplo, um top_p de 0.1 significa que apenas as previsões que constituem os 10% superiores em termos de probabilidade serão consideradas para a geração do texto.
frequency_penalty: Este parâmetro ajuda a evitar a repetição. Um valor positivo desencoraja a repetição de palavras ou frases já usadas, enquanto um valor negativo pode encorajar a repetição. Um valor de 0 significa que não há penalidade de frequência aplicada.
temperature: Este parâmetro controla o nível de aleatoriedade ou criatividade na resposta do modelo. Uma temperatura mais alta (próxima de 1) resulta em respostas mais variadas e criativas, enquanto uma temperatura mais baixa (próxima de 0) gera respostas mais previsíveis e conservadoras.
prompt: O texto de entrada que serve como ponto de partida para o modelo gerar o resumo. Este é o texto que você deseja resumir.
person_type: Este parâmetro é usado para personalizar a saída do modelo com base no tipo de pessoa para quem o resumo é destinado, como “cientista”, “estudante”, etc. Isso é útil para ajustar o estilo e o nível de detalhe do resumo de acordo com o público-alvo.

Esses parâmetros permitem uma grande flexibilidade e personalização no processo de geração de texto, tornando a ferramenta adaptável a uma variedade de necessidades e contextos de sumarização.

Obs: Note que para utilizar o modelo é necessário a chave de API fornecida pela OpenAI.

Frontend

O frontend do projeto foi desenvolvido usando Streamlit, uma biblioteca Python que facilita a criação de aplicações web para análise de dados. Nessa interface os usuários podem escolher entre diferentes modelos de linguagem, ajustar parâmetros de sumarização e inserir textos escritos ou em arquivos.

Todo o código usado nessa aplicação é mostrado a seguir:

  
import streamlit as st
from summarizer_model import generate_summarizer
from utils import text_extractor

with open("styles.css") as f:
    st.markdown(f"<style>{f.read()}</style>", unsafe_allow_html=True)

# Carregar e exibir a imagem
image_path = 'images/header_image.png'  # Caminho para a imagem
st.image(image_path, use_column_width=True)

# Set the application title
st.title("Sumarizador de texto")

resume = """
Bem-vindo ao nosso Sumarizador de Texto alimentado por modelos ChatGPT!
Esta ferramenta foi desenvolvida para simplificar e agilizar o processo de resumir textos extensos. 
"""
st.markdown(f"<p style='text-align: justify;'>{resume}</p>", unsafe_allow_html=True)

col1, col2 = st.columns(2)

#Selection box to select the summarization style
with col1:
    model = st.selectbox(
        "Escolha o modelo",
        (
            "gpt-3.5-turbo",
            "gpt-4",
            
        ),
    )

#Showing the current parameter used for the model 
with col2:
    person_type = st.selectbox(
        "Quem você gostaria que fizesse o resumo?",
        (   
            "Cientista",
            "Estudante universitário",
            "Aluno de ensino médio",
            "Dona de casa",
            "Aposentado",
            'Outro',
        ),
    )

    if person_type == 'Outro':
        person_type = st.text_input("Digite o tipo de pessoa:", "")

st.markdown("<h1 style='font-size: 20px;'>Ajuste os hiperparâmetros</h1>", unsafe_allow_html=True)
col1, col2 = st.columns(2)
with col1:
    token = st.slider("Max Tokes", min_value=0.0, max_value=200.0, value=50.0, step=1.0)
    top_p = st.slider("Nucleus Sampling", min_value=0.0, max_value=1.0, value=0.5, step=0.01)
with col2:
    f_pen = st.slider("Frequency Penalty", min_value=-1.0, max_value=1.0, value=0.0, step=0.01)
    temp = st.slider("Temperature", min_value=0.0, max_value=1.0, value=0.0, step=0.01)

col1, col2 = st.columns(2)

# Provide the input area for text to be summarized
input_text = st.text_area("Digite o texto que deseja resumir:", height=200)

# file upload area
uploaded_file = st.file_uploader("Ou, escolha um arquivo:", type=["txt", "pdf", "docx"])

# Creating button for execute the text summarization
if st.button("Sumarizar"):
    if uploaded_file is not None:
        input_text = text_extractor(uploaded_file)

    with st.spinner('Por favor, aguarde...'):
        st.write(generate_summarizer(model, token, temp, top_p, f_pen, input_text, person_type))
 

Funcionalidades Detalhadas

Escolha de Modelos

Os usuários têm a opção de escolher entre diferentes modelos de linguagem, como GPT-3.5 e GPT-4, adaptando-se às suas necessidades específicas de sumarização.

Personalização de Sumarização

A ferramenta permite que os usuários definam o estilo de sumarização baseado no tipo de pessoa (cientista, estudante, etc.), tornando os resumos mais personalizados.

Ajuste de Hiperparâmetros

Os usuários podem ajustar hiperparâmetros como tokens, nucleus sampling, frequência de penalidade e temperatura, para refinar os resultados da sumarização.

Entrada de Texto e Upload de Arquivos

Além de digitar o texto diretamente, os usuários podem carregar arquivos em formatos como .txt, .pdf e .docx para sumarização.

Como o Sumarizador Funciona

Entrada de Texto: O usuário insere o texto ou carrega um arquivo.
Processamento: O backend envia o texto para o modelo GPT escolhido, processando-o de acordo com os parâmetros definidos.
Geração de Sumário: O modelo gera um sumário que é então exibido na interface.

Tecnologias Utilizadas

Python: Linguagem de programação para o desenvolvimento do backend e frontend.
OpenAI API: Para acessar os modelos GPT.
Streamlit: Para construir a interface web interativa.
python-dotenv: Para gerenciar variáveis de ambiente.

Nota: Todo o código está disponível no Github

Caso tenha interesse, você pode me encontrar no GitHub e LinkedIn.

Projetos

This post is licensed under CC BY 4.0 by the author.