{
"cells": [
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# Capítulo 1: Introdução à Visão Computacional"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"\n",
"\n",
"## 🟡⚫ Google Colab, Linux e Bibliotecas\n",
"\n",
"O **Google Colab** (Colaboratory) é uma ferramenta poderosa e acessível para tarefas de **visão computacional**. Neste material, exploraremos como essa plataforma pode facilitar o desenvolvimento de projetos nessa área, desde a configuração inicial até o uso de recursos avançados. Além disso, veremos por que o Google Colab se tornou essencial para pesquisadores, estudantes e entusiastas da visão computacional. \n",
"\n",
"### Por que usar o Google Colab? \n",
"\n",
"O Google Colab é uma ferramenta gratuita fornecida pelo Google que permite a execução de código **Python** diretamente no navegador. Baseado no **Jupyter Notebook**, ele é especialmente útil para tarefas que demandam alto poder computacional, como **aprendizado de máquina** e **visão computacional**. Seu ambiente integrado elimina a necessidade de configurações locais complexas, tornando-se uma opção prática e acessível para estudantes, pesquisadores e desenvolvedores. \n",
"\n",
"**Principais Vantagens para Visão Computacional** \n",
"\n",
"✅ **Gratuito e acessível** – Qualquer usuário com uma conta Google pode utilizá-lo, sem necessidade de infraestrutura própria. \n",
"✅ **Acesso a hardware avançado** – Uso gratuito de **GPUs** e **TPUs**, essenciais para o treinamento e inferência de modelos complexos. \n",
"✅ **Integração com o Google Drive** – Facilita o armazenamento e o acesso a grandes conjuntos de dados. \n",
"✅ **Colaboração em tempo real** – Permite que vários usuários editem simultaneamente o mesmo notebook, ideal para projetos em equipe. \n",
"✅ **Ambiente interativo** – Suporte a células de código e texto, proporcionando uma experiência eficiente para desenvolvimento, documentação e visualização de resultados. \n",
"\n",
"**Configurando um Notebook no Google Colab** \n",
"\n",
"- **Acessando o Colab** \n",
" - Acesse o [Google Colab](https://colab.research.google.com). \n",
" - Faça login com sua conta Google. \n",
"\n",
"- **Criando um novo notebook** \n",
" - Vá até **\"Arquivo\"** > **\"Novo Notebook\"**. \n",
" - Comece a escrever e executar código Python imediatamente. \n",
"\n",
"- **Configurando o hardware** \n",
" - Para utilizar **GPUs** ou **TPUs**, acesse **\"Ambiente de execução\"** > **\"Alterar tipo de ambiente de execução\"**. \n",
" - Em **\"Acelerador de hardware\"**, selecione **\"GPU\"** ou **\"TPU\"**, conforme necessário. \n",
"\n",
"- **Salvando seu trabalho** \n",
" - O notebook é salvo automaticamente no seu **Google Drive**. \n",
" - Para salvar manualmente ou criar uma cópia, vá em **\"Arquivo\"** e selecione a opção desejada.\n",
" \n",
"\n",
"### Gerenciando Bibliotecas com `pip` \n",
"\n",
"O `pip` (Python Package Installer) é o gerenciador de pacotes padrão do Python. Ele permite instalar, atualizar, remover e gerenciar versões de bibliotecas, facilitando o controle de dependências nos projetos. \n",
"\n",
"No Google Colab, todos os comandos do `pip` podem ser executados diretamente no ambiente usando `!pip` no início. \n",
"\n",
"\n",
"Instalando Bibliotecas \n",
"\n",
"Para projetos de **Visão Computacional**, algumas das bibliotecas mais utilizadas incluem: \n",
"\n",
"```python\n",
"# Instalação de bibliotecas essenciais\n",
"!pip install numpy opencv-python matplotlib scikit-image pillow\n",
"``` \n",
"\n",
"Se precisar instalar múltiplos pacotes ao mesmo tempo, basta separá-los por espaço. \n",
"\n",
"\n",
"**Listando Pacotes Instalados** \n",
"\n",
"Para verificar quais bibliotecas estão instaladas no ambiente e suas respectivas versões: \n",
"\n",
"```python\n",
"# Listar todos os pacotes instalados\n",
"!pip list\n",
"\n",
"# Mostrar informações detalhadas sobre um pacote específico (exemplo: OpenCV)\n",
"!pip show opencv-python\n",
"``` \n",
"\n",
"**Gerando e Utilizando um Arquivo de Requisitos** \n",
"\n",
"O comando `pip freeze` lista todos os pacotes instalados no formato `nome==versão`, útil para replicar ambientes. \n",
"\n",
"```python\n",
"# Gerar um arquivo requirements.txt com todas as dependências do ambiente\n",
"!pip freeze > requirements.txt\n",
"\n",
"# Instalar dependências a partir de um arquivo requirements.txt\n",
"!pip install -r requirements.txt\n",
"``` \n",
"\n",
"Isso permite compartilhar o ambiente com outros desenvolvedores ou restaurá-lo posteriormente. \n",
"\n",
"\n",
"**Verificando e Especificando Versões de Pacotes** \n",
"\n",
"Para garantir compatibilidade, você pode instalar versões específicas: \n",
"\n",
"```python\n",
"# Instalar uma versão exata (exemplo: numpy 1.21.0)\n",
"!pip install numpy==1.21.0\n",
"```\n",
"\n",
"**Caso queira listar as versões disponíveis de um pacote, utilize:** \n",
"\n",
"```python\n",
"# Listar versões disponíveis de um pacote usando PyPI\n",
"!pip index versions numpy\n",
"``` \n",
"\n",
"Caso o comando acima não funcione no seu ambiente, outra alternativa é verificar diretamente no [PyPI](https://pypi.org/project/numpy/#history). \n",
"\n",
"\n",
"**Atualizando Pacotes**\n",
"\n",
"Para manter suas bibliotecas sempre atualizadas: \n",
"\n",
"```python\n",
"# Atualizar um pacote específico\n",
"!pip install --upgrade numpy\n",
"```\n",
"\n",
"**Caso queira verificar quais pacotes estão desatualizados e atualizá-los: ** \n",
"\n",
"```python\n",
"# Listar pacotes desatualizados\n",
"!pip list --outdated\n",
"\n",
"# Atualizar todos os pacotes (use com cautela)\n",
"!pip list --outdated | cut -d ' ' -f 1 | xargs -n1 pip install -U\n",
"``` \n",
"\n",
"\n",
"**Desinstalando Pacotes** \n",
"\n",
"Se precisar remover um pacote do ambiente, use: \n",
"\n",
"```python\n",
"# Remover um pacote (exemplo: numpy)\n",
"!pip uninstall numpy -y\n",
"``` \n",
"O argumento `-y` confirma a remoção automaticamente. \n",
"\n",
"### O que cada biblioteca faz? \n",
"\n",
"- **NumPy** – Manipulação eficiente de arrays e matrizes, essencial para processamento numérico e imagens. \n",
"- **OpenCV** – Biblioteca poderosa para processamento de imagens e vídeos, incluindo filtros, transformações e detecção de objetos. \n",
"- **Matplotlib** – Ferramenta para visualização de gráficos e exibição de imagens processadas. \n",
"- **Scikit-Image** – Conjunto avançado de algoritmos para análise e manipulação de imagens. \n",
"- **Pillow** – Manipulação e conversão de imagens em diversos formatos. \n",
"\n",
"💡 **Dica:** No Google Colab, muitas dessas bibliotecas já vêm pré-instaladas. Porém, rodar o comando acima garante que você tenha a versão mais atualizada para o seu projeto. \n",
"\n",
"Aqui está uma versão aprimorada da tabela, incluindo melhorias na formatação, novas explicações e o uso do `nohup` para executar comandos em segundo plano: \n",
"\n",
"\n",
"### Comandos e Terminal Linux \n",
"\n",
"Como estamos trabalhando em uma máquina virtual Linux no Google Colab, podemos utilizar comandos do terminal para gerenciar arquivos, configurar o ambiente e realizar diversas tarefas administrativas. Isto também é útil para computadores rodando SO Linux. \n",
"\n",
"> 📌 **No Google Colab, os comandos do terminal devem ser precedidos por `!`.** \n",
"\n",
"**Exemplos de Comandos Úteis** \n",
"\n",
"| Comando | Descrição | Exemplo de Uso |\n",
"|------------------------------------|--------------------------------------------------|------------------------------|\n",
"| **Listar arquivos e diretórios** | Exibe arquivos e pastas no diretório atual | `ls` |\n",
"| **Listar arquivos com detalhes** | Mostra permissões, tamanho e data de modificação | `ls -l` |\n",
"| **Exibir estrutura de diretórios** | Mostra a árvore de diretórios e arquivos | `tree` |\n",
"| **Mudar de diretório** | Acessa um diretório específico | `cd /content/meu_diretorio` |\n",
"| **Criar um novo diretório** | Cria uma pasta | `mkdir novo_diretorio` |\n",
"| **Mover ou renomear** | Move ou renomeia um arquivo ou diretório | `mv arquivo.txt novo_diretorio/` |\n",
"| **Copiar um arquivo ou diretório** | Copia um arquivo ou pasta | `cp arquivo.txt copia_arquivo.txt` |\n",
"| **Remover um arquivo** | Deleta um arquivo específico | `rm arquivo.txt` |\n",
"| **Remover um diretório** | Exclui uma pasta e seu conteúdo | `rm -r pasta_a_remover` |\n",
"| **Verificar o caminho atual** | Exibe o caminho do diretório onde você está | `pwd` |\n",
"| **Verificar espaço em disco** | Mostra o uso do disco | `df -h` |\n",
"| **Verificar memória disponível** | Exibe o uso da RAM | `free -h` |\n",
"| **Exibir uso da CPU em tempo real**| Mostra os processos ativos e consumo de CPU | `top` |\n",
"| **Exibir processos em execução** | Lista processos rodando no sistema | `ps aux` |\n",
"| **Rodar um processo em segundo plano** | Executa um comando sem interrupção, mesmo após fechar o Colab | `nohup python meu_script.py &` |\n",
"| **Ver conteúdo de um arquivo** | Exibe o conteúdo de um arquivo de texto | `cat arquivo.txt` |\n",
"| **Buscar texto dentro de arquivos**| Procura por palavras ou padrões dentro de arquivos | `grep \"erro\" log.txt` |\n",
"| **Alterar permissões de um arquivo** | Modifica permissões de leitura, escrita e execução | `chmod +x script.sh` (torna executável) |\n",
"\n",
"Caso precise de mais comandos ou explicações, é só avisar! 🚀\n",
"\n",
"**Executando Comandos em Segundo Plano com `nohup`** \n",
"\n",
"Se você deseja rodar um script que pode demorar (como o treinamento de um modelo de Visão Computacional) sem que ele seja interrompido ao fechar a aba do Colab, use `nohup`: \n",
"\n",
"```bash\n",
"!nohup python meu_script.py > saida.log 2>&1 &\n",
"```\n",
"\n",
"🔹 **Explicação:** \n",
"- `nohup` impede que o processo seja encerrado ao fechar o terminal. \n",
"- `> saida.log` salva a saída do programa no arquivo `saida.log`. \n",
"- `2>&1` redireciona mensagens de erro para o mesmo arquivo de saída. \n",
"- `&` executa o processo em segundo plano. \n",
"\n",
"💡 Para acompanhar a execução, visualize a saída do log com: \n",
"\n",
"```bash\n",
"!tail -f saida.log\n",
"```\n"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Ambientes Virtuais em Python \n",
"\n",
"**Para que servem?** \n",
"✔ Isolam dependências por projeto \n",
"✔ Evitam conflitos de versões \n",
"✔ Mantêm o Python global limpo \n",
"\n",
"**🐍 Principais Gerenciadores** \n",
"\n",
"- **venv** (Padrão Python) [Projeto](https://docs.python.org/3/library/venv.html) \n",
"```bash\n",
"python -m venv env # Cria\n",
"source env/bin/activate # Ativa (Linux/Mac) | env\\Scripts\\activate (Win)\n",
"deactivate # Desativa\n",
"```\n",
"\n",
"- **conda** (Anaconda/Miniconda) [Projeto](https://docs.conda.io/en/latest/) \n",
"```bash\n",
"conda create -n env python=3.9 # Cria\n",
"conda activate env # Ativa\n",
"conda deactivate # Desativa\n",
"```\n",
"\n",
"- **virtualenv** (Alternativa) [Projeto](https://virtualenv.pypa.io/en/latest/) \n",
"```bash\n",
"pip install virtualenv # Instala\n",
"virtualenv env # Cria\n",
"source env/bin/activate # Ativa (Linux/Mac) | env\\Scripts\\activate (Win)\n",
"deactivate # Desativa\n",
"```\n",
"\n",
"- **pipenv** (Pip + Virtualenv) [Projeto](https://pipenv.pypa.io/en/latest/) \n",
"```bash\n",
"pip install pipenv # Instala\n",
"pipenv install # Cria e instala pacotes\n",
"pipenv shell # Ativa\n",
"exit # Desativa\n",
"```\n",
"\n",
"- **Poetry** (Moderno) [Projeto](https://python-poetry.org/docs/) \n",
"```bash\n",
"pip install poetry # Instala\n",
"poetry new projeto # Cria projeto\n",
"poetry shell # Ativa\n",
"exit # Desativa\n",
"```\n",
"\n",
"**Exemplo de Fluxo de Trabalho Típico com o Conda** \n",
"```bash\n",
"# Criar ambiente com Python 3.10 e pacotes básicos\n",
"conda create -n meu_projeto python=3.10 numpy pandas -y\n",
"\n",
"# Ativar o ambiente\n",
"conda activate meu_projeto\n",
"\n",
"# Instalar pacotes adicionais (usando conda ou pip)\n",
"conda install matplotlib scikit-learn # via conda\n",
"pip install opencv-python # via pip se não disponível no conda\n",
"\n",
"# Listar pacotes instalados\n",
"conda list\n",
"\n",
"# Exportar configuração do ambiente\n",
"conda env export > environment.yml\n",
"\n",
"# Desativar o ambiente\n",
"conda deactivate\n",
"\n",
"# --- Para recriar o ambiente em outra máquina ---\n",
"conda env create -f environment.yml\n",
"conda activate meu_projeto\n",
"``` "
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### 📂 EXERCÍCIO: Manipulação de Arquivos no Terminal Linux (Google Colab)\n",
"\n",
"INSTRUÇÕES:\n",
"- Execute cada comando na ordem apresentada.\n",
"- Complete os trechos indicados com \"???\", inserindo os comandos corretos.\n",
"\n",
"Sobre a Exclamação (!) no Google Colab:\n",
"\n",
"No Google Colab, comandos de terminal Linux podem ser executados diretamente nas células do notebook usando **\"!\" (exclamação) antes do comando**. Isso permite rodar comandos como `ls`, `mkdir`, `mv` e muitos outros, como se estivéssemos em um terminal Linux comum. "
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"```bash\n",
"# Baixando uma imagem da internet com o comando wget\n",
"!wget -O minha_imagem.jpg https://upload.wikimedia.org/wikipedia/commons/thumb/3/3a/Cat03.jpg/800px-Cat03.jpg\n",
"\n",
"# Desafio: Liste os arquivos no diretório atual para garantir que a imagem foi baixada\n",
"!???\n",
"```\n",
"\n",
"```bash\n",
"# Exibir o caminho do diretório atual\n",
"!pwd \n",
"\n",
"# Listar os arquivos e diretórios presentes no ambiente de trabalho\n",
"!ls -lh\n",
"```\n",
"\n",
"```bash\n",
"# Criar um diretório chamado \"imagens\"\n",
"!mkdir imagens\n",
"\n",
"# Desafio: Mover a imagem baixada para dentro do diretório recém-criado\n",
"!mv ??? imagens/\n",
"\n",
"# Verificar os arquivos dentro da pasta \"imagens\" para garantir que a imagem foi movida\n",
"!ls -lh imagens/\n",
"```\n",
"\n",
"```bash\n",
"# Criar uma cópia da imagem dentro do mesmo diretório\n",
"!cp imagens/minha_imagem.jpg imagens/minha_imagem_backup.jpg\n",
"\n",
"# Desafio: Renomear a cópia da imagem para \"foto_gato.jpg\"\n",
"!mv ??? imagens/foto_gato.jpg\n",
"\n",
"# Verificar os arquivos na pasta para confirmar as mudanças\n",
"!ls -lh imagens/\n",
"```\n",
"\n",
"```bash\n",
"# Desafio: Remover a imagem \"foto_gato.jpg\" da pasta \"imagens\"\n",
"!rm ???\n",
"\n",
"# Excluir a pasta inteira e seu conteúdo (CUIDADO!)\n",
"!rm -r imagens\n",
"\n",
"# Desafio: Listar novamente os arquivos no diretório atual para garantir que a pasta foi removida\n",
"!???\n",
"```\n",
"\n",
"```python\n",
"# Conectar o Colab ao Google Drive (Execute apenas uma vez)\n",
"from google.colab import drive\n",
"drive.mount('/content/drive')\n",
"```\n",
"\n",
"```bash\n",
"# Criar um diretório no Google Drive\n",
"!mkdir /content/drive/MyDrive/meus_arquivos_colab\n",
"\n",
"# Desafio: Mover um arquivo para o Google Drive\n",
"!mv ??? /content/drive/MyDrive/meus_arquivos_colab/\n",
"\n",
"# Verificar se o arquivo foi salvo corretamente\n",
"!ls -lh /content/drive/MyDrive/meus_arquivos_colab/\n",
"```\n",
"\n",
"```bash\n",
"# Criar um script de teste que roda infinitamente\n",
"!echo \"while true; do echo 'Rodando...'; sleep 5; done\" > processo.sh\n",
"\n",
"# Executar o script em segundo plano com 'nohup'\n",
"!nohup bash processo.sh > saida.log 2>&1 &\n",
"\n",
"# Desafio: Visualizar o log gerado em tempo real\n",
"!tail -f ???\n",
"\n",
"# Desafio final: Encontrar o PID do processo e finalizá-lo\n",
"!ps aux | grep ???\n",
"!kill -9 ???\n",
"```"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"🧐 Reflexão Final \n",
"\n",
"Agora que você completou o exercício, **pare e reflita** sobre cada comando executado. \n",
"\n",
"- Você conseguiu compreender o que cada um deles faz? \n",
"- Foi capaz de resolver os desafios sem olhar diretamente a resposta? \n",
"- Caso tenha encontrado dificuldades, onde exatamente ocorreu a dúvida? \n",
"\n",
"Tente **explicar detalhadamente** cada comando e processo para um colega ou para você mesmo. Se puder ensinar alguém, significa que realmente compreendeu. \n",
"\n",
"Por fim, esteja preparado para **apresentar e justificar** suas respostas ao professor. Se houver algo que não entendeu, volte, revise e tente mais uma vez!\n"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## 👁️ Conceitos de Visão Computacional \n",
"\n",
"A **Visão Computacional** é um ramo da Ciência da Computação que permite que máquinas processem e interpretem imagens e vídeos, replicando a percepção visual humana. Através de algoritmos avançados, os computadores analisam padrões visuais e extraem informações úteis para diversas aplicações. \n",
"\n",
"Uma das áreas mais conhecidas é o **reconhecimento facial**, que identifica indivíduos com base em características únicas do rosto. Essa tecnologia está presente em sistemas de segurança, redes sociais e autenticação biométrica. Outra aplicação essencial é a **detecção de objetos**, utilizada em veículos autônomos e sistemas de vigilância para identificar pedestres, placas e obstáculos em tempo real. \n",
"\n",
"Na área da saúde, a Visão Computacional auxilia na **análise de imagens médicas**, tornando exames como radiografias e tomografias mais precisos na detecção de doenças. Em segurança, sistemas inteligentes são capazes de monitorar ambientes, reconhecendo atividades suspeitas e alertando operadores sobre possíveis ameaças. Já na **realidade aumentada (AR)**, a tecnologia permite sobrepor elementos virtuais ao mundo real, criando experiências imersivas para jogos, treinamentos e comércio. \n",
"\n",
"### Imagem Digital: Pixels, Resolução e Canais de Cor \n",
"\n",
"Toda imagem digital é composta por **pixels**, que são as menores unidades visuais. A quantidade total de pixels determina a **resolução**, expressa como largura × altura (exemplo: 1920×1080), influenciando diretamente a qualidade da imagem. \n",
"\n",
"As cores são representadas por diferentes canais. No modelo **RGB (Red, Green, Blue)**, cada pixel combina três intensidades de cor para formar uma ampla variedade de tons. Essa estrutura permite que computadores processem imagens de forma eficiente e reproduzam cores com fidelidade. \n",
"\n",
"### Tipos de Imagens \n",
"\n",
"As imagens digitais podem ter diferentes representações, dependendo da aplicação. No modelo **RGB**, cada pixel possui três valores (vermelho, verde e azul), sendo o formato mais comum para fotografias e vídeos. Já as imagens em **escala de cinza** utilizam apenas tons de preto ao branco, sendo amplamente empregadas em exames médicos e reconhecimento de padrões. Por fim, as **imagens binárias** contêm apenas dois valores (preto e branco) e são usadas em segmentação de objetos e reconhecimento óptico de caracteres (OCR).\n",
"\n",
"Veja a Ilustração a seguir sobre uma imagem digital. \n",
"\n",
"\n",
"\n",
"A seguir, nosso primeiro exemplo prático sobre representação de imagens em diferentes formatos. \n",
"Geraremos uma imagem **RGB** com gradientes de cor, convertê-la-emos para **tons de cinza** usando o canal verde e, por fim, aplicaremos um limiar para criar uma **imagem binária**. \n",
"\n",
"O código abaixo demonstra esse processo visualmente."
]
},
{
"cell_type": "code",
"execution_count": 5,
"metadata": {},
"outputs": [
{
"data": {
"image/png": "",
"text/plain": [
""
]
},
"metadata": {},
"output_type": "display_data"
}
],
"source": [
"import numpy as np\n",
"import matplotlib.pyplot as plt\n",
"import warnings\n",
"\n",
"# Ignorar avisos do Matplotlib para evitar mensagens desnecessárias\n",
"warnings.filterwarnings(\"ignore\", category=UserWarning, module=\"matplotlib\")\n",
"\n",
"# Criar uma imagem RGB com gradientes suaves\n",
"img_rgb = np.zeros((256, 256, 3), dtype=np.uint8) # Inicializa uma matriz de zeros (imagem preta) com 3 canais de cor (RGB)\n",
"\n",
"# Preenchendo os canais de cor com gradientes:\n",
"img_rgb[:, :, 0] = np.linspace(0, 255, 256, dtype=np.uint8).reshape((256, 1)) # Canal Vermelho (R): varia verticalmente\n",
"img_rgb[:, :, 1] = np.linspace(0, 255, 256, dtype=np.uint8).reshape((1, 256)) # Canal Verde (G): varia horizontalmente\n",
"img_rgb[:, :, 2] = np.flip(img_rgb[:, :, 1], axis=1) # Canal Azul (B): inverso do verde, criando um gradiente oposto\n",
"\n",
"# Converter a imagem para tons de cinza usando apenas o canal verde\n",
"img_grayscale = img_rgb[:, :, 1] # Mantemos apenas os valores do canal verde\n",
"\n",
"# Criar uma imagem binária (thresholding) com limiar de 127\n",
"img_binary = (img_grayscale > 127).astype(np.uint8) * 255 # Pixels acima do limiar tornam-se brancos (255), os demais pretos (0)\n",
"\n",
"# Criar a figura com 3 subplots para exibir as diferentes representações da imagem\n",
"fig, axes = plt.subplots(1, 3, figsize=(12, 4)) # Cria um layout de 1 linha e 3 colunas\n",
"\n",
"# Definição dos títulos e das imagens a serem exibidas\n",
"titles = [\"RGB\", \"Grayscale (Canal Verde)\", \"Binária\"]\n",
"images = [img_rgb, img_grayscale, img_binary]\n",
"cmaps = [None, \"gray\", \"gray\"] # Definição do colormap para cada imagem (apenas grayscale e binária precisam de escala cinza)\n",
"\n",
"# Loop para exibir as imagens nos subplots\n",
"for ax, img, title, cmap in zip(axes, images, titles, cmaps):\n",
" ax.imshow(img, cmap=cmap) # Mostra a imagem\n",
" ax.set_title(title) # Define o título da imagem\n",
" ax.axis(\"off\") # Remove os eixos para melhor visualização\n",
"\n",
"# Ajusta o espaçamento entre os gráficos para melhor exibição\n",
"plt.tight_layout()\n",
"plt.show() # Exibe as imagens\n"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Processamento Digital de Imagens\n",
"\n",
"### O que é Processamento Digital de Imagens?\n",
"\n",
"O **processamento digital de imagens** envolve a aplicação de algoritmos computacionais para modificar, aprimorar ou extrair informações de imagens digitais. Essa área tem um papel fundamental em diversas aplicações, como medicina, segurança, automação e inteligência artificial. As imagens processadas podem ser adquiridas por câmeras digitais, scanners ou sensores especializados, como aqueles usados em exames médicos e sistemas de vigilância.\n",
"\n",
"### Principais Etapas do Processamento de Imagens\n",
"\n",
"O processamento de imagens envolve diversas etapas essenciais, cada uma com objetivos específicos para a manipulação e extração de informação visual.\n",
"\n",
"#### Aquisição da Imagem\n",
"\n",
"A etapa inicial consiste na captura da imagem por meio de dispositivos como câmeras digitais, sensores embarcados ou scanners. O resultado é uma imagem digital que servirá como base para as próximas fases do processamento.\n",
"\n",
"**Exemplo:** Captura de imagens médicas, como tomografias, para análise computacional.\n",
"\n",
" \n",
"\n",
"#### Pré-processamento\n",
"\n",
"Antes da análise propriamente dita, a imagem precisa ser ajustada para melhorar sua qualidade e reduzir interferências. Essa etapa pode incluir:\n",
"\n",
"- **Remoção de ruído**: Uso de filtros espaciais, como o Gaussiano, para eliminar interferências indesejadas.\n",
"- **Ajuste de contraste**: Realce de detalhes por meio da manipulação da intensidade dos pixels.\n",
"- **Equalização de histograma**: Redistribui os níveis de cinza para melhorar a visibilidade de padrões.\n",
"- **Suavização**: Redução de variações abruptas na imagem para minimizar artefatos indesejados.\n",
"\n",
"**Exemplo:** Aplicação de um filtro Gaussiano para reduzir ruído em imagens biométricas.\n",
"\n",
" \n",
"\n",
"#### Segmentação\n",
"\n",
"A segmentação divide a imagem em regiões de interesse, isolando objetos do fundo. As principais técnicas incluem:\n",
"\n",
"- **Limiarização (thresholding)**: Separar pixels com base em um valor de intensidade, gerando uma imagem binária.\n",
"- **Segmentação baseada em regiões**: Agrupar pixels semelhantes para definir objetos distintos.\n",
"- **Detecção de bordas**: Identificar contornos de objetos por meio de mudanças abruptas de intensidade.\n",
"\n",
"**Exemplo:** Uso de limiarização para separar objetos em imagens de exames laboratoriais.\n",
"\n",
" \n",
"\n",
"#### Reconhecimento de Objetos\n",
"\n",
"Nesta etapa, os objetos previamente segmentados são analisados e classificados. As abordagens mais comuns incluem:\n",
"\n",
"- **Técnicas de aprendizado de máquina**: Algoritmos treinados para identificar padrões em imagens.\n",
"- **Redes neurais convolucionais (CNNs)**: Modelos avançados capazes de reconhecer categorias complexas de objetos.\n",
"- **Métodos baseados em características**: Análise de formas, texturas e padrões presentes na imagem.\n",
"\n",
"**Exemplo:** Identificação automática de camundongos em experimentos de neurociência.\n",
"\n",
" \n",
"\n",
"🔗 **Referência:** [Detecção de camundongos em experimentos](https://github.com/heltonmaia/ECT-proj-cnn-mice)\n",
"\n"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Abrindo uma Imagem com OpenCV \n",
"\n",
"Antes de realizarmos operações aritméticas com imagens, precisamos aprender a carregar uma imagem utilizando a biblioteca **OpenCV**. O OpenCV é uma das bibliotecas mais populares para processamento de imagens e visão computacional. \n",
"\n",
"Para abrir uma imagem, utilizamos a função `cv2.imread()`, que lê o arquivo e o armazena como um array NumPy. \n",
"\n",
"Lembre-se de que o OpenCV carrega imagens no formato **BGR (Blue, Green, Red)**, enquanto outras bibliotecas, como o Matplotlib, utilizam o padrão **RGB (Red, Green, Blue)**. Isso pode causar diferenças na exibição da imagem. \n",
"\n",
"\n",
"\n",
"\n",
"```python\n",
"import cv2\n",
"import matplotlib.pyplot as plt\n",
"\n",
"# Carregar a imagem\n",
"imagem = cv2.imread('imagem_exemplo.png')\n",
"\n",
"# Converter de BGR para RGB (padrão do OpenCV é BGR, mas o Matplotlib usa RGB)\n",
"imagem_rgb = cv2.cvtColor(imagem, cv2.COLOR_BGR2RGB)\n",
"\n",
"# Exibir a imagem\n",
"plt.imshow(imagem_rgb)\n",
"plt.title('Imagem Carregada')\n",
"plt.axis('off')\n",
"plt.show()\n",
"```\n",
"\n",
"**Explicação do código:** \n",
"🔹 `cv2.imread('imagem_exemplo.png')` – Carrega a imagem do arquivo. \n",
"🔹 `cv2.cvtColor(imagem, cv2.COLOR_BGR2RGB)` – Converte a imagem de BGR para RGB para exibição correta no Matplotlib. \n",
"🔹 `plt.imshow(imagem_rgb)` – Exibe a imagem com as cores corretas. \n",
"\n",
"Após carregar a imagem, podemos manipulá-la e aplicar diversas transformações!\n"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### 📝 Exercício: Baixar, Converter e Adicionar Texto com OpenCV\n",
"\n",
"**Objetivo:** \n",
"Você deverá baixar uma imagem da internet, convertê-la para escala de cinza, adicionar um texto personalizado e salvar o resultado no Google Drive. \n",
"\n",
"**Instruções** \n",
"\n",
"- **Baixe uma imagem da web** \n",
" - Use `requests` para baixar uma imagem de uma URL (exemplo: `\"https://heltonmaia.com/computervision/_images/cover.jpeg\"`). \n",
"\n",
"- **Converta para escala de cinza** \n",
" - Aplique `cv2.COLOR_BGR2GRAY` para transformar a imagem em preto e branco. \n",
"\n",
"- **Adicione um texto à imagem** \n",
" - Use `cv2.putText()` para inserir um texto (ex: `\"OpenCV Challenge\"`). \n",
" - Defina: \n",
" - Posição (`(x, y)`). \n",
" - Fonte (`cv2.FONT_HERSHEY_SIMPLEX`). \n",
" - Escala (`1.0`). \n",
" - Cor (`255` para branco em imagens em cinza). \n",
" - Espessura (`2`). \n",
"\n",
"- **Exiba a imagem processada** \n",
" - Mostre o resultado com `cv2.imshow()` (ou `cv2_imshow` no Google Colab). \n",
"\n",
"- **Salve no Google Drive** \n",
" - Monte o Drive (`drive.mount('/content/drive')`). \n",
" - Salve a imagem processada em uma pasta específica. \n",
"\n",
"---\n",
"\n",
"**💡 Dicas Úteis** \n",
"\n",
"**Posicionamento do texto:** \n",
" - Use `(50, 50)` para colocar o texto no canto superior esquerdo. \n",
"\n",
"**Se estiver no Google Colab:** \n",
" - Substitua `cv2.imshow()` por: \n",
" ```python\n",
" from google.colab.patches import cv2_imshow\n",
" cv2_imshow(imagem_processada) \n",
" ```\n"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"#### Operações Aritméticas com Imagens\n",
"\n",
"As operações aritméticas com imagens permitem manipular seus valores de pixel de maneira precisa, abrindo um leque de possibilidades para processamento e edição. As operações mais comuns incluem:\n",
"\n",
"**Adição:** A adição de imagens combina duas imagens somando os valores dos pixels correspondentes. A operação pode ser descrita matematicamente como:\n",
"\n",
"$I_{\\text{resultante}}(x, y) = I_1(x, y) + I_2(x, y)$\n",
"\n",
"onde $ I_{\\text{resultante}}(x, y) $ é o valor do pixel na posição $(x, y)$ da imagem resultante, $ I_1(x, y) $ é o valor do pixel na posição $(x, y)$ da primeira imagem, e $ I_2(x, y) $ é o valor do pixel na posição $(x, y)$ da segunda imagem.\n",
"\n",
"Essa operação é útil para:\n",
"\n",
"- **Combinar informações:** Ao adicionar imagens de diferentes fontes, podemos integrar informações e criar uma visão mais completa.\n",
"- **Ajustar o brilho:** Adicionar um valor constante a todos os pixels aumenta o brilho da imagem.\n",
"\n",
"Exemplo: Adicionar duas imagens e realizar uma combinação de informações.\n",
"\n",
"```python\n",
"import numpy as np\n",
"import matplotlib.pyplot as plt\n",
"\n",
"# Carregar as imagens\n",
"img1 = plt.imread('tropical1.png')\n",
"img2 = plt.imread('tropical2.png')\n",
"\n",
"# Verificar se as imagens têm o mesmo tamanho\n",
"if img1.shape != img2.shape:\n",
" raise ValueError(\"As imagens devem ter o mesmo tamanho para adição.\")\n",
"\n",
"# Adicionar as imagens\n",
"added_img = img1 + img2\n",
"\n",
"# Exibir as imagens lado a lado\n",
"fig, axs = plt.subplots(1, 3, figsize=(10, 5))\n",
"\n",
"# Exibir a primeira imagem\n",
"axs[0].imshow(img1)\n",
"axs[0].set_title('Imagem 1')\n",
"axs[0].axis('off')\n",
"\n",
"# Exibir a segunda imagem\n",
"axs[1].imshow(img2)\n",
"axs[1].set_title('Imagem 2')\n",
"axs[1].axis('off')\n",
"\n",
"# Exibir a imagem resultante da adição\n",
"axs[2].imshow(added_img)\n",
"axs[2].set_title('Imagem Resultante')\n",
"axs[2].axis('off')\n",
"plt.show()\n",
"```\n",
"Baixar [tropical1](tropical1.png) [tropical2](tropical2.png)\n",
"\n",
"Para evitar a saturação, como poderíamos melhorar o código para obter a imagem abaixo?\n",
"\n",
"\n",
"\n",
"**Subtração:** A subtração de imagens calcula a diferença entre os valores dos pixels correspondentes de duas imagens. A operação pode ser descrita matematicamente como:\n",
"\n",
"$ I_{\\text{resultante}}(x, y) = I_1(x, y) - I_2(x, y) $\n",
"\n",
"onde $ I_{\\text{resultante}}(x, y) $ é o valor do pixel na posição $(x, y)$ da imagem resultante, $ I_1(x, y) $ é o valor do pixel na posição $(x, y)$ da primeira imagem, e $ I_2(x, y)$ é o valor do pixel na posição $(x, y)$ da segunda imagem.\n",
"\n",
"Essa operação é útil para:\n",
"\n",
"- **Detectar diferenças:** A subtração pode destacar as diferenças entre duas imagens, como mudanças ao longo do tempo ou objetos movidos.\n",
"- **Isolar elementos:** Ao subtrair uma imagem de fundo de uma imagem com um objeto em primeiro plano, podemos isolar o objeto.\n",
"\n",
"Exemplo: Subtrair uma imagem de referência de outra para destacar as alterações ou isolar um objeto. Veja o exemplo a seguir, onde em um cenário sem muitos objetos, existe um sútil movimento de uma mulher caminhando.\n",
"\n",
"```python\n",
"import numpy as np\n",
"import matplotlib.pyplot as plt\n",
"\n",
"# Carregar as imagens\n",
"img1 = plt.imread('w1.png')\n",
"img2 = plt.imread('w2.png')\n",
"\n",
"# Subtrair as imagens\n",
"subtracted_img = img1 - img2\n",
"\n",
"# Exibir a imagem resultante da subtração\n",
"fig, axs = plt.subplots(1, 3, figsize=(10, 5))\n",
"\n",
"# Exibir a primeira imagem\n",
"axs[0].imshow(img1)\n",
"axs[0].set_title('Imagem 1')\n",
"axs[0].axis('off')\n",
"\n",
"# Exibir a segunda imagem\n",
"axs[1].imshow(img2)\n",
"axs[1].set_title('Imagem 2')\n",
"axs[1].axis('off')\n",
"\n",
"# Exibir a imagem resultante da subtração\n",
"axs[2].imshow(subtracted_img)\n",
"axs[2].set_title('Imagem Resultante')\n",
"axs[2].axis('off')\n",
"plt.show()\n",
"```\n",
"Baixar [walking1](w1.png) [walking2](w2.png)\n",
"\n",
"**Multiplicação:** A multiplicação de imagens pode ser realizada de duas maneiras:\n",
"\n",
"- **Multiplicação por uma constante:** Multiplicar uma imagem por uma constante altera o contraste da imagem. Um valor maior aumenta o contraste, enquanto um valor menor o reduz. A operação pode ser descrita matematicamente como:\n",
"\n",
"$ I_{\\text{resultante}}(x, y) = c \\cdot I(x, y) $\n",
"\n",
"onde $ I_{\\text{resultante}}(x, y) $ é o valor do pixel na posição $(x, y)$ da imagem resultante, $ c $ é a constante multiplicativa, e $ I(x, y) $ é o valor do pixel na posição $(x, y)$ da imagem original.\n",
"\n",
"- **Multiplicação por outra imagem:** Multiplicar duas imagens elemento a elemento pode ser usado para aplicar máscaras, onde uma imagem define áreas específicas para serem modificadas na outra imagem. A operação pode ser descrita matematicamente como:\n",
"\n",
"$ I_{\\text{resultante}}(x, y) = I_1(x, y) \\cdot I_2(x, y) $\n",
"\n",
"onde $ I_{\\text{resultante}}(x, y) $ é o valor do pixel na posição $(x, y)$ da imagem resultante, $ I_1(x, y) $ é o valor do pixel na posição $(x, y)$ da primeira imagem, e $ I_2(x, y) $ é o valor do pixel na posição $(x, y)$ da segunda imagem.\n",
"\n",
"Exemplo: Multiplicar uma imagem por uma constante para aumentar o contraste ou aplicar uma máscara para editar partes específicas da imagem. Utilize uma imagem de sua preferência.\n",
"\n",
"```python\n",
"# Multiplicação por uma constante\n",
"constant = 1.5\n",
"multiplied_img = img1 * constant\n",
"\n",
"# Exibir a imagem resultante da multiplicação por uma constante\n",
"fig, axs = plt.subplots(1, 2, figsize=(10, 5))\n",
"\n",
"# Exibir a imagem original\n",
"axs[0].imshow(img1)\n",
"axs[0].set_title('Imagem Original')\n",
"axs[0].axis('off')\n",
"\n",
"# Exibir a imagem resultante da multiplicação\n",
"axs[1].imshow(multiplied_img)\n",
"axs[1].set_title('Imagem com Contraste Aumentado')\n",
"axs[1].axis('off')\n",
"plt.show()\n",
"```\n",
"Baixar [walking1](w1.png) \n",
"\n",
"**Manipulação de pixels**\n",
"```python\n",
"# Cortar uma região da imagem\n",
"corte = img1[200:, 450:900] # observe a indexação linha x coluna\n",
"corte[10:20,100:300] = [0,1,0] # Acessando uma região de pixels e definindo para verde\n",
"\n",
"plt.imshow(corte)\n",
"```\n",
"\n",
"Essas operações básicas são fundamentais para manipulação e análise de imagens, permitindo ajustes precisos e modificações específicas que são essenciais em várias aplicações de Visão Computacional."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### 🎨 Conversão entre Espaços de Cor\n",
"\n",
"A conversão entre espaços de cor é essencial em processamento de imagens. O OpenCV (`cv2.cvtColor`) permite transformar imagens entre diferentes formatos (BGR, Grayscale, HSV, RGB, LAB). Abaixo, exemplos de conversão com visualização lado a lado usando `plt.imshow`:\n",
"\n",
"Baixar [walking3](w3.png) \n",
"\n",
"**- Carregar Imagem Original (BGR)**\n",
"```python\n",
"import cv2\n",
"import matplotlib.pyplot as plt\n",
"\n",
"img = cv2.imread('w3.png') # OpenCV carrega em BGR\n",
"img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) # Converter para RGB (Matplotlib)\n",
"plt.imshow(img_rgb)\n",
"plt.title('Original (RGB)')\n",
"```\n",
"\n",
"**- Conversões para Outros Espaços de Cor**\n",
"**BGR → Grayscale (Escala de Cinza)**\n",
"\n",
"```python\n",
"img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)\n",
"plt.figure(figsize=(12, 6))\n",
"plt.subplot(1, 2, 1), plt.imshow(img_rgb), plt.title('Original (RGB)'), plt.axis('off')\n",
"plt.subplot(1, 2, 2), plt.imshow(img_gray, cmap='gray'), plt.title('Grayscale'), plt.axis('off')\n",
"plt.tight_layout(), plt.show()\n",
"```\n",
"\n",
"**BGR → HSV (Matiz, Saturação, Valor)**\n",
"```python\n",
"img_hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)\n",
"plt.figure(figsize=(12, 6))\n",
"plt.subplot(1, 2, 1), plt.imshow(img_rgb), plt.title('Original (RGB)'), plt.axis('off')\n",
"plt.subplot(1, 2, 2), plt.imshow(img_hsv), plt.title('HSV'), plt.axis('off')\n",
"plt.tight_layout(), plt.show()\n",
"```\n",
"\n",
"**BGR → LAB (Luminância, Canais A/B)**\n",
"```python\n",
"img_lab = cv2.cvtColor(img, cv2.COLOR_BGR2LAB)\n",
"plt.figure(figsize=(12, 6))\n",
"plt.subplot(1, 2, 1), plt.imshow(img_rgb), plt.title('Original (RGB)'), plt.axis('off')\n",
"plt.subplot(1, 2, 2), plt.imshow(img_lab), plt.title('LAB'), plt.axis('off')\n",
"plt.tight_layout(), plt.show()\n",
"```\n",
"\n",
"**Visualização de Todos os Espaços de Cores**\n",
"```python\n",
"plt.figure(figsize=(16, 4))\n",
"plt.subplot(1, 4, 1), plt.imshow(img_rgb), plt.title('RGB'), plt.axis('off')\n",
"plt.subplot(1, 4, 2), plt.imshow(img_gray, cmap='gray'), plt.title('Grayscale'), plt.axis('off')\n",
"plt.subplot(1, 4, 3), plt.imshow(img_hsv), plt.title('HSV'), plt.axis('off')\n",
"plt.subplot(1, 4, 4), plt.imshow(img_lab), plt.title('LAB'), plt.axis('off')\n",
"plt.tight_layout(), plt.show()\n",
"```\n",
"\n",
"**Dicas Importantes:**\n",
"\n",
"**- OpenCV vs Matplotlib**: \n",
" - OpenCV usa **BGR** por padrão; Matplotlib usa **RGB**. Sempre converta com `cv2.COLOR_BGR2RGB` antes de exibir no `plt.imshow`.\n",
"\n",
"**- Canais Individuais (HSV/LAB)**: \n",
" Para visualizar canais separados (ex: H, S, V):\n",
" ```python\n",
" h, s, v = cv2.split(img_hsv)\n",
" plt.imshow(h, cmap='gray'), plt.title('Canal H (Matiz)'), plt.axis('off'), plt.show()\n",
" ```\n",
"\n",
"**- Transições Suaves (Vídeo)**: \n",
" Para criar um vídeo de transição entre espaços de cor (como no exemplo do link), use `cv2.VideoWriter` interpolando os valores de conversão quadro a quadro.\n",
"\n",
"Aproveite que estudou sobre como transitar em diferente canais de cor e tente fazer um vídeo como este do [link](color_transitions_slowmotion.mp4).\n"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Transformações Geométricas\n",
"\n",
"As transformações geométricas permitem modificar a posição, orientação e escala de uma imagem. Abaixo, exemplos de **translação**, **rotação**, **escala**, **perspectiva** e **operações aritméticas**, seguindo o mesmo padrão de formatação e exibição usado no exemplo de rotação. \n",
"\n",
"**- Translação (Deslocamento)** \n",
"Desloca a imagem nos eixos **x** e **y** usando uma matriz de transformação afim: \n",
"\n",
"```python\n",
"matriz_translacao = np.float32([[1, 0, deslocamento_x], # [a, b, tx] → controla eixo X \n",
" [0, 1, deslocamento_y]]) # [c, d, ty] → controla eixo Y \n",
"``` \n",
"**Onde:** \n",
"- `1` e `0` mantêm a escala original (sem distorção) \n",
"- `deslocamento_x` e `deslocamento_y` definem o movimento em pixels \n",
"- Valores positivos: direita/baixo | Valores negativos: esquerda/cima \n",
"\n",
"**Exemplo:** \n",
"```python\n",
"import cv2 \n",
"import numpy as np \n",
"import matplotlib.pyplot as plt \n",
"\n",
"img = cv2.imread('w3.png') \n",
"img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) \n",
"\n",
"# Aplica translação \n",
"deslocamento_x, deslocamento_y = 50, 100 \n",
"img_transladada = cv2.warpAffine(img, matriz_translacao, (img.shape[1], img.shape[0])) \n",
"\n",
"# Exibe resultados \n",
"plt.figure(figsize=(12, 6)) \n",
"plt.subplot(1, 2, 1), plt.imshow(img), plt.title('Original'), plt.axis('off') \n",
"plt.subplot(1, 2, 2), plt.imshow(img_transladada), plt.title(f'Transladada ({deslocamento_x}, {deslocamento_y})'), plt.axis('off') \n",
"plt.show() \n",
"``` \n",
"\n",
"**Saída:** \n",
"- Imagem original (esquerda) e transladada (direita) \n",
"- Áreas deslocadas além dos limites ficam pretas.\n",
"\n",
"**- Rotação** \n",
"Gira a imagem em torno de um ponto central (`cv2.getRotationMatrix2D`). \n",
"\n",
"```python\n",
"(h, w) = img.shape[:2]\n",
"centro = (w // 2, h // 2)\n",
"angulo = 45 # Graus\n",
"escala = 1.0\n",
"matriz_rotacao = cv2.getRotationMatrix2D(centro, angulo, escala)\n",
"img_rotacionada = cv2.warpAffine(img, matriz_rotacao, (w, h))\n",
"\n",
"plt.figure(figsize=(12, 6))\n",
"plt.subplot(1, 2, 1), plt.imshow(img), plt.title('Original'), plt.axis('off')\n",
"plt.subplot(1, 2, 2), plt.imshow(img_rotacionada), plt.title(f'Rotacionada ({angulo}°)'), plt.axis('off')\n",
"plt.tight_layout()\n",
"plt.show()\n",
"``` \n",
"\n",
"**- Escala (Redimensionamento)** \n",
"Altera as dimensões da imagem (`cv2.resize`). \n",
"\n",
"```python\n",
"nova_largura, nova_altura = 300, 200 # Novas dimensões (largura, altura)\n",
"img_redimensionada = cv2.resize(img, (nova_largura, nova_altura))\n",
"\n",
"plt.figure(figsize=(12, 6))\n",
"plt.subplot(1, 2, 1), plt.imshow(img), plt.title(f'Original ({w}x{h})'), plt.axis('off')\n",
"plt.subplot(1, 2, 2), plt.imshow(img_redimensionada), plt.title(f'Redimensionada ({nova_largura}x{nova_altura})'), plt.axis('off')\n",
"plt.tight_layout()\n",
"plt.show()\n",
"``` \n",
"\n",
"**- Transformação de Perspectiva** \n",
"Muda o ponto de vista da imagem (`cv2.getPerspectiveTransform` + `cv2.warpPerspective`). \n",
"\n",
"```python\n",
"pontos_originais = np.float32([[50, 50], [200, 50], [50, 200], [200, 200]])\n",
"pontos_destino = np.float32([[10, 100], [200, 50], [100, 250], [250, 200]])\n",
"matriz_perspectiva = cv2.getPerspectiveTransform(pontos_originais, pontos_destino)\n",
"img_perspectiva = cv2.warpPerspective(img, matriz_perspectiva, (w, h))\n",
"\n",
"plt.figure(figsize=(12, 6))\n",
"plt.subplot(1, 2, 1), plt.imshow(img), plt.title('Original'), plt.axis('off')\n",
"plt.subplot(1, 2, 2), plt.imshow(img_perspectiva), plt.title('Transformação de Perspectiva'), plt.axis('off')\n",
"plt.tight_layout()\n",
"plt.show()\n",
"``` \n"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Ajuste de Gamma para Clareamento de Imagens com OpenCV e Matplotlib\n",
"\n",
"O ajuste de gamma é uma técnica fundamental em processamento de imagens para modificar o brilho e contraste de forma não-linear. Esta abordagem é particularmente útil para realçar detalhes em regiões escuras sem afetar excessivamente as áreas claras.\n",
"\n",
"**Fundamentos Matemáticos**\n",
"A transformação de gamma segue a equação:\n",
"\n",
"$$ I_{\\text{out}} = 255 \\times \\left(\\frac{I_{\\text{in}}}{255}\\right)^\\gamma $$\n",
"\n",
"Onde:\n",
"- $I_{\\text{in}}$: Valor do pixel de entrada (0 a 255)\n",
"- $\\gamma$: Parâmetro de correção\n",
"- $I_{\\text{out}}$: Valor do pixel processado\n",
"\n",
"**Efeitos do Parâmetro Gamma**\n",
"| Valor de γ | Efeito na Imagem | Aplicação Típica |\n",
"|------------|---------------------------|----------------------------|\n",
"| γ < 1 | Clareamento | Melhorar sombras |\n",
"| γ = 1 | Nenhuma alteração | - |\n",
"| γ > 1 | Escurecimento | Reduzir áreas superexpostas|\n",
"\n",
"**Implementação Prática**\n",
"```python\n",
"import cv2\n",
"import numpy as np\n",
"import matplotlib.pyplot as plt\n",
"\n",
"# Carregar imagem (OpenCV lê em BGR)\n",
"img = cv2.imread('w3.png')\n",
"img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) # Conversão para RGB\n",
"\n",
"# Parâmetros de gamma\n",
"gamma_values = [0.4, 1.0, 2.2] # Exemplos para clarear, original e escurecer\n",
"\n",
"# Configurar plot\n",
"plt.figure(figsize=(18, 6))\n",
"\n",
"for i, gamma in enumerate(gamma_values, 1):\n",
" # Aplicar correção de gamma\n",
" corrected = np.power(img_rgb/255., gamma)\n",
" corrected = (corrected * 255).astype(np.uint8)\n",
" \n",
" # Plotar resultados\n",
" plt.subplot(1, 3, i)\n",
" plt.imshow(corrected)\n",
" plt.title(f'γ = {gamma}')\n",
" plt.axis('off')\n",
"\n",
"plt.tight_layout()\n",
"plt.show()\n",
"```\n",
"\n",
"\n",
"Esta abordagem proporciona um controle preciso sobre o realce de imagens, sendo essencial em aplicações como visão computacional, fotografia médica e processamento de vídeo."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### 📝 Exercício - **Processamento de Imagens com Gradio**\n",
"\n",
"**Objetivo:** Implementar um aplicativo interativo que permita realizar diversas operações de processamento de imagens, incluindo transformações geométricas, manipulação de cores e ajustes de iluminação. O aplicativo deve ser desenvolvido usando uma das bibliotecas indicadas para criar uma interface amigável.\n",
"\n",
"**Tarefas a serem implementadas:**\n",
"\n",
"1. **Transformações Geométricas**\n",
"\n",
" - **Translação:** Permitir ao usuário especificar os valores de deslocamento horizontal e vertical.\n",
"\n",
" - **Rotação:** Oferecer um controle deslizante para selecionar o ângulo de rotação (0° a 360°).\n",
"\n",
" - **Escala:** Incluir opções para ampliar/reduzir a imagem com fatores configuráveis.\n",
"\n",
"2. **Operações de Cores**\n",
"\n",
" - **Conversão de espaços de cor:** Converter de RGB para Grayscale, HSV e outros.\n",
"\n",
" - **Ajuste de contraste:** Multiplicação por constante com controle deslizante para ajuste.\n",
"\n",
"3. **Correção Gamma e Clareamento**\n",
"\n",
" - **Controle de gamma:** Implementar um controle deslizante para ajustar o valor gamma (0.1 a 3.0).\n",
"\n",
"Lembre-se de permitir que as imagens modificadas possam ser salvas.\n",
"\n",
"**Bibliotecas:**\n",
"\n",
"🔗 Consulte a documentação do Gradio para implementação: [https://gradio.app/docs/](https://gradio.app/docs/)\n",
"\n",
"🔗 Consulte a documentação do Streamlit para implementação: [https://docs.streamlit.io/](https://docs.streamlit.io/)\n",
"\n",
"🔗 Consulte a documentação do NiceGUI para implementação: [https://nicegui.io/documentation](https://nicegui.io/documentation) "
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## 🧠 Exercícios Conceituais\n",
"\n",
"**1. Explorando a Visão Computacional**\n",
"\n",
"Descreva com suas próprias palavras o que é **visão computacional**. \n",
"- Quais são seus principais objetivos? \n",
"- Por que essa área é considerada estratégica dentro da inteligência artificial? \n",
"- Como ela tem sido aplicada em diferentes áreas do conhecimento e da indústria?\n",
"\n",
"**2. Fundamentos da Imagem Digital**\n",
"\n",
"O capítulo apresenta os conceitos de **pixels, resolução e canais de cor** (RGB, escala de cinza, binário). \n",
"\n",
"- Como a **resolução** influencia a quantidade de detalhes contidos em uma imagem? \n",
"- De que forma essa característica impacta o desempenho de algoritmos de análise visual? \n",
"- Em que contextos pode ser mais vantajoso utilizar imagens em **RGB**, **tons de cinza** ou **binárias**? Argumente com base em objetivos diferentes de análise.\n",
"\n",
"**3. Etapas do Processamento de Imagens**\n",
"\n",
"O fluxo do processamento digital de imagens inclui as etapas de **aquisição**, **pré-processamento**, **segmentação** e **reconhecimento**. \n",
"\n",
"- Escolha um cenário que envolva análise de imagens (como monitoramento ambiental, inspeção visual, mobilidade urbana etc.). \n",
"- Descreva como essas etapas podem ser aplicadas nesse contexto, destacando o papel de cada uma para alcançar um resultado útil.\n",
"\n",
"**4. Bibliotecas Python Essenciais**\n",
"\n",
"As bibliotecas **NumPy**, **OpenCV**, **Matplotlib**, **Scikit-Image** e **Pillow** são frequentemente utilizadas em projetos de visão computacional.\n",
"\n",
"- Qual é a principal finalidade de cada uma dessas ferramentas? \n",
"- Aponte situações específicas em que cada biblioteca pode oferecer recursos decisivos para o desenvolvimento de soluções com imagens.\n",
"\n",
"**5. Gerenciamento de Dependências com `pip`**\n",
"\n",
"O uso do `pip` e de arquivos `requirements.txt` é essencial para organizar ambientes de desenvolvimento.\n",
"\n",
"- Por que é importante manter um controle claro sobre as bibliotecas e versões utilizadas em um projeto? \n",
"- Que tipos de dificuldades podem surgir quando diferentes membros da equipe ou sistemas operacionais tentam reproduzir um código sem dependências bem definidas?\n",
"\n",
"**6. Utilizando Comandos Linux**\n",
"\n",
"Imagine que você precisa organizar e preparar um conjunto de imagens no Google Colab usando comandos de terminal. \n",
"\n",
"- Descrevendo uma sequência de comandos Linux que inclua: \n",
" - Criar uma pasta para armazenar imagens \n",
" - Listar arquivos\n",
" - Mover imagens para essa nova pasta\n",
" - Copiar um conjunto de arquivos para backup\n",
"- Ao final, responda: \n",
" - Como o conhecimento da **estrutura de diretórios** e do sistema de arquivos do Linux pode ajudar nesse processo? \n",
" - O que são **permissões de arquivos** no Linux e como elas podem impactar o acesso e manipulação de imagens?\n",
"\n",
"**7. Operações Aritméticas com Imagens**\n",
"\n",
"Somar ou subtrair imagens pode revelar diferentes tipos de informação.\n",
"\n",
"- Quando a **adição** de imagens pode ser vantajosa em análise visual? \n",
"- E a **subtração**, como pode destacar mudanças ou padrões? \n",
"- Proponha situações em que essas operações seriam especialmente reveladoras.\n",
"\n",
"**8. Conversão entre Espaços de Cor**\n",
"\n",
"A conversão entre espaços como RGB, Grayscale, HSV e LAB é recorrente em tarefas visuais.\n",
"\n",
"- Por que diferentes espaços de cor são usados dependendo do problema a ser resolvido? \n",
"- Em que tipo de tarefa a conversão para **HSV** ou **LAB** pode facilitar o processamento ou melhorar os resultados?\n",
"\n",
"**9. Transformações Geométricas em Imagens**\n",
"\n",
"As transformações de imagem — como **translação**, **rotação** e **escala** — são fundamentais para adaptar a imagem ao contexto da análise.\n",
"\n",
"- Escolha uma situação que envolva múltiplos ângulos, posições ou tamanhos de objetos em uma imagem. \n",
"- Explique como essas transformações ajudam a tornar o sistema mais robusto ou sensível a variações.\n",
"\n",
"**10. Ajuste de Gamma em Imagens**\n",
"\n",
"O **ajuste de gamma** modifica a relação entre brilho e contraste na imagem.\n",
"\n",
"- O que acontece com uma imagem quando usamos um **valor de gamma menor que 1**? Em que circunstâncias isso é benéfico? \n",
"- E se o **valor for maior que 1**? Em que situações isso pode melhorar a visualização ou a extração de informações?\n"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Referências e Conteúdo Extra\n",
"\n",
"- Livro(s)\n",
" - [Curso de Python](https://heltonmaia.com/pythonbook/intro.html)\n",
"- Sites Oficiai(s)\n",
" - [Documentação Oficial do Numpy](https://numpy.org/doc/)\n",
" - [Documentação Oficial do Matplotlib](https://matplotlib.org/)\n",
" - [Documentação Oficial do OpenCV](https://docs.opencv.org/)\n",
" - [Documentação Oficial do Scikit-image](https://scikit-image.org/)\n",
"- Projeto(s)\n",
" - [Mice Tracking](https://github.com/heltonmaia/ECT-proj-cnn-mice) \n"
]
}
],
"metadata": {
"colab": {
"provenance": [],
"toc_visible": true
},
"kernelspec": {
"display_name": "Python 3 (ipykernel)",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.9.20"
}
},
"nbformat": 4,
"nbformat_minor": 4
}