diff --git a/docs/avaliacoes/2024_1_final/img/min_max.png b/docs/avaliacoes/2024_1_final/img/min_max.png deleted file mode 100644 index 1ba34398..00000000 Binary files a/docs/avaliacoes/2024_1_final/img/min_max.png and /dev/null differ diff --git a/docs/avaliacoes/2024_1_final/index.md b/docs/avaliacoes/2024_1_final/index.md deleted file mode 100644 index 780f9048..00000000 --- a/docs/avaliacoes/2024_1_final/index.md +++ /dev/null @@ -1,208 +0,0 @@ -# Avaliação final 01/2024 - -## Orientações gerais - -* Quaisquer hipóteses relevantes devem ser **explicitamente formuladas**. Faz parte da avaliação a **correta interpretação** das questões. A **clareza** e a **objetividade** das respostas serão consideradas na avaliação. - -* Esta avaliação é **individual**. Em hipótese alguma você poderá fazer uso de material de colegas. - -* Durante esta avaliação você poderá fazer uso do seu material e poderá buscar por informações na Internet. Você não poderá fazer uso de qualquer *Large Language Model* para geração de código, nem ChatGPT, nem CoPilot. **Quem tiver o CoPilot habilitado deverá desabilitá-lo durante a avaliação**. - -* Para a execução desta prova você deverá acessar o Github Classroom neste [https://classroom.github.com/a/dlXUTKW3](https://classroom.github.com/a/dlXUTKW3). A submissão da sua prova será via este link. Neste link você irá encontrar um projeto que já possui alguns arquivos iniciais. Você deverá considerar estes arquivos para o desenvolvimento das suas soluções. - -## Questões - -Considere o ambiente implementado na biblioteca [https://github.com/damat-le/gym-simplegrid](https://github.com/damat-le/gym-simplegrid). Este ambiente fornece um grid 2D onde o agente pode se movimentar para cima, para baixo, para a esquerda e para a direita. O ambiente possui um estado inicial e um estado objetivo, além de obstáculos. O objetivo do agente é encontrar o menor caminho entre o estado inicial e o estado objetivo. - -Este ambiente permite configurar mapas diversos e selecionar aleatóriamente ou de forma pré-determinada a posição inicial e final do agente. Este ambiente implementa uma função de reward considerando a seguinte regra dado uma posição $(x, y)$ do agente: - -```python -def get_reward(self, x: int, y: int) -> float: - """ - Get the reward of a given cell. - """ - if not self.is_in_bounds(x, y): - # if the agent tries to exit the grid, it receives a negative reward - return -1.0 - elif not self.is_free(x, y): - # if the agent tries to walk over a wall, it receives a negative reward - return -1.0 - elif (x, y) == self.goal_xy: - # if the agent reaches the goal, it receives a positive reward - return 1.0 - else: - # otherwise, it receives no reward - return 0.0 -``` - -Nesta questão você terá que implementar duas versões de um agente que encontra o menor caminho entre o estado inicial e o estado objetivo. A primeira versão será utilizando algoritmos de busca (informados ou não informados) e a segunda versão será utilizando aprendizado por reforço. - -### 1. Encontrando o menor caminho com algoritmos de busca (3 pontos) - -No projeto você irá encontrar o arquivo `ambiente.py`, que tem o seguinte código: - -```python -import gymnasium as gym -import gym_simplegrid - -env = gym.make('SimpleGrid-8x8-v0', render_mode='human') -obs, info = env.reset() -done = env.unwrapped.done - -count_actions = 0 -while not done and count_actions < 100: - action = env.action_space.sample() - obs, reward, done, _, info = env.step(action) - count_actions += 1 - -env.close() -``` - -Neste caso, temos um agente que atua de forma aleatória no ambiente. Sugiro executar algumas vezes este arquivo para entender o funcionamento do ambiente. - -No mesmo projeto você irá encontrar os arquivos `ambiente_busca_estatico.py` e `ambiente_busca_dinamico.py`. Estes arquivos são versões modificadas do arquivo `ambiente.py` considerando o uso de algoritmos de busca. O estático fornece sempre o mesmo mapa, estado inicial e final. Enquanto que o dinâmico fornecerá mapas, estados iniciais e finais diferentes a cada execução. - -Ambos os arquivos esperam por um arquivo `my_agent.py` que deve conter a implementação do agente. Além da classe do agente que implementa a interface `from aigyminsper.search.Graph import State`, este arquivo também possui as seguintes funções: - -```python -def get_actions(map, position, goal): - # - # TODO Esta função deve retornar uma lista de ações que o agente deve executar - # Assim conseguimos executar o agente no ambiente usando a biblioteca - # gym_simplegrid - # - # Se nao existir solucao, a funcao deve retornar None - # - return None - -def parser_actions(str_actions): - if str_actions != None: - actions = str_actions.split(';') - actions = list(map(int, actions[1:])) - return actions - return None -``` - -Você deverá implementar o arquivo `my_agent.py` usando o algoritmo de busca que você considerar mais adequado, usando a representação do estado que você considerar mais adequada. Mas você deve respeitar o código utilizado para as ações. Além de sempre gerar 4 sucessores para cada estado, não importanto se existe ou não obstáculo ao redor do agente. - -Para verificar se a soluções está correta, você pode testar a solução da seguinte forma: - -* execute o arquivo de teste `test_my_agent.py`; -* execute o arquivo `ambiente_busca_estatico.py`, neste arquivo o ambiente sempre terá a mesma configuração, o mesmo estado de início e o mesmo estado de fim. Ou seja, é mais fácil visualizar se a sua implementação tem algum problema ou não; -* execute o arquivo `ambiente_busca_dinamico.py`, neste arquivo o ambiente terá configurações diferentes a cada execução. - -Ter passado em todos os testes em `text_my_agent.py` não garante que a sua implementação esteja 100% correta. Você deve testar a sua implementação nos arquivos `ambiente_busca_estatico.py` e `ambiente_busca_dinamico.py`. - -### 2. Encontrando o caminho com aprendizado por reforço (3 pontos) - -Agora é a vez de utilizar reinforcement learning para encontrar o caminho entre o estado inicial e o estado objetivo. Ou seja, você vai treinar um agente que seja capaz de aprender a melhor política para navegar neste ambiente. - -No mesmo projeto você irá encontrar os arquivos `TreinandoAgente.py`, `QLearning.py` e `analise_dados_treinamento.ipynb`. Use este arquivo para responder as perguntas abaixo. - -1. Qual foi a política que o agente aprendeu a executar? Treine o agente para responder a pergunta. Execute várias vezes o agente depois de treinado. Analise os gráficos gerados pelo arquivo `analise_dados_treinamento.ipynb`. Justifique a sua resposta. - -2. O que acontece se alterarmos os hiperparâmetros para $\alpha = 0.1, \gamma = 0.99, \epsilon = 0.8, \epsilon_{min} = 0.05, \epsilon_{dec} = 1, episodes = 1000$? Qual foi o comportamento do agente durante o treinamento? Depois de treinado o agente consegue alcançar o objetivo? Explique o que aconteceu. - -3. O que acontece se alterarmos os hiperparâmetros para $\alpha = 0, \gamma = 0.99, \epsilon = 0.8, \epsilon_{min} = 0.05, \epsilon_{dec} = 1, episodes = 1000$? Justifique a sua resposta. - -Os arquivos `TreinandoAgente.py` e `QLearning.py` estão configurados de tal maneira para sempre gerar um mapa com o mesmo estado final. O único dado que é alterado a cada simulação é a posição inicial do agente. - -No arquivo `TreinandoAgente.py` podemos ver esta consiguração nas linhas 19, 20 e 21: - -```python -(x_goal, y_goal) = (7,4) -g_loc = env.to_s(x_goal, y_goal) -state, info = env.reset(options={'goal_loc':g_loc}) -#state, infor = env.reset() -``` - -E no arquivo `QLearning.py` podemos ver esta configuração nas linhas 32, 33 e 34: - -```python -(x_goal, y_goal) = (7,4) -g_loc = self.env.to_s(x_goal, y_goal) -(state, _) = self.env.reset(options={'goal_loc':g_loc}) -#(state, _) = self.env.reset() -``` - -4. Se deixarmos o objetivo em uma posição diferente a cada simulação, o agente consegue alcançar o objetivo? Quais seriam os hiperparâmetros necessários? Justifique a sua resposta. Dica: dependendo dos hipeparâmetros escolhidos esta execução pode demorar algum tempo. Se bem justificada a sua resposta, talvez não seja necessário executar o código. - -Dica: você pode comentar as linhas 19, 20 e 21 do arquivo `TreinandoAgente.py` e as linhas 32, 33 e 34 do arquivo `QLearning.py` para testar esta hipótese. Não esqueça de descomentar as linhas 22 do arquivo `TreinandoAgente.py` e a linha 35 do arquivo `QLearning.py`. Você pode usar os gráficos gerados no arquivo [analise_dados_treinamento.ipynb](./src/analise_dados_treinamento.ipynb) para justificar a sua resposta. - - -### 3. Problema de otimização (2 pontos) - -Considere um problema de otimização de uma função: - -$f(x) = (x + 2)^{2} - 16 \times \exp(-(x-2)^{2})$ - -que pode ser escrita em python da seguinte forma: - -```python -import numpy as np - -def f_x(x): - return np.power(x + 2, 2) - 16 * np.exp(-np.power((x - 2), 2)) -``` - -Com o seguinte intervalo para a variável $x$: $[-10,+10]$. - -Você deve: - -* utilizar uma das implementações existentes no pacote `aigyminsper.search.*`. -* definir a forma para representação do estado. -* definir o método para geração dos sucessores. Dica: você pode gerar um sucessor que incrementa o valor de $x$ e outro que decrementa o valor de $x$. Além disso, você pode usar um passo de 0.1 para incrementar ou decrementar o valor de $x$. -* não sabemos qual é o valor mínimo que esta função pode ter. - -Além da implementação, entregue via o arquivo `Otimizacao.py`, você deve informar **qual é o valor de $x$ que minimiza o valor de retorno da função acima**. Explique a sua implementação. - -### 4. Problema de tomada de decisão (1 ponto) - -Considere a árvore abaixo. - - - -Esta é árvore que um agente no estado $n0$ montou para tomar a decisão sobre qual movimento realizar (X, Q ou M) em um ambiente competitivo de soma zero. - -Esta árvore foi construída por uma implementação de algoritmo MinMax que vai até a profundidade 3 ou até o estado ser terminal. Neste caso, os estados terminais são $n5, n6, n7, n9, n10$. - -Nos estados que estão na última profundidade foi aplicado uma função de avaliação que resultou nos seguintes valores: - -|Nodo | Valor | -|:----|:-----:| -|n13|-0.5| -|n14|-0.8| -|n15|0.2| -|n16|1 -|n17|1 -|n18|0.5 -|n19|0 -|n20|0 -|n21|1 -|n22|0 -|n23|0.2 -|n24|-0.1 - -Para os nodos terminais, temos: - -|Nodo | Valor | -|:----|:-----:| -|n5| 0| -|n6| 0| -|n7| -1 -|n9| 1 -|n10| 1 - -**Qual a ação o agente irá executar?** - -### 5. Analisando ambientes (1 ponto) - -Ao longo do semestre fizemos algumas implementações, entre elas: busca de menor caminho entre duas cidades, um agente jogador de jogo da velha e um agente que é capaz de andar em um lago congelado. - -Considerando cada um destes ambientes, responda se os mesmos são determinísticos ou estocásticos, single ou multi-agentes, e diga qual foi o algoritmo utilizado para implementar a solução. - -## Entrega - -Ao final da prova, você deverá submeter o seu projeto no Github Classroom. Este projeto deve ter todos os arquivos originais mais os arquivos que você implementou. - -Existe um arquivo especial, que é o `respostas.md`. Neste arquivo você deve responder as questões 2, 3, 4 e 5. Este arquivo já possui um formato pré-definido. Você deve respeitar este formado! diff --git a/docs/avaliacoes/2024_1_final/src/analise_dados_treinamento.ipynb b/docs/avaliacoes/2024_1_final/src/analise_dados_treinamento.ipynb deleted file mode 100644 index a954748c..00000000 --- a/docs/avaliacoes/2024_1_final/src/analise_dados_treinamento.ipynb +++ /dev/null @@ -1,215 +0,0 @@ -{ - "cells": [ - { - "cell_type": "code", - "execution_count": 32, - "metadata": {}, - "outputs": [], - "source": [ - "import pandas as pd\n", - "import seaborn as sns\n", - "import matplotlib.pyplot as plt\n", - "sns.set_style(\"darkgrid\")" - ] - }, - { - "cell_type": "code", - "execution_count": 33, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
EpisodeEpsilonActionsRewardsRewards_AvgActions_Avg
010.80000200-45.0NaNNaN
120.79600200-37.0NaNNaN
230.7920241.0NaNNaN
340.78806200-39.0NaNNaN
450.7841214-7.0NaNNaN
\n", - "
" - ], - "text/plain": [ - " Episode Epsilon Actions Rewards Rewards_Avg Actions_Avg\n", - "0 1 0.80000 200 -45.0 NaN NaN\n", - "1 2 0.79600 200 -37.0 NaN NaN\n", - "2 3 0.79202 4 1.0 NaN NaN\n", - "3 4 0.78806 200 -39.0 NaN NaN\n", - "4 5 0.78412 14 -7.0 NaN NaN" - ] - }, - "execution_count": 33, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "df = pd.read_csv('./data/dados_treinamento.csv')\n", - "df['Rewards_Avg'] = df['Rewards'].rolling(window=100).mean()\n", - "df['Actions_Avg'] = df['Actions'].rolling(window=100).mean()\n", - "df.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 34, - "metadata": {}, - "outputs": [ - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": {}, - "output_type": "display_data" - } - ], - "source": [ - "sns.lineplot(x='Episode', y='Rewards_Avg', data=df)\n", - "plt.title('Rewards per Episode')\n", - "plt.show()" - ] - }, - { - "cell_type": "code", - "execution_count": 35, - "metadata": {}, - "outputs": [ - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": {}, - "output_type": "display_data" - } - ], - "source": [ - "sns.lineplot(x='Episode', y='Epsilon', data=df)\n", - "plt.title('Epsilon per Episode')\n", - "plt.show()" - ] - }, - { - "cell_type": "code", - "execution_count": 36, - "metadata": {}, - "outputs": [ - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": {}, - "output_type": "display_data" - } - ], - "source": [ - "sns.lineplot(x='Episode', y='Actions_Avg', data=df)\n", - "plt.title('Actions per Episode')\n", - "plt.show()" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - } - ], - "metadata": { - "kernelspec": { - "display_name": "venv", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.10.12" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} diff --git a/docs/avaliacoes/2024_1_gabarito/index.md b/docs/avaliacoes/2024_1_gabarito/index.md deleted file mode 100644 index 90d2f120..00000000 --- a/docs/avaliacoes/2024_1_gabarito/index.md +++ /dev/null @@ -1,43 +0,0 @@ -# Gabarito da prova final - -## 1. Encontrando o menor caminho com algoritmos de busca (3 pontos) - -Uma possível solução é apresentada no arquivo [my_agent.py](./src/my_agent.py). - -A solução entregue deve passar por todos os testes descritos no arquivo de [testes](./src/test_my_agent_depois_entrega.py). - -## 2. Encontrando o caminho com aprendizado por reforço (3 pontos) - -1. Qual foi a política que o agente aprendeu a executar? - -Dado o que é definido na função de reward, o agente aprende a não bater nas paredes e não sair do mapa. No entanto, como o primeiro exercício tem um objetivo fixo então o agente também consegue aprender a chegar no objetivo se os hiperparâmetros forem corretamente definidos. Mas não necessariamente pelo caminho mais curto. - -2. O que acontece se alterarmos os hiperparâmetros para $\alpha = 0.1, \gamma = 0.99, \epsilon = 0.8, \epsilon_{min} = 0.05, \epsilon_{dec} = 1, episodes = 1000$? Qual foi o comportamento do agente durante o treinamento? Depois de treinado o agente consegue alcançar o objetivo? - -Como não existe decaimento do epsilon, pois $\epsilon_{dec}=1$, o agente durante o treinamento sempre vai escolher mais ações aleatórias do que ações baseadas na política aprendida. Isso faz com que o agente demore mais em cada episódio. Mas, dado a simplicidade do ambiente, o agente consegue aprender a não bater nas paredes e não sair do mapa. - -3. O que acontece se alterarmos os hiperparâmetros para $\alpha = 0, \gamma = 0.99, \epsilon = 0.8, \epsilon_{min} = 0.05, \epsilon_{dec} = 1, episodes = 1000$? Justifique a sua resposta. - -O agente não aprende em absoluto pois o valor de $\alpha$ é zero. Isso faz com que o agente não atualize os valores da tabela Q. - -## 3. Problema de otimização (2 pontos) - -Uma possível solução é apresentada no arquivo [Otimizacao.py](./src/Otimizacao.py). - -## 4. Problema de tomada de decisão (1 ponto) - -A decisão executada pelo agente será executar a ação **M**. - -## 5. Analisando ambientes (1 ponto) - -### busca de menor caminho entre duas cidades - -single-agent, determinístico e A* - -### um agente jogador de jogo da velha - -multi-agent (competitivo), determinístico e minimax - -### agente que é capaz de andar em um lago congelado - -single-agent, estocástico e Q-learning ou Sarsa \ No newline at end of file diff --git a/docs/avaliacoes/2024_1_gabarito/src/Otimizacao.py b/docs/avaliacoes/2024_1_gabarito/src/Otimizacao.py deleted file mode 100644 index f4be198e..00000000 --- a/docs/avaliacoes/2024_1_gabarito/src/Otimizacao.py +++ /dev/null @@ -1,58 +0,0 @@ -from aigyminsper.search.CSPAlgorithms import SubidaMontanhaEstocastico, SubidaMontanha -from aigyminsper.search.Graph import State -import numpy as np -import math - -class Otimizacao(State): - - def __init__(self, x): - self.x = x - - def successors(self): - sucessores = [] - sucessores.append(Otimizacao(self.x + 0.1)) - sucessores.append(Otimizacao(self.x - 0.1)) - return sucessores - - def h(self): - #return (np.power(self.x + 2, 2)) - (16 * np.exp2(-np.power((self.x - 2), 2))) - return (self.x + 2)**2 - 16 * math.exp(-(self.x - 2)**2) - - # eu não sei dizer qual eh o goal entao nao vou usar este - # metodo. se eu não uso este metodo entao eu nao posso usar - # o subida da montanha estocastico - def is_goal(self): - return False - - def cost(self): - return 1 - - def env(self): - return self.x - - def description(self): - return "Problema de otimizacao de funcao" - -# sabemos que o subida da montanha tem problema de minimo local -# desta forma eu vou iniciar varias vezes a busca sempre a partir de um -# valor diferente e vou guardar o valor de x e y melhores a cada iteracao - -x = -11 -y = math.inf - -for i in range(-10,10,1): - inicial = Otimizacao(i) - result = SubidaMontanha().search(inicial) - if result == None: - print("Nao encontrou solucao") - else: - print(f'Começando com i = {i} Valor de y = {result.h()} para x = {result.env()}') - if result.h() < y: - x = result.env() - y = result.h() - -print(f'=================================') -print(f'Melhor valor de x = {x} e y = {y}') - - - diff --git a/docs/avaliacoes/2024_1_gabarito/src/my_agent.py b/docs/avaliacoes/2024_1_gabarito/src/my_agent.py deleted file mode 100644 index 7ec4a3c5..00000000 --- a/docs/avaliacoes/2024_1_gabarito/src/my_agent.py +++ /dev/null @@ -1,76 +0,0 @@ -from aigyminsper.search.SearchAlgorithms import BuscaProfundidadeIterativa, BuscaLargura -from aigyminsper.search.Graph import State - -class MyAgent(State): - - def __init__(self, map, op, position, goal): - self.map = map - self.operator = op - self.position = position - self.goal = goal - - def successors(self): - # - # os sucessores que devem ser considerados são: - # 0 - cima - # 1 - baixo - # 2 - esquerda - # 3 - direita - # - sucessors = [] - if self.position[0] > 0 and self.map[self.position[0]-1][self.position[1]] == '0': - sucessors.append(MyAgent(self.map, '0', (self.position[0]-1, self.position[1]), self.goal)) - else: - sucessors.append(MyAgent(self.map, '0', self.position, self.goal)) - - if self.position[0] < len(self.map)-1 and self.map[self.position[0]+1][self.position[1]] == '0': - sucessors.append(MyAgent(self.map, '1', (self.position[0]+1, self.position[1]), self.goal)) - else: - sucessors.append(MyAgent(self.map, '1', self.position, self.goal)) - - if self.position[1] > 0 and self.map[self.position[0]][self.position[1]-1] == '0': - sucessors.append(MyAgent(self.map, '2', (self.position[0], self.position[1]-1), self.goal)) - else: - sucessors.append(MyAgent(self.map, '2', self.position, self.goal)) - - if self.position[1] < len(self.map[0])-1 and self.map[self.position[0]][self.position[1]+1] == '0': - sucessors.append(MyAgent(self.map, '3', (self.position[0], self.position[1]+1), self.goal)) - else: - sucessors.append(MyAgent(self.map, '3', self.position, self.goal)) - - return sucessors - - def is_goal(self): - return self.position == self.goal - - def description(self): - return "Agente que sabe andar em um grid simples" - - def cost(self): - return 1 - - def env(self): - return f'{self.position[0]};{self.position[1]}' - -def get_actions(map, position, goal): - # - # Esta fnção deve retornar uma lista de ações que o agente deve executar - # Assim conseguimos executar o agente no ambiente usando a biblioteca - # gym_simplegrid - # - - state = MyAgent(map, '', position, goal) - algorithm = BuscaLargura() - result = algorithm.search(state,pruning='general') - if result != None: - return result.show_path() - else: - return None - -def parser_actions(str_actions): - if str_actions != None: - actions = str_actions.split(';') - actions = list(map(int, actions[1:])) - return actions - return None - diff --git a/docs/avaliacoes/2024_1_gabarito/src/test_my_agent_depois_entrega.py b/docs/avaliacoes/2024_1_gabarito/src/test_my_agent_depois_entrega.py deleted file mode 100644 index e7da7794..00000000 --- a/docs/avaliacoes/2024_1_gabarito/src/test_my_agent_depois_entrega.py +++ /dev/null @@ -1,161 +0,0 @@ -import pytest -import my_agent as agent - - -def config_0(): - map = [ - "0000", - "0110", - "0000", - ] - position = (0,0) - goal = (0,1) - return map, position, goal - -def config_1(): - map = [ - "0000", - "0110", - "0000", - ] - position = (0,0) - goal = (2,3) - return map, position, goal - -def config_2(): - map = [ - "0000", - "0110", - "0000", - "0000", - "0000", - "0000", - "0000", - ] - position = (3,3) - goal = (4,3) - return map, position, goal - -def config_3(): - # sem solucao - map = [ - "010000", - "011111", - "000000", - "000000", - ] - position = (3,3) - goal = (0,4) - return map, position, goal - -def config_4(): - # mapao - map = [ - "010000000000000000000000", - "011111000000000000000000", - "000000000000000000000000", - "000000000000000000000000", - "010101010101010101010101", - "010101010101010101010101", - "010101010101010101010101", - "010101010101010101010101", - "010101010101010101010101", - "010101010101010101010101", - "010101010101010101010101", - ] - position = (9,4) - goal = (0,4) - return map, position, goal - - -def config_5(): - # mapao - map = [ - "010000000000000000000000", - "011111000000000000000000", - "000000000000000000000000", - "000000000000000000000000", - "010101010101010101010101", - "010101010101010101010101", - "010101010101010101010101", - "010101010101010101010101", - "010101010101010101010101", - "010101010101010101010101", - "010101010101010101010101", - ] - position = (0,10) - goal = (10,12) - return map, position, goal - - -def config_6(): - # mapao - map = [ - "010000000000000000000000", - "011111000000000000000000", - "000000000000000000000000", - "000000000000000000000000", - "010101010101010101010101", - "010101010101010101010101", - "010101010101010101010101", - "010101010101010101010101", - "010101010101010101010101", - "010101010101010101010101", - "010101010101010101010101", - ] - position = (10,0) - goal = (10,12) - return map, position, goal - - -def test_path_0(): - map, position, goal = config_0() - actions = agent.parser_actions(agent.get_actions(map, position, goal)) - assert actions == [3] - -def test_cost_0(): - map, position, goal = config_0() - actions = agent.parser_actions(agent.get_actions(map, position, goal)) - assert len(actions) == 1 - -def test_path_1(): - map, position, goal = config_1() - actions = agent.parser_actions(agent.get_actions(map, position, goal)) - assert actions == [1, 1, 3, 3, 3] or actions == [3, 3, 3, 1, 1] - -def test_cost_1(): - map, position, goal = config_1() - actions = agent.parser_actions(agent.get_actions(map, position, goal)) - assert len(actions) == 5 - -def test_path_2(): - map, position, goal = config_2() - actions = agent.parser_actions(agent.get_actions(map, position, goal)) - assert actions == [1] - -def test_cost_2(): - map, position, goal = config_2() - actions = agent.parser_actions(agent.get_actions(map, position, goal)) - assert len(actions) == 1 - -def test_path_3(): - # testando o comportamento para uma situação onde não existe caminho - map, position, goal = config_3() - actions = agent.parser_actions(agent.get_actions(map, position, goal)) - assert actions == None - -def test_cost_4(): - map, position, goal = config_4() - actions = agent.parser_actions(agent.get_actions(map, position, goal)) - assert len(actions) == 13 - -def test_cost_5(): - map, position, goal = config_5() - actions = agent.parser_actions(agent.get_actions(map, position, goal)) - assert len(actions) == 12 - -def test_cost_6(): - map, position, goal = config_6() - actions = agent.parser_actions(agent.get_actions(map, position, goal)) - assert len(actions) == 26 - diff --git a/docs/avaliacoes/2024_1_intermediaria/img/mapa.dot b/docs/avaliacoes/2024_1_intermediaria/img/mapa.dot deleted file mode 100644 index eace8876..00000000 --- a/docs/avaliacoes/2024_1_intermediaria/img/mapa.dot +++ /dev/null @@ -1,13 +0,0 @@ -digraph G { - /*layout="circo";*/ - /* Relationships */ - "São Paulo" -> "Jundiaí"[label="59", dir="both"] - "Campinas" -> "Jundiaí"[label="39", dir="both"] - "Sorocaba" -> "Campinas"[label="89", dir="both"] - "Sorocaba" -> "Jundiaí"[label="93", dir="both"] - "Sorocaba" -> "São Paulo"[label="104", dir="both"] - "São Paulo" -> "Taubaté"[label="131", dir="both"] - "São Paulo" -> "Santos"[label="72", dir="both"] - "Santos" -> "Ubatuba"[label="238", dir="both"] - "Ubatuba" -> "Taubaté"[label="97", dir="both"] -} \ No newline at end of file diff --git a/docs/avaliacoes/2024_1_intermediaria/img/mapa.png b/docs/avaliacoes/2024_1_intermediaria/img/mapa.png deleted file mode 100644 index 141456f3..00000000 Binary files a/docs/avaliacoes/2024_1_intermediaria/img/mapa.png and /dev/null differ diff --git a/docs/avaliacoes/2024_1_intermediaria/img/mapa2.dot b/docs/avaliacoes/2024_1_intermediaria/img/mapa2.dot deleted file mode 100644 index b3413ca8..00000000 --- a/docs/avaliacoes/2024_1_intermediaria/img/mapa2.dot +++ /dev/null @@ -1,29 +0,0 @@ -digraph G { - /* Node Styles */ - "Sorocaba"[style="filled", fillcolor="yellow", fontcolor="black", color="black"]; - "Limeira"[style="filled", fillcolor="yellow", fontcolor="black", color="black"]; - "São Carlos"[style="filled", fillcolor="red", fontcolor="black", color="black"]; - "Ubatuba"[style="filled", fillcolor="red", fontcolor="black", color="black"]; - - /*layout="circo";*/ - /* Relationships */ - "São Paulo" -> "Jundiaí"[label="59", dir="both"] - "Campinas" -> "Jundiaí"[label="39", dir="both"] - "Sorocaba" -> "Campinas"[label="89", dir="both"] - "Sorocaba" -> "Jundiaí"[label="93", dir="both"] - "Sorocaba" -> "São Paulo"[label="104", dir="both"] - "São Paulo" -> "São José dos Campos"[label="92", dir="both"] - "São José dos Campos" -> "Taubaté"[label="43", dir="both"] - "Ubatuba" -> "São José dos Campos"[label="139", dir="both"] - "São Paulo" -> "Santos"[label="72", dir="both"] - "Santos" -> "Ubatuba"[label="238", dir="both"] - "Ubatuba" -> "Taubaté"[label="97", dir="both"] - "Campinas" -> "Limeira"[label="59", dir="both"] - "Limeira" -> "Rio Claro"[label="28", dir="both"] - "Rio Claro" -> "São Carlos"[label="62", dir="both"] - "São Carlos" -> "Bauru"[label="152", dir="both"] - "Bauru" -> "Piracicaba"[label="194", dir="both"] - "Piracicaba" -> "Campinas"[label="70", dir="both"] - "São Carlos" -> "Campinas"[label="142", dir="both"] - "Bauru" -> "Rio Claro"[label="186", dir="both"] -} \ No newline at end of file diff --git a/docs/avaliacoes/2024_1_intermediaria/img/mapa2.png b/docs/avaliacoes/2024_1_intermediaria/img/mapa2.png deleted file mode 100644 index 2b54ee1a..00000000 Binary files a/docs/avaliacoes/2024_1_intermediaria/img/mapa2.png and /dev/null differ diff --git a/docs/avaliacoes/2024_1_intermediaria/index.md b/docs/avaliacoes/2024_1_intermediaria/index.md deleted file mode 100644 index b039a79f..00000000 --- a/docs/avaliacoes/2024_1_intermediaria/index.md +++ /dev/null @@ -1,106 +0,0 @@ -# Avaliação intermediária 01/2024 - -## Orientações gerais - -* Quaisquer hipóteses relevantes devem ser **explicitamente formuladas**. Faz parte da avaliação a **correta interpretação** das questões. A **clareza** e a **objetividade** das respostas serão consideradas na avaliação. - -* Esta avaliação é **individual**. Em hipótese alguma você poderá fazer uso de material de colegas. - -* Durante esta avaliação você poderá fazer uso do seu material. Não poderá fazer uso de material existente na Internet e também não poderá fazer uso do CoPilot. Quem tiver o CoPilot habilitado deverá desabilitá-lo durante a avaliação. - -## Questões - -### 1. (2 pontos) $2k$ e $2k+1$ - -Considere um espaço de estados onde o estado inicial é o número 1 e cada estado $k$ gera dois estados sucessores, $2k$ e $2k+1$. Suponha que o estado objetivo seja o número 11. - -1. (0.5 pontos) Liste a ordem em que os estados são visitados (retirados de abertos) em uma busca em largura. -1. (0.5 pontos) Liste a ordem em que os estados são visitados (retirados de abertos) em uma busca em profundidade com o limite 3. -1. (1 ponto) Liste a ordem em que os estados são visitados (retirados de abertos) em uma busca A* com a heurística $h(n) = 11 - n$. Neste caso os sucessores só são gerados se $n \leq 11$. - -### 2. (6 pontos) Definindo rotas de ônibus - -Para este exercício, considere uma empresa de ônibus que precisa definir novas rotas de ônibus. Esta empresa tem um mapa com cidades conectadas por estradas de mão dupla. No grafo abaixo as cidades são representadas por vértices e as estradas por arestas. O valor de cada aresta significa a distância entre as cidades. - -![Mapa](img/mapa2.png) - -Neste mapa, algumas cidades estão marcadas com vermelho e outras com amarelo. As cidades marcadas com vermelho são cidades consideradas estratégicas pela empresa de ônibus - cidades que atualmente não são atendidas pela empresa mas que precisam ser atendidas em um futuro próximo. As cidades marcadas com amarelo são cidades que possuem terminais de carga. Sempre que uma rota de ônibus transportar além de pessoas, objetos de carga, ela deve passar por um terminal de carga. - -Estimando a complexidade do problema: - -1. Qual é a ramificação do problema? -1. Qual é a profundidade máxima do problema? -1. Levando-se em consideração a ramificação informada e a profundidade máxima, qual é o tamanho do espaço de estados para o problema? -1. O que é importante representar no estado do problema? Descreve os atributos que a sua classe deve ter e o significado deles. - -Implemente uma solução usando a biblioteca `aigyminsper` que seja capaz de responder as perguntas listadas abaixo: - -1. Qual é o menor caminho entre São Paulo e Piracicaba que passa por um terminal de carga? E qual é o custo deste caminho? -1. Qual é o menor caminho entre Taubaté e Piracicaba que passa por uma cidade estratégica? Qual é o custo deste caminho? -1. Qual é o menor caminho entre Sorocaba e Piracicaba sem considerar cidades estratégicas e terminais de carga? Qual é o custo deste caminho? -1. Qual deve ser a rota de ônibus entre Taubaté e Campinas que passa por um terminal de carga e por uma cidade estratégica? Qual é o custo desta rota? -1. Qual deve ser a rota de ônibus entre Taubaté e Campinas, sem considerar cidades estratégicas ou terminais de carga? Qual é o custo desta rota? - -Para cada rota você também deve calcular o custo da rota. Segundo a empresa, o custo da rota é dado por: - -```python -def custo(km): - return 0.5 * km -``` - -Utilize esta equação na função `cost()` do agente. - -Você deve implementar o agente e o método `main()` que faz a chamada para responder as perguntas acima. Você não será avaliado apenas pela resposta correta, mas também pela implementação do agente. - -Se você implementar uma solução que ignorar a existência de cidades estratégicas e terminais de carga, mas que é capaz de retornar a solução de menor custo então você terá 50% da nota. Para ter 100% da nota você precisa implementar uma solução que considera cidades estratégicas e terminais de carga. - -Você pode usar o dicionário abaixo para implementar a sua solução: - -```python -mapa = { - 'Taubaté':[(43,'São José dos Campos'),(97,'Ubatuba')], - 'São José dos Campos':[(43,'Taubaté'),(139,'Ubatuba'),(92,'São Paulo')], - 'Ubatuba':[(97,'Taubaté'),(139,'São José dos Campos'),(238,'Santos')], - 'Santos':[(238,'Ubatuba'),(72,'São Paulo')], - 'Sorocaba':[(104,'São Paulo'),(89,'Campinas'),(93,'Jundiaí')], - 'Jundiaí':[(59,'São Paulo'),(39,'Campinas'),(93,'Sorocaba')], - 'Campinas':[(89,'Sorocaba'),(39,'Jundiaí'),(142,'São Carlos'),(70,'Piracicaba'),(59,'Limeira')], - 'São Carlos':[(142,'Campinas'),(62,'Rio Claro'),(152,'Bauru')], - 'Limeira':[(59,'Campinas'),(28,'Rio Claro')], - 'Rio Claro':[(62,'São Carlos'),(28,'Limeira'),(186,'Bauru')], - 'Bauru':[(152,'São Carlos'),(186,'Rio Claro'),(194,'Piracicaba')], - 'Piracicaba':[(70,'Campinas'),(194,'Bauru')] - } -``` - -**Importante**: Se você for utilizar o dicionário acima então revise o mesmo. Ele poderá estar incompleto! - -O caminho precisa ter o seguinte formato: - -```bash -sair de Taubaté ; ir para São José dos Campos ; ir para São Paulo ; ir para Jundiaí ; ir para Campinas ; ir para Piracicaba ; ir para Bauru -497 -``` -Na primeira linha o plano e na segunda linha o custo. O plano precisa necessariamente começar com a string "sair de" e a cada nova cidade do plano deve ser concatenada a string "ir para". - -### 3. (2 pontos) Distância entre cidades - -Considere o problema de encontrar o menor caminho entre duas cidades visto em sala de aula. Suponha que a distância entre as cidades é dada pela emissão de CO2 em toneladas. Considere que todos os veículos que circulam entre as cidades emitem 0.1 toneladas de CO2 por quilômetro rodado. Suponha que a única informação que você tem além do mapa e a distância entre as cidades em CO2 é a latitude e longitude das cidades. Que heurística você usaria para resolver o problema? Esta heurística precisa ser admissível. Justifique a sua resposta. Ao definir a heurística faça uso de uma equação para deixar a resposta mais clara e objetiva. - -## Entrega dos itens da avaliação - -Toda a prova deve ser submetida no Github Classroom através deste link: [https://classroom.github.com/a/dBI-3xFz](https://classroom.github.com/a/dBI-3xFz). - -Os arquivos que precisam ser submetidos são: - -* `requirements.txt`: arquivo com todas as bibliotecas necessárias para as soluções que você irá entregar. -* `Mapa.py`: arquivo com a solução para o problema do Mapa. -* `README.md`: no arquivo de README.md você deve colocar as respostas para as perguntas da questão 1, do início da questão 2 e da questão 3. - -Não existe nenhum projeto de *template* e também não existem arquivos de testes. - -No caso das implementações, você deverá definir tudo: como os estados são representados, quais são os parâmetros do construtor da classe, quais são as ações e como elas afetam os estados, qual é o critério que retorna `true` para o método `is_goal()`, e assim em diante. - -**Esta prova tem duração de 2 (duas) horas**. - -O horário limite para entrega da prova é 15:40 do dia 22 de setembro de 2023. Para fins de avaliação será considerado último `push` no repositório. diff --git a/mkdocs.yml b/mkdocs.yml index c137f270..5aa1467a 100644 --- a/mkdocs.yml +++ b/mkdocs.yml @@ -47,10 +47,10 @@ nav: - 'aulas/15_rl_sarsa/index.md' ## - 'aulas/15_xnon_determ/index.md' - - 'Avaliações atuais': - - 'avaliacoes/2024_1_intermediaria/index.md' - - 'avaliacoes/2024_1_final/index.md' - - 'avaliacoes/2024_1_gabarito/index.md' +# - 'Avaliações atuais': +# - 'avaliacoes/2024_1_intermediaria/index.md' +# - 'avaliacoes/2024_1_final/index.md' +# - 'avaliacoes/2024_1_gabarito/index.md' # - 'avaliacoes/2023_2_sub/index.md' - 'Projetos atuais': - 'projetos/11_delivery/index.md'