diff --git a/arch_gym/envs/custom_env.py b/arch_gym/envs/custom_env.py
new file mode 100644
index 00000000..203d8914
--- /dev/null
+++ b/arch_gym/envs/custom_env.py
@@ -0,0 +1,58 @@
+import gym
+from gym import spaces
+import numpy as np
+from absl import flags
+import os
+
+
+
+class CustomEnv(gym.Env):
+    def __init__(self):
+        super(CustomEnv, self).__init__()
+        self.observation_space = spaces.Dict({"energy": spaces.Box(0, 1, (1,)), "area": spaces.Box(0, 1, (1,)), "latency": spaces.Box(0, 1, (1,))})
+        
+        self.action_space = spaces.Dict({"num_cores": spaces.Discrete(15), "freq": spaces.Box(low = 0.5, high = 3, dtype = float),
+        "mem_type": spaces.Discrete(3), "mem_size": spaces.Discrete(65)})
+        # mem_type_list = ['DRAM', 'SRAM', 'Hybrid']
+
+        self.energy = 0
+        self.area = 0
+        self.latency = 0
+        self.initial_state = np.array([self.energy, self.area, self.latency])
+
+
+    def reset(self):
+        return self.initial_state
+
+    def step(self, action):
+        num_cores = action['num_cores']
+        freq = action['freq']
+        mem_type = action['mem_type']
+        mem_size = action['mem_size'] 
+
+        action = np.array([num_cores, freq, mem_type, mem_size])
+        
+        self.energy += num_cores*1 + freq*2 + mem_size*3
+        self.area += num_cores*2 + freq*3 + mem_size*1
+        self.latency += num_cores*3 + freq*3 + mem_size*1
+
+        observation = np.array([self.energy, self.area, self.latency])
+        ideal_values = np.array([4, 2.0, 1, 32])
+        # print(action)
+        # print(ideal_values)
+        reward = -np.linalg.norm(action - ideal_values)
+
+        done = True
+       
+        return observation, reward, done, {}
+
+    def render(self, mode='human'):
+        print (f'Energy: {self.energy}, Area: {self.area}, Latency: {self.latency}')
+    # def main(self):
+        
+    #     # observation = self.reset()
+    #     # print("The initial observation is {}".format(observation))
+    #     action = self.action_space.sample()
+    #     print("The taken action is {}".format(action))
+    #     obs, reward, done, info = self.step(action)
+    #     print("The outcome is {}".format(reward))
\ No newline at end of file
diff --git a/arch_gym/envs/custom_env_2.py b/arch_gym/envs/custom_env_2.py
new file mode 100644
index 00000000..60e5e9c2
--- /dev/null
+++ b/arch_gym/envs/custom_env_2.py
@@ -0,0 +1,73 @@
+from absl import flags, app
+import gym 
+import numpy as np
+from gym import Env, spaces
+
+
+class SimpleArch(Env):
+    def __init__(self):
+        super(SimpleArch, self).__init__()
+        
+        self.energy = 0.0; self.area = 0.0; self.latency = 0.0
+        
+        
+        # set ideal architecture parameters
+        self.ideal = np.array([4, 2.0, 1, 32])   #the ideal values are those of [num_cores, freq, mem_type, mem_size]
+
+        
+        # define the observation space: Energy, Area, Latency
+        self.observation_shape = (3,)
+        self.observation_space = spaces.Box(low=0, high=np.inf, shape=self.observation_shape, dtype=np.float32)
+        
+        # define the action space
+        self.action_space = spaces.Tuple((
+            spaces.Discrete(8),           # num_cores
+            spaces.Box(low=0.5, high=2.5, shape=(1,), dtype=np.float32),  # freq
+            spaces.Discrete(3),           # mem_type  ## 0, 1, 2 would correspond to DRAM, SRAM, Hybrid
+            spaces.Discrete(64)           # mem_size
+        ))
+        
+    def reset(self):
+        self.energy = 0.0; self.area = 0.0; self.latency = 0.0
+        return np.array([self.energy, self.area, self.latency], dtype=np.float32)
+    
+    def step(self, action):
+        # Extract the action values
+        num_cores, freq, mem_type, mem_size = action
+
+        # Compute the new state based on the action
+        # these state values may be calculated using any random formulae for now
+        self.energy += 1
+        self.area += 1
+        self.latency += 1
+
+
+        # Compute the negative of Euclidean distance as the reward
+        reward = -np.linalg.norm(self.ideal - action)
+
+
+        # Update the observation
+        observation = [self.energy, self.area, self.latency]
+
+        # Set done to True since we have a simple environment with a single episode
+        done = True
+
+        # Return the new observation, reward, done flag, and additional information (empty dict in this case)
+        return observation, reward, done, {}
+
+    def render(self, mode='human'):
+        print (f'Energy: {self.energy}, Area: {self.area}, Latency: {self.latency}')
+
+
+
+def main(_):
+    env = SimpleArch()
+    env.reset()
+    action = env.action_space.sample()
+    print (f'Action: {action}')
+    env.render()
+    obs, reward, done, info = env.step(action)
+    print(reward)
+
+if __name__ == '__main__':
+    app.run(main)
\ No newline at end of file
diff --git a/sims/customenv/__init__.py b/sims/customenv/__init__.py
new file mode 100644
index 00000000..e69de29b
diff --git a/sims/customenv/quasi_random_search_vizier.py b/sims/customenv/quasi_random_search_vizier.py
new file mode 100644
index 00000000..0136af63
--- /dev/null
+++ b/sims/customenv/quasi_random_search_vizier.py
@@ -0,0 +1,245 @@
+import os
+import sys
+
+from absl import flags
+from absl import app
+from absl import logging
+
+os.sys.path.insert(0, os.path.abspath('../../'))
+#from configs import arch_gym_configs
+#from arch_gym.envs.envHelpers import helpers
+#from arch_gym.envs import dramsys_wrapper
+#import envlogger
+import numpy as np
+import pandas as pd
+
+from concurrent import futures
+import grpc
+import portpicker
+
+from vizier.service import clients
+from vizier.service import pyvizier as vz
+from vizier.service import vizier_server
+from vizier.service import vizier_service_pb2_grpc
+
+from typing import Optional, Sequence
+
+from vizier import algorithms as vza
+from vizier import pythia
+#from vizier.algorithms import designers 
+
+
+from vizier._src.algorithms.designers import quasi_random
+from vizier._src.algorithms.designers import random
+from vizier._src.algorithms.designers import emukit
+from vizier._src.algorithms.designers import grid
+
+
+#from vizier._src.algorithms.testing import test_runners  
+#from vizier.testing import test_studies                  
+#from absl.testing import absltest
+
+os.sys.path.insert(0, os.path.abspath('../../'))
+from arch_gym.envs.custom_env_2 import SimpleArch
+
+
+flags.DEFINE_string('workload', 'some random stuff', 'Which DRAMSys workload to run?')
+flags.DEFINE_integer('num_steps', 1000, 'Number of training steps.')
+flags.DEFINE_integer('num_episodes', 1, 'Number of training episodes.')
+flags.DEFINE_string('traject_dir', 
+                    'random_walker_trajectories', 'Directory to save the dataset.')
+flags.DEFINE_bool('use_envlogger', False, 'Use envlogger to log the data.') 
+flags.DEFINE_string('summary_dir', '.', 'Directory to save the summary.')
+flags.DEFINE_string('reward_formulation', 'power', 'Which reward formulation to use?')
+
+FLAGS = flags.FLAGS
+
+def log_fitness_to_csv(filename, fitness_dict):
+        df = pd.DataFrame([fitness_dict['reward']])
+        csvfile = os.path.join(filename, "fitness.csv")
+        df.to_csv(csvfile, index=False, header=False, mode='a')
+
+        # append to csv
+        df = pd.DataFrame([fitness_dict])
+        csvfile = os.path.join(filename, "trajectory.csv")
+        df.to_csv(csvfile, index=False, header=False, mode='a')
+
+def wrap_in_envlogger(env, envlogger_dir):      
+    # pass your environment to it.
+    metadata = {
+        'agent_type': 'RandomWalker',
+        'num_steps': FLAGS.num_steps,
+        'env_type': type(env).__name__,
+    }
+    if FLAGS.use_envlogger:
+        logging.info('Wrapping environment with EnvironmentLogger...')
+        env = envlogger.EnvLogger(env,
+                                  data_directory=envlogger_dir,
+                                  max_episodes_per_file=1000,
+                                  metadata=metadata)
+        logging.info('Done wrapping environment with EnvironmentLogger.')
+        return env
+    else:
+        return env
+
+
+def main(_):
+    env = SimpleArch()   #importing custom env here
+    env.reset()
+
+    #dram_helper = helpers()                          
+    
+    fitness_hist = {}
+                                                      
+    # experiment name 
+    exp_name = str(FLAGS.workload)+"_num_steps_" + str(FLAGS.num_steps) + "_num_episodes_" + str(FLAGS.num_episodes)
+
+    # append logs to base path
+    log_path = os.path.join(FLAGS.summary_dir, 'random_walker_logs', FLAGS.reward_formulation, exp_name)
+
+    # get the current working directory and append the exp name
+    traject_dir = os.path.join(FLAGS.summary_dir, FLAGS.traject_dir, FLAGS.reward_formulation, exp_name)
+
+    # check if log_path exists else create it                      
+    if not os.path.exists(log_path):
+        os.makedirs(log_path)
+
+    #if FLAGS.use_envlogger:                      
+        #if not os.path.exists(traject_dir):
+            #os.makedirs(traject_dir)
+    #env = wrap_in_envlogger(env, traject_dir)
+
+
+    problem = vz.ProblemStatement()
+
+    problem.search_space.select_root().add_int_param(name = 'num_cores', min_value=0, max_value=10)
+    problem.search_space.select_root().add_float_param(name = 'freq', min_value=0, max_value=5)
+    problem.search_space.select_root().add_discrete_param(name = 'mem_type', feasible_values = [0,1,2])
+    problem.search_space.select_root().add_discrete_param(name = 'mem_size', feasible_values = [0,16,32,64,128,256])
+
+
+    # Our goal is to maximize reward, and thus find the set of action values which correspond to the maximum reward
+    problem.metric_information.append(
+        vz.MetricInformation(
+            name='Reward', goal=vz.ObjectiveMetricGoal.MAXIMIZE))
+    
+
+    study_config = vz.StudyConfig.from_problem(problem)
+    a = study_config.search_space
+    print(a)
+
+
+    #SETTING THE ALGORITHM
+    study_config.algorithm = vz.Algorithm.RANDOM_SEARCH
+    
+
+    #SETTING CUSTOM HYPERPARAMETERS, by importing the algorithm's class:
+
+    # mydesigner = random.RandomDesigner(problem.search_space, seed=10)  #use this for RANDOM SEARCH
+    #mydesigner = emukit.EmukitDesigner(problem, num_random_samples=10)  #use this for EMUKIT
+    #mydesigner = grid.GridSearchDesigner(problem.search_space)  #use this for GRID SEARCH
+
+    mydesigner = quasi_random.QuasiRandomDesigner(problem.search_space)  #use this for QUASI RANDOM SEARCH
+    # setting the hyperparameters for quasi_random:
+    mydesigner._halton_generator = quasi_random._HaltonSequence(len(problem.search_space.parameters),skip_points=0,
+                                                                num_points_generated=0,scramble=False)
+
+    #print(type(mydesigner))
+
+
+    port = portpicker.pick_unused_port()
+    address = f'localhost:{port}'
+
+    # Setup server.
+    server = grpc.server(futures.ThreadPoolExecutor(max_workers=100))
+
+    # Setup Vizier Service.
+    servicer = vizier_server.VizierService()
+    vizier_service_pb2_grpc.add_VizierServiceServicer_to_server(servicer, server)
+    server.add_secure_port(address, grpc.local_server_credentials())
+
+    # Start the server.
+    server.start()
+
+    clients.environment_variables.service_endpoint = address  # Server address.
+    study = clients.Study.from_study_config(
+        study_config, owner='owner', study_id='example_study_id')
+
+    #suggestions1 = study.suggest(count=FLAGS.num_steps)
+    suggestions = mydesigner.suggest(count=FLAGS.num_steps)
+
+    aa = []
+
+    max_reward = float('-inf')
+    for i in range(FLAGS.num_episodes):
+
+        logging.info('Episode %r', i)
+        count = 1
+        for suggestion in suggestions:                
+
+            num_cores = suggestion.parameters['num_cores']
+            freq =  suggestion.parameters['freq']
+            mem_type =  suggestion.parameters['mem_type']
+            mem_size =  suggestion.parameters['mem_size']
+
+
+            print("\n")
+            print(count)
+            print('Suggested Parameters (num_cores, freq, mem_type, mem_size):', num_cores, freq, mem_type, mem_size)
+
+
+            # generate action based on the suggested parameters
+            action = [num_cores, freq, mem_type, mem_size]
+            print (f'Action: {action}')
+            #print("\n", "datatype of action is: ", type(num_cores), type(freq), type(mem_type), type(mem_size))
+            #convert into float:
+            for i in range(len(action)):
+                action[i] = float(action[i].value)
+
+            # decode the actions                              
+            #action_dict = dram_helper.action_decoder_ga(action)
+
+            #_, reward, c, info = env.step(action_dict)
+            obs, reward, done, info = env.step(action)
+            env.render()  #prints the observation which is (energy, area, latency)
+            print(f'Reward: {reward}')
+
+            # loop added to store max reward and corresponding action:
+            if reward > max_reward:
+                max_reward = reward
+                best_action = action
+
+            final_measurement = vz.Measurement({'Reward': reward})
+            aa.append(final_measurement)
+            #print(type(suggestion))
+            #convert the type from TrialSuggestion to Trial:
+            suggestion = suggestion.to_trial()
+            suggestion.complete(final_measurement)
+            count += 1
+
+            fitness_hist['reward'] = reward
+            fitness_hist['action'] = action
+            #fitness_hist['obs'] = info
+            fitness_hist['obs'] = obs
+
+            log_fitness_to_csv(log_path, fitness_hist)
+
+
+        # custom loop to print the actions corresponding to max reward.   
+        print("\n", "OPTIMAL ACTION AND CORRESPONDING REWARD ARE: ", "\n", "Best Action: ",
+               best_action, "\n", "Max reward: ", max_reward)
+
+        # The below loop does not work now
+        # To do: integrate the below loop with the suggestions from mydesigner.
+        count = 1
+        for optimal_trial in study.optimal_trials():
+            optimal_trial = optimal_trial.materialize()
+            print("\n")
+            print(count)
+            print("Optimal Trial Suggestion and Objective:", optimal_trial.parameters,
+                    optimal_trial.final_measurement)
+            count += 1
+    
+if __name__ == '__main__':
+   app.run(main)
+
diff --git a/sims/customenv/supported_algo.py b/sims/customenv/supported_algo.py
new file mode 100644
index 00000000..10b26def
--- /dev/null
+++ b/sims/customenv/supported_algo.py
@@ -0,0 +1,4 @@
+from vizier.service import pyvizier as vz
+print("Supported Algirthms:")
+for algo in vz.Algorithm:
+    print(algo)
\ No newline at end of file
diff --git a/sims/customenv/train_EMUKIT_GP_vizier.py b/sims/customenv/train_EMUKIT_GP_vizier.py
new file mode 100644
index 00000000..5d26c705
--- /dev/null
+++ b/sims/customenv/train_EMUKIT_GP_vizier.py
@@ -0,0 +1,167 @@
+from concurrent import futures
+import grpc
+import portpicker
+import sys
+import os
+
+
+from absl import flags
+from absl import app
+from absl import logging
+
+os.sys.path.insert(0, os.path.abspath('../../'))
+# from configs import arch_gym_configs
+# from arch_gym.envs.envHelpers import helpers
+
+import envlogger
+import numpy as np
+import pandas as pd
+
+from vizier._src.algorithms.designers import emukit
+from vizier._src.algorithms.designers.emukit import EmukitDesigner
+from arch_gym.envs.custom_env import CustomEnv
+from vizier.service import clients
+from vizier.service import pyvizier as vz
+from vizier.service import vizier_server
+from vizier.service import vizier_service_pb2_grpc
+
+# flags.DEFINE_string('workload', 'stream.stl', 'Which DRAMSys workload to run?')
+flags.DEFINE_integer('num_steps', 50, 'Number of training steps.')
+flags.DEFINE_integer('num_episodes', 2, 'Number of training episodes.')
+flags.DEFINE_string('traject_dir', 
+                    'EMUKIT_trajectories', 
+            'Directory to save the dataset.')
+flags.DEFINE_bool('use_envlogger', False, 'Use envlogger to log the data.')  
+flags.DEFINE_string('summary_dir', '.', 'Directory to save the summary.')
+flags.DEFINE_string('reward_formulation', 'power', 'Which reward formulation to use?')
+flags.DEFINE_integer('num_random_sample', 100, 'hyperparameter for emukit')
+FLAGS = flags.FLAGS
+
+def log_fitness_to_csv(filename, fitness_dict):
+    """Logs fitness history to csv file
+
+    Args:
+        filename (str): path to the csv file
+        fitness_dict (dict): dictionary containing the fitness history
+    """
+    df = pd.DataFrame([fitness_dict['reward']])
+    csvfile = os.path.join(filename, "fitness.csv")
+    df.to_csv(csvfile, index=False, header=False, mode='a')
+
+    # append to csv
+    df = pd.DataFrame([fitness_dict])
+    csvfile = os.path.join(filename, "trajectory.csv")
+    df.to_csv(csvfile, index=False, header=False, mode='a')
+
+def wrap_in_envlogger(env, envlogger_dir):
+    """Wraps the environment in envlogger
+
+    Args:
+        env (gym.Env): gym environment
+        envlogger_dir (str): path to the directory where the data will be logged
+    """
+    metadata = {
+        'agent_type': 'EMUKIT_GP_EI',
+        'num_steps': FLAGS.num_steps,
+        'env_type': type(env).__name__,
+    }
+    if FLAGS.use_envlogger:
+        logging.info('Wrapping environment with EnvironmentLogger...')
+        env = envlogger.EnvLogger(env,
+                                  data_directory=envlogger_dir,
+                                  max_episodes_per_file=1000,
+                                  metadata=metadata)
+        logging.info('Done wrapping environment with EnvironmentLogger.')
+        return env
+    else:
+        return env
+
+
+
+def main(_):
+    """Trains the custom environment using random actions for a given number of steps and episodes 
+    """
+
+    env = CustomEnv()
+    observation = env.reset()
+    fitness_hist = {}
+    problem = vz.ProblemStatement()
+    problem.search_space.select_root().add_int_param(name='num_cores', min_value = 1, max_value = 12)
+    problem.search_space.select_root().add_float_param(name='freq', min_value = 0.5, max_value = 3)
+    problem.search_space.select_root().add_categorical_param(name='mem_type', feasible_values =['DRAM', 'SRAM', 'Hybrid'])
+    problem.search_space.select_root().add_discrete_param(name='mem_size', feasible_values=[0, 32, 64, 128, 256, 512])
+
+    problem.metric_information.append(
+        vz.MetricInformation(
+            name='Reward', goal=vz.ObjectiveMetricGoal.MAXIMIZE))
+
+
+    study_config = vz.StudyConfig.from_problem(problem)
+    # study_config.algorithm = vz.Algorithm.EMUKIT_GP_EI
+    emukit_designer = emukit.EmukitDesigner(problem, num_random_samples= FLAGS.num_random_sample)
+    
+    
+    
+
+    port = portpicker.pick_unused_port()
+    address = f'localhost:{port}'
+
+    # Setup server.
+    server = grpc.server(futures.ThreadPoolExecutor(max_workers=100))
+
+    # Setup Vizier Service.
+    servicer = vizier_server.VizierService()
+    vizier_service_pb2_grpc.add_VizierServiceServicer_to_server(servicer, server)
+    server.add_secure_port(address, grpc.local_server_credentials())
+
+    # Start the server.
+    server.start()
+
+    clients.environment_variables.service_endpoint = address  # Server address.
+    study = clients.Study.from_study_config(
+        study_config, owner='owner', study_id='example_study_id')
+
+     # experiment name 
+    exp_name = "_num_steps_" + str(FLAGS.num_steps) + "_num_episodes_" + str(FLAGS.num_episodes)
+
+    # append logs to base path
+    log_path = os.path.join(FLAGS.summary_dir, 'EMUKIT_logs', FLAGS.reward_formulation, exp_name)
+
+    # get the current working directory and append the exp name
+    traject_dir = os.path.join(FLAGS.summary_dir, FLAGS.traject_dir, FLAGS.reward_formulation, exp_name)
+
+    # check if log_path exists else create it
+    if not os.path.exists(log_path):
+        os.makedirs(log_path)
+
+    if FLAGS.use_envlogger:
+        if not os.path.exists(traject_dir):
+            os.makedirs(traject_dir)
+    env = wrap_in_envlogger(env, traject_dir)
+
+    
+    suggestions = emukit_designer.suggest(count=flags.FLAGS.num_steps)
+    for suggestion in suggestions:
+        num_cores = str(suggestion.parameters['num_cores'])
+        freq = str(suggestion.parameters['freq'])
+        mem_type_dict = {'DRAM':0, 'SRAM':1, 'Hybrid':2}
+        mem_type = str(mem_type_dict[str(suggestion.parameters['mem_type'])])
+        mem_size = str(suggestion.parameters['mem_size'])
+        
+        action = {"num_cores":float(num_cores), "freq": float(freq), "mem_type":float(mem_type), "mem_size": float(mem_size)}
+        
+        print("Suggested Parameters for num_cores, freq, mem_type, mem_size are :", num_cores, freq, mem_type, mem_size)
+        obs, reward, done, info = (env.step(action))
+        fitness_hist['reward'] = reward
+        fitness_hist['action'] = action
+        fitness_hist['obs'] = obs
+        log_fitness_to_csv(log_path, fitness_hist)
+        print("Observation: ",obs)
+        final_measurement = vz.Measurement({'Reward': reward})
+        suggestion = suggestion.to_trial()
+        suggestion.complete(final_measurement)
+    
+
+
+if __name__ == '__main__':
+   app.run(main)
\ No newline at end of file
diff --git a/sims/customenv/train_NSGA2_vizier.py b/sims/customenv/train_NSGA2_vizier.py
new file mode 100644
index 00000000..4c639aa4
--- /dev/null
+++ b/sims/customenv/train_NSGA2_vizier.py
@@ -0,0 +1,175 @@
+from concurrent import futures
+import grpc
+import portpicker
+import sys
+import os
+
+
+from absl import flags
+from absl import app
+from absl import logging
+
+os.sys.path.insert(0, os.path.abspath('../../'))
+
+# from configs import arch_gym_configs
+# from arch_gym.envs.envHelpers import helpers
+
+import envlogger
+import numpy as np
+import pandas as pd
+
+
+from vizier._src.algorithms.evolution.nsga2 import NSGA2Survival, create_nsga2
+from arch_gym.envs.custom_env import CustomEnv
+from vizier.service import clients
+from vizier.service import pyvizier as vz
+from vizier.service import vizier_server
+from vizier.service import vizier_service_pb2_grpc
+
+# flags.DEFINE_string('workload', 'stream.stl', 'Which DRAMSys workload to run?')
+flags.DEFINE_integer('num_steps', 50, 'Number of training steps.')
+flags.DEFINE_integer('num_episodes', 2, 'Number of training episodes.')
+flags.DEFINE_string('traject_dir', 
+                    'NSGA2_trajectories', 
+            'Directory to save the dataset.')
+flags.DEFINE_bool('use_envlogger', False, 'Use envlogger to log the data.')  
+flags.DEFINE_string('summary_dir', '.', 'Directory to save the summary.')
+flags.DEFINE_string('reward_formulation', 'power', 'Which reward formulation to use?')
+flags.DEFINE_integer('population_size', 100, 'hyperparameter1 for NSGA2')
+flags.DEFINE_integer('eviction_limit', 3, 'hyperparameter2 for NSGA2')
+
+FLAGS = flags.FLAGS
+
+def log_fitness_to_csv(filename, fitness_dict):
+    """Wraps the environment in envlogger
+
+    Args:
+        env (gym.Env): gym environment
+        envlogger_dir (str): path to the directory where the data will be logged
+    """
+
+        
+    df = pd.DataFrame([fitness_dict['reward']])
+    csvfile = os.path.join(filename, "fitness.csv")
+    df.to_csv(csvfile, index=False, header=False, mode='a')
+
+    # append to csv
+    df = pd.DataFrame([fitness_dict])
+    csvfile = os.path.join(filename, "trajectory.csv")
+    df.to_csv(csvfile, index=False, header=False, mode='a')
+
+def wrap_in_envlogger(env, envlogger_dir):
+    """Wraps the environment in envlogger
+
+    Args:
+        env (gym.Env): gym environment
+        envlogger_dir (str): path to the directory where the data will be logged
+    """
+    metadata = {
+        'agent_type': 'NSGA2',
+        'num_steps': FLAGS.num_steps,
+        'env_type': type(env).__name__,
+    }
+    if FLAGS.use_envlogger:
+        logging.info('Wrapping environment with EnvironmentLogger...')
+        env = envlogger.EnvLogger(env,
+                                  data_directory=envlogger_dir,
+                                  max_episodes_per_file=1000,
+                                  metadata=metadata)
+        logging.info('Done wrapping environment with EnvironmentLogger.')
+        return env
+    else:
+        return env
+
+
+
+def main(_):
+    """Trains the custom environment using random actions for a given number of steps and episodes 
+    """
+
+    env = CustomEnv()
+    observation = env.reset()
+    fitness_hist = {}
+    problem = vz.ProblemStatement()
+    problem.search_space.select_root().add_int_param(name='num_cores', min_value = 1, max_value = 12)
+    problem.search_space.select_root().add_float_param(name='freq', min_value = 0.5, max_value = 3)
+    problem.search_space.select_root().add_categorical_param(name='mem_type', feasible_values =['DRAM', 'SRAM', 'Hybrid'])
+    problem.search_space.select_root().add_discrete_param(name='mem_size', feasible_values=[0, 32, 64, 128, 256, 512])
+
+    problem.metric_information.append(
+        vz.MetricInformation(
+            name='Reward', goal=vz.ObjectiveMetricGoal.MINIMIZE))
+
+
+
+    study_config = vz.StudyConfig.from_problem(problem)
+    # study_config.algorithm = vz.Algorithm.NSGA2
+
+    # nsga2_evolution = NSGA2Survival(target_size = FLAGS.target_size, eviction_limit= FLAGS.eviction_limit)
+    nsga2_designer = create_nsga2(problem, population_size = FLAGS.population_size, eviction_limit= FLAGS.eviction_limit )
+    port = portpicker.pick_unused_port()
+    address = f'localhost:{port}'
+
+    # Setup server.
+    server = grpc.server(futures.ThreadPoolExecutor(max_workers=100))
+
+    # Setup Vizier Service.
+    servicer = vizier_server.VizierService()
+    vizier_service_pb2_grpc.add_VizierServiceServicer_to_server(servicer, server)
+    server.add_secure_port(address, grpc.local_server_credentials())
+
+    # Start the server.
+    server.start()
+
+    clients.environment_variables.service_endpoint = address  # Server address.
+    study = clients.Study.from_study_config(
+        study_config, owner='owner', study_id='example_study_id')
+
+     # experiment name 
+    exp_name = "_num_steps_" + str(FLAGS.num_steps) + "_num_episodes_" + str(FLAGS.num_episodes)
+
+    # append logs to base path
+    log_path = os.path.join(FLAGS.summary_dir, 'NSGA2_logs', FLAGS.reward_formulation, exp_name)
+
+    # get the current working directory and append the exp name
+    traject_dir = os.path.join(FLAGS.summary_dir, FLAGS.traject_dir, FLAGS.reward_formulation, exp_name)
+
+    # check if log_path exists else create it
+    if not os.path.exists(log_path):
+        os.makedirs(log_path)
+
+    if FLAGS.use_envlogger:
+        if not os.path.exists(traject_dir):
+            os.makedirs(traject_dir)
+    env = wrap_in_envlogger(env, traject_dir)
+
+    # for i in range(flags.FLAGS.num_episodes):
+    max_reward = float('-inf')
+    suggestions = nsga2_designer.suggest(count=flags.FLAGS.num_steps)
+    for suggestion in suggestions:
+        num_cores = str(suggestion.parameters['num_cores'])
+        freq = str(suggestion.parameters['freq'])
+        mem_type_dict = {'DRAM':0, 'SRAM':1, 'Hybrid':2}
+        mem_type = str(mem_type_dict[str(suggestion.parameters['mem_type'])])
+        mem_size = str(suggestion.parameters['mem_size'])
+        
+        action = {"num_cores":float(num_cores), "freq": float(freq), "mem_type":float(mem_type), "mem_size": float(mem_size)}
+        
+        print("Suggested Parameters for num_cores, freq, mem_type, mem_size are :", num_cores, freq, mem_type, mem_size)
+        obs, reward, done, info = (env.step(action))
+        fitness_hist['reward'] = reward
+        fitness_hist['action'] = action
+        fitness_hist['obs'] = obs
+        log_fitness_to_csv(log_path, fitness_hist)
+        print("Observation: ",obs)
+        
+        final_measurement = vz.Measurement({'Reward': reward})
+        suggestion = suggestion.to_trial()
+        suggestion.complete(final_measurement)
+    
+
+
+   
+
+if __name__ == '__main__':
+   app.run(main)
\ No newline at end of file
diff --git a/sims/customenv/train_gridsearch_vizier.py b/sims/customenv/train_gridsearch_vizier.py
new file mode 100644
index 00000000..93240ed6
--- /dev/null
+++ b/sims/customenv/train_gridsearch_vizier.py
@@ -0,0 +1,166 @@
+from concurrent import futures
+import grpc
+import portpicker
+import sys
+import os
+
+
+from absl import flags
+from absl import app
+from absl import logging
+
+os.sys.path.insert(0, os.path.abspath('../../'))
+# from configs import arch_gym_configs
+# from arch_gym.envs.envHelpers import helpers
+
+import envlogger
+import numpy as np
+import pandas as pd
+
+
+from vizier._src.algorithms.designers import grid
+from arch_gym.envs.custom_env import CustomEnv
+from vizier.service import clients
+from vizier.service import pyvizier as vz
+from vizier.service import vizier_server
+from vizier.service import vizier_service_pb2_grpc
+
+# flags.DEFINE_string('workload', 'stream.stl', 'Which DRAMSys workload to run?')
+flags.DEFINE_integer('num_steps', 100, 'Number of training steps.')
+flags.DEFINE_integer('num_episodes', 2, 'Number of training episodes.')
+flags.DEFINE_string('traject_dir', 
+                    'grid_search_trajectories', 
+            'Directory to save the dataset.')
+flags.DEFINE_bool('use_envlogger', False, 'Use envlogger to log the data.')  
+flags.DEFINE_string('summary_dir', '.', 'Directory to save the summary.')
+flags.DEFINE_string('reward_formulation', 'power', 'Which reward formulation to use?')
+FLAGS = flags.FLAGS
+
+def log_fitness_to_csv(filename, fitness_dict):
+    """Logs fitness history to csv file
+
+    Args:
+        filename (str): path to the csv file
+        fitness_dict (dict): dictionary containing the fitness history
+    """
+    df = pd.DataFrame([fitness_dict['reward']])
+    csvfile = os.path.join(filename, "fitness.csv")
+    df.to_csv(csvfile, index=False, header=False, mode='a')
+
+    # append to csv
+    df = pd.DataFrame([fitness_dict])
+    csvfile = os.path.join(filename, "trajectory.csv")
+    df.to_csv(csvfile, index=False, header=False, mode='a')
+
+def wrap_in_envlogger(env, envlogger_dir):
+    """Wraps the environment in envlogger
+
+    Args:
+        env (gym.Env): gym environment
+        envlogger_dir (str): path to the directory where the data will be logged
+    """
+    metadata = {
+        'agent_type': 'GridSearch',
+        'num_steps': FLAGS.num_steps,
+        'env_type': type(env).__name__,
+    }
+    if FLAGS.use_envlogger:
+        logging.info('Wrapping environment with EnvironmentLogger...')
+        env = envlogger.EnvLogger(env,
+                                  data_directory=envlogger_dir,
+                                  max_episodes_per_file=1000,
+                                  metadata=metadata)
+        logging.info('Done wrapping environment with EnvironmentLogger.')
+        return env
+    else:
+        return env
+
+
+
+def main(_):
+    """Trains the custom environment using random actions for a given number of steps and episodes 
+    """
+
+    env = CustomEnv()
+    observation = env.reset()
+    fitness_hist = {}
+    problem = vz.ProblemStatement()
+    problem.search_space.select_root().add_int_param(name='num_cores', min_value = 1, max_value = 12)
+    problem.search_space.select_root().add_float_param(name='freq', min_value = 0.5, max_value = 3)
+    problem.search_space.select_root().add_categorical_param(name='mem_type', feasible_values =['DRAM', 'SRAM', 'Hybrid'])
+    problem.search_space.select_root().add_discrete_param(name='mem_size', feasible_values=[0, 32, 64, 128, 256, 512])
+
+    problem.metric_information.append(
+        vz.MetricInformation(
+            name='Reward', goal=vz.ObjectiveMetricGoal.MINIMIZE))
+
+    
+    study_config = vz.StudyConfig.from_problem(problem)
+    study_config.algorithm = vz.Algorithm.GRID_SEARCH
+
+    
+    
+
+    port = portpicker.pick_unused_port()
+    address = f'localhost:{port}'
+
+    # Setup server.
+    server = grpc.server(futures.ThreadPoolExecutor(max_workers=100))
+
+    # Setup Vizier Service.
+    servicer = vizier_server.VizierService()
+    vizier_service_pb2_grpc.add_VizierServiceServicer_to_server(servicer, server)
+    server.add_secure_port(address, grpc.local_server_credentials())
+
+    # Start the server.
+    server.start()
+
+    clients.environment_variables.service_endpoint = address  # Server address.
+    study = clients.Study.from_study_config(
+        study_config, owner='owner', study_id='example_study_id')
+
+     # experiment name 
+    exp_name = "_num_steps_" + str(FLAGS.num_steps) + "_num_episodes_" + str(FLAGS.num_episodes)
+
+    # append logs to base path
+    log_path = os.path.join(FLAGS.summary_dir, 'grid_search_logs', FLAGS.reward_formulation, exp_name)
+
+    # get the current working directory and append the exp name
+    traject_dir = os.path.join(FLAGS.summary_dir, FLAGS.traject_dir, FLAGS.reward_formulation, exp_name)
+
+    # check if log_path exists else create it
+    if not os.path.exists(log_path):
+        os.makedirs(log_path)
+
+    if FLAGS.use_envlogger:
+        if not os.path.exists(traject_dir):
+            os.makedirs(traject_dir)
+    env = wrap_in_envlogger(env, traject_dir)
+
+    for i in range(flags.FLAGS.num_episodes):
+        suggestions = study.suggest(count=flags.FLAGS.num_steps)
+        for suggestion in suggestions:
+            num_cores = float(suggestion.parameters['num_cores'])
+            freq = float(suggestion.parameters['freq'])
+            mem_type_dict = {'DRAM':0, 'SRAM':1, 'Hybrid':2}
+            mem_type = float(mem_type_dict[suggestion.parameters['mem_type']])
+            mem_size = float(suggestion.parameters['mem_size'])
+            action = {"num_cores":num_cores, "freq": freq, "mem_type":mem_type, "mem_size": mem_size}
+            print("Suggested Parameters for num_cores, freq, mem_type, mem_size are :", num_cores, freq, mem_type, mem_size)
+            obs, reward, done, info = (env.step(action))
+            fitness_hist['reward'] = reward
+            fitness_hist['action'] = action
+            fitness_hist['obs'] = obs
+            log_fitness_to_csv(log_path, fitness_hist)
+            print("Observation: ",obs)
+            final_measurement = vz.Measurement({'Reward': reward})
+            suggestion.complete(final_measurement)
+
+
+    for optimal_trial in study.optimal_trials():
+        optimal_trial = optimal_trial.materialize()
+        print("Optimal Trial Suggestion and Objective:", optimal_trial.parameters,
+                optimal_trial.final_measurement)
+
+if __name__ == '__main__':
+   app.run(main)
\ No newline at end of file
diff --git a/sims/customenv/train_randomsearch_vizier.py b/sims/customenv/train_randomsearch_vizier.py
new file mode 100644
index 00000000..e47b5763
--- /dev/null
+++ b/sims/customenv/train_randomsearch_vizier.py
@@ -0,0 +1,172 @@
+from concurrent import futures
+import grpc
+import portpicker
+import sys
+import os
+
+
+from absl import flags
+from absl import app
+from absl import logging
+
+os.sys.path.insert(0, os.path.abspath('../../'))
+# from configs import arch_gym_configs
+# from arch_gym.envs.envHelpers import helpers
+
+import envlogger
+import numpy as np
+import pandas as pd
+
+
+from vizier._src.algorithms.designers.random import RandomDesigner
+from arch_gym.envs.custom_env import CustomEnv
+from vizier.service import clients
+from vizier.service import pyvizier as vz
+from vizier.service import vizier_server
+from vizier.service import vizier_service_pb2_grpc
+
+flags.DEFINE_string('workload', 'stream.stl', 'Which DRAMSys workload to run?')
+flags.DEFINE_integer('num_steps', 100, 'Number of training steps.')
+flags.DEFINE_integer('num_episodes', 2, 'Number of training episodes.')
+flags.DEFINE_string('traject_dir', 
+                    'random_search_trajectories', 
+            'Directory to save the dataset.')
+flags.DEFINE_bool('use_envlogger', False, 'Use envlogger to log the data.')  
+flags.DEFINE_string('summary_dir', '.', 'Directory to save the summary.')
+flags.DEFINE_string('reward_formulation', 'power', 'Which reward formulation to use?')
+flags.DEFINE_integer('seed', 110, 'random_search_hyperparameter')
+FLAGS = flags.FLAGS
+
+def log_fitness_to_csv(filename, fitness_dict):
+    """Logs fitness history to csv file
+
+    Args:
+        filename (str): path to the csv file
+        fitness_dict (dict): dictionary containing the fitness history
+    """
+    df = pd.DataFrame([fitness_dict['reward']])
+    csvfile = os.path.join(filename, "fitness.csv")
+    df.to_csv(csvfile, index=False, header=False, mode='a')
+
+    # append to csv
+    df = pd.DataFrame([fitness_dict])
+    csvfile = os.path.join(filename, "trajectory.csv")
+    df.to_csv(csvfile, index=False, header=False, mode='a')
+
+def wrap_in_envlogger(env, envlogger_dir):
+    """Wraps the environment in envlogger
+
+    Args:
+        env (gym.Env): gym environment
+        envlogger_dir (str): path to the directory where the data will be logged
+    """
+    metadata = {
+        'agent_type': 'RandomSearch',
+        'num_steps': FLAGS.num_steps,
+        'env_type': type(env).__name__,
+    }
+    if FLAGS.use_envlogger:
+        logging.info('Wrapping environment with EnvironmentLogger...')
+        env = envlogger.EnvLogger(env,
+                                  data_directory=envlogger_dir,
+                                  max_episodes_per_file=1000,
+                                  metadata=metadata)
+        logging.info('Done wrapping environment with EnvironmentLogger.')
+        return env
+    else:
+        return env
+
+
+
+def main(_):
+    """Trains the custom environment using random actions for a given number of steps and episodes 
+    """
+
+    env = CustomEnv()
+    observation = env.reset()
+    fitness_hist = {}
+    problem = vz.ProblemStatement()
+    problem.search_space.select_root().add_int_param(name='num_cores', min_value = 1, max_value = 12)
+    problem.search_space.select_root().add_float_param(name='freq', min_value = 0.5, max_value = 3)
+    problem.search_space.select_root().add_categorical_param(name='mem_type', feasible_values =['DRAM', 'SRAM', 'Hybrid'])
+    problem.search_space.select_root().add_discrete_param(name='mem_size', feasible_values=[0, 32, 64, 128, 256, 512])
+
+    problem.metric_information.append(
+        vz.MetricInformation(
+            name='Reward', goal=vz.ObjectiveMetricGoal.MAXIMIZE))
+
+   
+
+
+    study_config = vz.StudyConfig.from_problem(problem)
+    # study_config.algorithm = vz.Algorithm.RANDOM_SEARCH
+    random_designer = RandomDesigner(problem.search_space, seed = FLAGS.seed)
+
+
+    
+
+    port = portpicker.pick_unused_port()
+    address = f'localhost:{port}'
+
+    # Setup server.
+    server = grpc.server(futures.ThreadPoolExecutor(max_workers=100))
+
+    # Setup Vizier Service.
+    servicer = vizier_server.VizierService()
+    vizier_service_pb2_grpc.add_VizierServiceServicer_to_server(servicer, server)
+    server.add_secure_port(address, grpc.local_server_credentials())
+
+    # Start the server.
+    server.start()
+
+    clients.environment_variables.service_endpoint = address  # Server address.
+    study = clients.Study.from_study_config(
+        study_config, owner='owner', study_id='example_study_id')
+
+     # experiment name 
+    exp_name = "_num_steps_" + str(FLAGS.num_steps) + "_num_episodes_" + str(FLAGS.num_episodes)
+
+    # append logs to base path
+    log_path = os.path.join(FLAGS.summary_dir, 'random_search_logs', FLAGS.reward_formulation, exp_name)
+
+    # get the current working directory and append the exp name
+    traject_dir = os.path.join(FLAGS.summary_dir, FLAGS.traject_dir, FLAGS.reward_formulation, exp_name)
+
+    # check if log_path exists else create it
+    if not os.path.exists(log_path):
+        os.makedirs(log_path)
+
+    if FLAGS.use_envlogger:
+        if not os.path.exists(traject_dir):
+            os.makedirs(traject_dir)
+    env = wrap_in_envlogger(env, traject_dir)
+
+    for i in range(FLAGS.num_episodes):
+        suggestions = random_designer.suggest(count=FLAGS.num_steps)
+        for suggestion in suggestions:
+            
+            num_cores = str(suggestion.parameters['num_cores'])
+            freq = str(suggestion.parameters['freq'])
+            mem_type_dict = {'DRAM':0, 'SRAM':1, 'Hybrid':2}
+            mem_type = str(mem_type_dict[str(suggestion.parameters['mem_type'])])
+            mem_size = str(suggestion.parameters['mem_size'])
+            
+            action = {"num_cores":float(num_cores), "freq": float(freq), "mem_type":float(mem_type), "mem_size": float(mem_size)}
+            
+            print("Suggested Parameters for num_cores, freq, mem_type, mem_size are :", num_cores, freq, mem_type, mem_size)
+            obs, reward, done, info = (env.step(action))
+            fitness_hist['reward'] = reward
+            fitness_hist['action'] = action
+            fitness_hist['obs'] = obs
+            log_fitness_to_csv(log_path, fitness_hist)
+            print("Observation: ",obs)
+            final_measurement = vz.Measurement({'Reward': reward})
+            suggestion = suggestion.to_trial()
+            suggestion.complete(final_measurement)
+           
+
+
+   
+
+if __name__ == '__main__':
+   app.run(main)
\ No newline at end of file
diff --git a/sims/customenv/train_randomwalker.py b/sims/customenv/train_randomwalker.py
new file mode 100644
index 00000000..0fa13edf
--- /dev/null
+++ b/sims/customenv/train_randomwalker.py
@@ -0,0 +1,31 @@
+
+from absl import flags
+from absl import app
+import sys
+import os.path
+
+os.sys.path.insert(0, os.path.abspath('../../'))
+
+
+from arch_gym.envs.custom_env import CustomEnv
+
+flags.DEFINE_integer('num_steps', 4, 'Number of training steps')
+flags.FLAGS(sys.argv)
+steps = flags.FLAGS.num_steps
+print(steps)
+env = CustomEnv()
+observation = env.reset()
+
+
+def main(_):
+    i = 1
+    while not i > steps:
+        env.render()
+        action = env.action_space.sample()
+        print("The taken action is {}".format(action))
+        obs, reward, done, info = (env.step(action))
+        print("The reward is {}".format(reward))
+        i += 1
+
+if __name__ == '__main__':
+    app.run(main)
\ No newline at end of file