GenerativeAIWithLLM

Certificate

Week1

Week1 Lab

Transformer Architecture

Pre-training and scaling laws

Scaling laws for neural language models

Model architectures and pre-training objectives

Scaling laws and compute-optimal models

Hand written notes

Week2

Week2 Lab

Multi-task, instruction fine-tuning

Model Evaluation Metrics

Parameter- efficient fine tuning (PEFT)

LoRA

Prompt tuning with soft prompts

The Power of Scale for Parameter-Efficient Prompt Tuning

Week3

Week3 Lab

Reinforcement Learning from Human-Feedback (RLHF)

Proximal Policy Optimization (PPO)

Scaling human feedback

Constitutional AI: Harmlessness from AI Feedback

Advanced Prompting Techniques

LLM powered application architectures

Credits:

Deep Learning.ai

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
Week1		Week1
Week2		Week2
Week3		Week3
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

GenerativeAIWithLLM

Certificate

Week1

Week1 Lab

Transformer Architecture

Pre-training and scaling laws

Model architectures and pre-training objectives

Scaling laws and compute-optimal models

Hand written notes

Week2

Week2 Lab

Multi-task, instruction fine-tuning

Model Evaluation Metrics

Parameter- efficient fine tuning (PEFT)

LoRA

Prompt tuning with soft prompts

Week3

Week3 Lab

Reinforcement Learning from Human-Feedback (RLHF)

Proximal Policy Optimization (PPO)

Scaling human feedback

Advanced Prompting Techniques

LLM powered application architectures

About

Releases

Packages

Languages

Prajwalgn-07/GenerativeAIWithLLM

Folders and files

Latest commit

History

Repository files navigation

Week1

Transformer Architecture

Pre-training and scaling laws

Model architectures and pre-training objectives

Scaling laws and compute-optimal models

Week2

Multi-task, instruction fine-tuning

Model Evaluation Metrics

Parameter- efficient fine tuning (PEFT)

LoRA

Prompt tuning with soft prompts

Week3

Reinforcement Learning from Human-Feedback (RLHF)

Proximal Policy Optimization (PPO)

Scaling human feedback

Advanced Prompting Techniques

LLM powered application architectures

About

Resources

Stars

Watchers

Forks

Languages