Add backend based airls from cp to dp

wso2 · Sep 25, 2024 · dfd8b43 · dfd8b43
1 parent 3a1e3fe
commit dfd8b43
Show file tree

Hide file tree

Showing 10 changed files with 285 additions and 37 deletions.
diff --git a/apim-apk-agent/go.mod b/apim-apk-agent/go.mod
@@ -10,7 +10,7 @@ require (
 	github.com/pelletier/go-toml v1.9.5
 	github.com/sirupsen/logrus v1.9.3
 	github.com/stretchr/testify v1.9.0
-	github.com/wso2/apk/common-go-libs v0.0.0-20240920041902-85449a1c0150
+	github.com/wso2/apk/common-go-libs v0.0.0-20240923143402-ff7fdb0366f9
 	google.golang.org/grpc v1.62.0
 	gopkg.in/natefinch/lumberjack.v2 v2.2.1
 	gopkg.in/yaml.v2 v2.4.0

diff --git a/apim-apk-agent/go.sum b/apim-apk-agent/go.sum
@@ -189,8 +189,8 @@ github.com/vektah/gqlparser v1.3.1 h1:8b0IcD3qZKWJQHSzynbDlrtP3IxVydZ2DZepCGofqf
 github.com/vektah/gqlparser v1.3.1/go.mod h1:bkVf0FX+Stjg/MHnm8mEyubuaArhNEqfQhF+OTiAL74=
 github.com/wso2/apk/adapter v0.0.0-20240408123538-86a74d977eee h1:g0ivVkzybfcEkB0vBGTAXTUuMZpsF3zOTVtAgmW851s=
 github.com/wso2/apk/adapter v0.0.0-20240408123538-86a74d977eee/go.mod h1:xYS5auF/YxnyRykw7NBSn/YR2FHD4hTeyav4Nhec8d0=
-github.com/wso2/apk/common-go-libs v0.0.0-20240920041902-85449a1c0150 h1:X3OezAh2UOxmQIRxsAua87nNqmoIGXx1yfQIvc4a+G4=
-github.com/wso2/apk/common-go-libs v0.0.0-20240920041902-85449a1c0150/go.mod h1:SbZVA1jeiVG9dqk9fGcY/bB0JgEaQgtXqFAlxAfN0Lk=
+github.com/wso2/apk/common-go-libs v0.0.0-20240923143402-ff7fdb0366f9 h1:MwQqG+/ODDIfLfc3xNMYk6jM+hB2ttjwZnaDBeiMOJI=
+github.com/wso2/apk/common-go-libs v0.0.0-20240923143402-ff7fdb0366f9/go.mod h1:SbZVA1jeiVG9dqk9fGcY/bB0JgEaQgtXqFAlxAfN0Lk=
 github.com/yuin/goldmark v1.1.27/go.mod h1:3hX8gzYuyVAZsxl0MRgGTJEmQBFcNTphYh9decYSb74=
 github.com/yuin/goldmark v1.2.1/go.mod h1:3hX8gzYuyVAZsxl0MRgGTJEmQBFcNTphYh9decYSb74=
 github.com/yuin/goldmark v1.4.13/go.mod h1:6yULJ656Px+3vBD8DxQVa3kxgyrAnzto9xy5taEt/CY=

diff --git a/apim-apk-agent/internal/k8sClient/k8s_client.go b/apim-apk-agent/internal/k8sClient/k8s_client.go
@@ -429,6 +429,66 @@ func DeploySubscriptionRateLimitPolicyCR(policy eventhubTypes.SubscriptionPolicy
 
 }
 
+// DeployAIRateLimitPolicyCR applies the given AIRateLimitPolicies struct to the Kubernetes cluster.
+func DeployAIRateLimitPolicyCR(policy eventhubTypes.SubscriptionPolicy, k8sClient client.Client) {
+	conf, _ := config.ReadConfigs()
+	tokenCount := &dpv1alpha3.TokenCount{}
+	requestCount := &dpv1alpha3.RequestCount{}
+	if policy.DefaultLimit.AiApiQuota.PromptTokenCount != nil &&
+		policy.DefaultLimit.AiApiQuota.CompletionTokenCount != nil &&
+		policy.DefaultLimit.AiApiQuota.TotalTokenCount != nil {
+		tokenCount = &dpv1alpha3.TokenCount{
+			Unit: policy.DefaultLimit.AiApiQuota.TimeUnit,
+			RequestTokenCount: uint32(*policy.DefaultLimit.AiApiQuota.PromptTokenCount),
+			ResponseTokenCount: uint32(*policy.DefaultLimit.AiApiQuota.CompletionTokenCount),
+			TotalTokenCount: uint32(*policy.DefaultLimit.AiApiQuota.TotalTokenCount),
+		}
+	} else {
+		tokenCount = nil
+	}
+	if policy.DefaultLimit.AiApiQuota.RequestCount != nil {
+		requestCount = &dpv1alpha3.RequestCount{
+			RequestsPerUnit: uint32(*policy.DefaultLimit.AiApiQuota.RequestCount),
+			Unit: policy.DefaultLimit.AiApiQuota.TimeUnit,
+		}
+	} else {
+		requestCount = nil
+	}
+
+	crRateLimitPolicies := dpv1alpha3.AIRateLimitPolicy{
+		ObjectMeta: metav1.ObjectMeta{Name: policy.Name,
+			Namespace: conf.DataPlane.Namespace,
+		},
+		Spec: dpv1alpha3.AIRateLimitPolicySpec{
+			Override: &dpv1alpha3.AIRateLimit{
+				Organization: policy.TenantDomain,
+				TokenCount: tokenCount,
+				RequestCount: requestCount,
+			},
+			TargetRef: gwapiv1b1.PolicyTargetReference{Group: constants.GatewayGroup, Kind: "Subscription", Name: "default"},
+		},
+	}
+	crRateLimitPolicyFetched := &dpv1alpha3.AIRateLimitPolicy{}
+	if err := k8sClient.Get(context.Background(), client.ObjectKey{Namespace: crRateLimitPolicies.ObjectMeta.Namespace, Name: crRateLimitPolicies.Name}, crRateLimitPolicyFetched); err != nil {
+		if !k8error.IsNotFound(err) {
+			loggers.LoggerK8sClient.Error("Unable to get AiratelimitPolicy CR: " + err.Error())
+		}
+		if err := k8sClient.Create(context.Background(), &crRateLimitPolicies); err != nil {
+			loggers.LoggerK8sClient.Error("Unable to create AIRateLimitPolicies CR: " + err.Error())
+		} else {
+			loggers.LoggerK8sClient.Info("AIRateLimitPolicies CR created: " + crRateLimitPolicies.Name)
+		}
+	} else {
+		crRateLimitPolicyFetched.Spec = crRateLimitPolicies.Spec
+		crRateLimitPolicyFetched.ObjectMeta.Labels = crRateLimitPolicies.ObjectMeta.Labels
+		if err := k8sClient.Update(context.Background(), crRateLimitPolicyFetched); err != nil {
+			loggers.LoggerK8sClient.Error("Unable to update AiRatelimitPolicy CR: " + err.Error())
+		} else {
+			loggers.LoggerK8sClient.Info("AiRatelimitPolicy CR updated: " + crRateLimitPolicyFetched.Name)
+		}
+	}
+}
+
 // DeployBackendCR applies the given Backends struct to the Kubernetes cluster.
 func DeployBackendCR(backends *dpv1alpha2.Backend, k8sClient client.Client) {
 	crBackends := &dpv1alpha2.Backend{}

diff --git a/apim-apk-agent/internal/synchronizer/ratelimit_policy_fetcher.go b/apim-apk-agent/internal/synchronizer/ratelimit_policy_fetcher.go
@@ -163,7 +163,7 @@ func FetchRateLimitPoliciesOnEvent(ratelimitName string, organization string, c
 
 // FetchSubscriptionRateLimitPoliciesOnEvent fetches the policies from the control plane on the start up and notification event updates
 func FetchSubscriptionRateLimitPoliciesOnEvent(ratelimitName string, organization string, c client.Client) {
-	logger.LoggerSynchronizer.Info("Fetching RateLimit Policies from Control Plane.")
+	logger.LoggerSynchronizer.Info("Fetching Subscription RateLimit Policies from Control Plane.")
 
 	// Read configurations and derive the eventHub details
 	conf, errReadConfig := config.ReadConfigs()
@@ -189,7 +189,7 @@ func FetchSubscriptionRateLimitPoliciesOnEvent(ratelimitName string, organizatio
 		}
 	}
 
-	logger.LoggerSynchronizer.Infof("Fetching RateLimit Policies from the URL %v: ", ehURL)
+	logger.LoggerSynchronizer.Infof("Fetching Subscription RateLimit Policies from the URL %v: ", ehURL)
 
 	ehUname := ehConfigs.Username
 	ehPass := ehConfigs.Password
@@ -201,19 +201,9 @@ func FetchSubscriptionRateLimitPoliciesOnEvent(ratelimitName string, organizatio
 	// Create a HTTP request
 	req, err := http.NewRequest("GET", ehURL, nil)
 	if err != nil {
-		logger.LoggerSynchronizer.Errorf("Error while creating http request for RateLimit Policies Endpoint : %v", err)
+		logger.LoggerSynchronizer.Errorf("Error while creating http request for Subscription RateLimit Policies Endpoint : %v", err)
 	}
 
-	var queryParamMap map[string]string
-
-	if queryParamMap != nil && len(queryParamMap) > 0 {
-		q := req.URL.Query()
-		// Making necessary query parameters for the request
-		for queryParamKey, queryParamValue := range queryParamMap {
-			q.Add(queryParamKey, queryParamValue)
-		}
-		req.URL.RawQuery = q.Encode()
-	}
 	// Setting authorization header
 	req.Header.Set(sync.Authorization, basicAuth)
 
@@ -231,45 +221,88 @@ func FetchSubscriptionRateLimitPoliciesOnEvent(ratelimitName string, organizatio
 	var errorMsg string
 	if err != nil {
 		errorMsg = "Error occurred while calling the REST API: " + policiesEndpoint
-		go retryRLPFetchData(conf, errorMsg, err, c)
+		go retrySubscriptionRLPFetchData(conf, errorMsg, err, c)
 		return
 	}
 	responseBytes, err := ioutil.ReadAll(resp.Body)
+	var jsonResponse interface{}
+	err = json.Unmarshal(responseBytes, &jsonResponse)
+	if err != nil {
+		logger.LoggerSynchronizer.Infof("Error unmarshalling JSON:", err)
+		return
+	}
+
+	// Print the JSON response in a pretty format
+	jsonOutput, err := json.MarshalIndent(jsonResponse, "", "  ")
+	if err != nil {
+		logger.LoggerSynchronizer.Infof("Error formatting JSON:", err)
+		return
+	}
+	logger.LoggerSynchronizer.Infof("Json string: %s",string(jsonOutput))
 	logger.LoggerSynchronizer.Debugf("Response String received for Policies: %v", string(responseBytes))
 
 	if err != nil {
 		errorMsg = "Error occurred while reading the response received for: " + policiesEndpoint
-		go retryRLPFetchData(conf, errorMsg, err, c)
+		go retrySubscriptionRLPFetchData(conf, errorMsg, err, c)
 		return
 	}
 
 	if resp.StatusCode == http.StatusOK {
 		var rateLimitPolicyList eventhubTypes.SubscriptionPolicyList
 		err := json.Unmarshal(responseBytes, &rateLimitPolicyList)
 		if err != nil {
-			logger.LoggerSynchronizer.Errorf("Error occurred while unmarshelling RateLimit Policies event data %v", err)
+			logger.LoggerSynchronizer.Errorf("Error occurred while unmarshelling Subscription RateLimit Policies event data %v", err)
 			return
 		}
 		logger.LoggerSynchronizer.Debugf("Policies received: %v", rateLimitPolicyList.List)
 		var rateLimitPolicies []eventhubTypes.SubscriptionPolicy = rateLimitPolicyList.List
 		for _, policy := range rateLimitPolicies {
-			if policy.DefaultLimit.RequestCount.TimeUnit == "min" {
-				policy.DefaultLimit.RequestCount.TimeUnit = "Minute"
-			} else if policy.DefaultLimit.RequestCount.TimeUnit == "hours" {
-				policy.DefaultLimit.RequestCount.TimeUnit = "Hour"
-			} else if policy.DefaultLimit.RequestCount.TimeUnit == "days" {
-				policy.DefaultLimit.RequestCount.TimeUnit = "Day"
+			if policy.QuotaType == "aiApiQuota" {
+				if policy.DefaultLimit.AiApiQuota != nil {
+					switch policy.DefaultLimit.AiApiQuota.TimeUnit {
+					case "min":
+						policy.DefaultLimit.AiApiQuota.TimeUnit = "Minute"
+					case "hours":
+						policy.DefaultLimit.AiApiQuota.TimeUnit = "Hour"
+					case "days":
+						policy.DefaultLimit.AiApiQuota.TimeUnit = "Day"
+					default:
+						logger.LoggerSynchronizer.Errorf("Unsupported timeunit %s", policy.DefaultLimit.AiApiQuota.TimeUnit)
+						continue
+					}
+					if policy.DefaultLimit.AiApiQuota.PromptTokenCount == nil && policy.DefaultLimit.AiApiQuota.TotalTokenCount != nil {
+						policy.DefaultLimit.AiApiQuota.PromptTokenCount = policy.DefaultLimit.AiApiQuota.TotalTokenCount
+					}
+					if policy.DefaultLimit.AiApiQuota.CompletionTokenCount == nil && policy.DefaultLimit.AiApiQuota.TotalTokenCount != nil {
+						policy.DefaultLimit.AiApiQuota.CompletionTokenCount = policy.DefaultLimit.AiApiQuota.TotalTokenCount
+					}
+					if policy.DefaultLimit.AiApiQuota.TotalTokenCount == nil && policy.DefaultLimit.AiApiQuota.PromptTokenCount != nil && policy.DefaultLimit.AiApiQuota.CompletionTokenCount != nil {
+						total := *policy.DefaultLimit.AiApiQuota.PromptTokenCount + *policy.DefaultLimit.AiApiQuota.CompletionTokenCount
+						policy.DefaultLimit.AiApiQuota.TotalTokenCount = &total
+					}
+					managementserver.AddSubscriptionPolicy(policy)
+					k8sclient.DeployAIRateLimitPolicyCR(policy, c)
+				} else {
+					logger.LoggerSynchronizer.Errorf("AIQuota type response recieved but no data found. %+v", policy.DefaultLimit)
+				}
+			} else {
+				if policy.DefaultLimit.RequestCount.TimeUnit == "min" {
+					policy.DefaultLimit.RequestCount.TimeUnit = "Minute"
+				} else if policy.DefaultLimit.RequestCount.TimeUnit == "hours" {
+					policy.DefaultLimit.RequestCount.TimeUnit = "Hour"
+				} else if policy.DefaultLimit.RequestCount.TimeUnit == "days" {
+					policy.DefaultLimit.RequestCount.TimeUnit = "Day"
+				}
+				managementserver.AddSubscriptionPolicy(policy)
+				logger.LoggerSynchronizer.Infof("RateLimit Policy added to internal map: %v", policy)
+				// Update the exisitng rate limit policies with current policy
+				k8sclient.DeploySubscriptionRateLimitPolicyCR(policy, c)
 			}
-			managementserver.AddSubscriptionPolicy(policy)
-			logger.LoggerSynchronizer.Infof("RateLimit Policy added to internal map: %v", policy)
-			// Update the exisitng rate limit policies with current policy
-			k8sclient.DeploySubscriptionRateLimitPolicyCR(policy, c)
-
 		}
 	} else {
 		errorMsg = "Failed to fetch data! " + policiesEndpoint + " responded with " +
 			strconv.Itoa(resp.StatusCode)
-		go retryRLPFetchData(conf, errorMsg, err, c)
+		go retrySubscriptionRLPFetchData(conf, errorMsg, err, c)
 	}
 }
 
@@ -284,3 +317,15 @@ func retryRLPFetchData(conf *config.Config, errorMessage string, err error, c cl
 		return
 	}
 }
+
+func retrySubscriptionRLPFetchData(conf *config.Config, errorMessage string, err error, c client.Client) {
+	logger.LoggerSynchronizer.Debugf("Time Duration for retrying: %v",
+		conf.ControlPlane.RetryInterval*time.Second)
+	time.Sleep(conf.ControlPlane.RetryInterval * time.Second)
+	FetchSubscriptionRateLimitPoliciesOnEvent("", "", c)
+	retryAttempt++
+	if retryAttempt >= retryCount {
+		logger.LoggerSynchronizer.Errorf(errorMessage, err)
+		return
+	}
+}
diff --git a/apim-apk-agent/internal/utils/apis_fetcher.go b/apim-apk-agent/internal/utils/apis_fetcher.go
@@ -113,7 +113,7 @@ func FetchAPIsOnEvent(conf *config.Config, apiUUID *string, k8sClient client.Cli
 							logger.LoggerUtils.Errorf("Error while generating APK-Conf: %v", apkErr)
 							return nil, err
 						}
-						logger.LoggerUtils.Debugf("APK Conf: %v", apkConf)
+						logger.LoggerUtils.Infof("APK Conf: %v", apkConf)
 						certContainer := transformer.CertContainer{
 							ClientCertObj:   artifact.CertMeta,
 							EndpointCertObj: artifact.EndpointCertMeta,

diff --git a/apim-apk-agent/pkg/eventhub/types/types.go b/apim-apk-agent/pkg/eventhub/types/types.go
@@ -196,7 +196,8 @@ type ConditionGroup struct {
 
 // DefaultLimit represents the default limit within the response.
 type DefaultLimit struct {
-	QuotaType    string `json:"quotaType"`
+	AiApiQuota   *AiApiQuota `json:"aiApiQuota"`
+	QuotaType    string     `json:"quotaType"`
 	RequestCount struct {
 		TimeUnit     string `json:"timeUnit"`
 		UnitTime     int    `json:"unitTime"`
@@ -206,6 +207,15 @@ type DefaultLimit struct {
 	EventCount interface{} `json:"eventCount"`
 }
 
+type AiApiQuota struct {
+	CompletionTokenCount *int    `json:"completionTokenCount"`
+	PromptTokenCount     *int    `json:"promptTokenCount"`
+	RequestCount         *int    `json:"requestCount"`
+	TimeUnit             string `json:"timeUnit"`
+	TotalTokenCount      *int    `json:"totalTokenCount"`
+	UnitTime             int    `json:"unitTime"`
+}
+
 // Scope for struct Scope
 type Scope struct {
 	Name            string `json:"name"`

diff --git a/apim-apk-agent/pkg/synchronizer/apis_fetcher.go b/apim-apk-agent/pkg/synchronizer/apis_fetcher.go
@@ -86,9 +86,10 @@ func SendRequestToControlPlane(req *http.Request, apiID *string, gwLabels []stri
 	client *http.Client) bool {
 	// Make the request
 	if apiID != nil {
-		logger.LoggerSync.Debugf("Sending the control plane request for the API: %q", *apiID)
+		logger.LoggerSync.Infof("Sending the control plane request for the API: %q", *apiID)
 	} else {
-		logger.LoggerSync.Debug("Sending the control plane request")
+		logger.LoggerSync.Info("Sending the control plane request")
+		logger.LoggerSync.Infof("Sending url: %s", req.URL.String())
 	}
 	resp, err := client.Do(req)
 

diff --git a/apim-apk-agent/pkg/transformer/api_model.go b/apim-apk-agent/pkg/transformer/api_model.go
@@ -179,6 +179,7 @@ type APIMApi struct {
 	APIThrottlingPolicy string                `yaml:"apiThrottlingPolicy"`
 	APIPolicies         APIMOperationPolicies `yaml:"apiPolicies"`
 	AIConfiguration     APIMAIConfiguration   `yaml:"aiConfiguration"`
+	MaxTps              *MaxTps               `yaml:"maxTps"`
 }
 
 // APIMAIConfiguration holds the configuration details for AI providers
@@ -192,6 +193,46 @@ type APIYaml struct {
 	Data APIMApi `json:"data"`
 }
 
+// MaxTps represents the maximum transactions per second (TPS) settings for both
+// production and sandbox environments. It also includes an optional configuration
+// for token-based throttling.
+//
+// Fields:
+// - Production: Maximum TPS for the production environment.
+// - ProductionTimeUnit: The time unit for the production TPS limit (e.g., seconds, minutes).
+// - Sandbox: Maximum TPS for the sandbox environment.
+// - SandboxTimeUnit: The time unit for the sandbox TPS limit.
+// - TokenBasedThrottlingConfiguration: Configuration for token-based throttling.
+type MaxTps struct {
+	Production                        *int                        `yaml:"production"`
+	ProductionTimeUnit                *string                     `yaml:"productionTimeUnit"`
+	Sandbox                           *int                        `yaml:"sandbox"`
+	SandboxTimeUnit                   *string                     `yaml:"sandboxTimeUnit"`
+	TokenBasedThrottlingConfiguration *TokenBasedThrottlingConfig `yaml:"tokenBasedThrottlingConfiguration"`
+}
+
+// TokenBasedThrottlingConfig defines the token-based throttling limits for
+// both production and sandbox environments. Token-based throttling places
+// a limit on the number of prompt and completion tokens that can be used.
+//
+// Fields:
+// - ProductionMaxPromptTokenCount: Maximum number of prompt tokens for production.
+// - ProductionMaxCompletionTokenCount: Maximum number of completion tokens for production.
+// - ProductionMaxTotalTokenCount: Maximum total token count (prompt + completion) for production.
+// - SandboxMaxPromptTokenCount: Maximum number of prompt tokens for sandbox.
+// - SandboxMaxCompletionTokenCount: Maximum number of completion tokens for sandbox.
+// - SandboxMaxTotalTokenCount: Maximum total token count (prompt + completion) for sandbox.
+// - IsTokenBasedThrottlingEnabled: Flag to enable or disable token-based throttling.
+type TokenBasedThrottlingConfig struct {
+	ProductionMaxPromptTokenCount     *int  `yaml:"productionMaxPromptTokenCount"`
+	ProductionMaxCompletionTokenCount *int  `yaml:"productionMaxCompletionTokenCount"`
+	ProductionMaxTotalTokenCount      *int  `yaml:"productionMaxTotalTokenCount"`
+	SandboxMaxPromptTokenCount        *int  `yaml:"sandboxMaxPromptTokenCount"`
+	SandboxMaxCompletionTokenCount    *int  `yaml:"sandboxMaxCompletionTokenCount"`
+	SandboxMaxTotalTokenCount         *int  `yaml:"sandboxMaxTotalTokenCount"`
+	IsTokenBasedThrottlingEnabled     *bool `yaml:"isTokenBasedThrottlingEnabled"`
+}
+
 // APIArtifact represents the artifact details of an API, including api details, environment configuration,
 // Swagger definition, deployment descriptor, and revision ID extracted from the API Project Zip.
 type APIArtifact struct {

diff --git a/apim-apk-agent/pkg/transformer/apk_model.go b/apim-apk-agent/pkg/transformer/apk_model.go
@@ -44,8 +44,33 @@ type EndpointConfiguration struct {
 	Endpoint       string              `yaml:"endpoint,omitempty"`
 	EndCertificate EndpointCertificate `yaml:"certificate,omitempty"`
 	EndSecurity    EndpointSecurity    `yaml:"endpointSecurity,omitempty"`
+	AIRatelimit    AIRatelimit         `yaml:"aiRatelimit,omitempty"`
 }
 
+// AIRatelimit defines the configuration for AI rate limiting,
+// including whether rate limiting is enabled and the settings 
+// for token and request-based limits.
+type AIRatelimit struct {
+	Enabled bool        `json:"enabled"`
+	Token   TokenAIRL   `json:"token"`
+	Request RequestAIRL `json:"request"`
+}
+
+// TokenAIRL defines the configuration for Token AI rate limit settings.
+type TokenAIRL struct {
+	PromptLimit     int    `json:"promptLimit"`
+	CompletionLimit int    `json:"completionLimit"`
+	TotalLimit      int    `json:"totalLimit"`
+	Unit            string `json:"unit"` // Time unit (Minute, Hour, Day)
+}
+
+// RequestAIRL defines the configuration for Request AI rate limit settings.
+type RequestAIRL struct {
+	RequestLimit int    `json:"requestLimit"`
+	Unit         string `json:"unit"` // Time unit (Minute, Hour, Day)
+}
+
+
 // AdditionalProperty stores the custom properties set by the user for a particular API
 type AdditionalProperty struct {
 	Name  string `yaml:"name"`