Skip to content

Commit

Permalink
Merge pull request #8 from mixowo/master
Browse files Browse the repository at this point in the history
Merging progress 1
  • Loading branch information
jcierocki authored May 4, 2020
2 parents 5e880d2 + 6422f49 commit d47e406
Show file tree
Hide file tree
Showing 2 changed files with 19 additions and 39 deletions.
25 changes: 4 additions & 21 deletions docs/report1.Rmd
Original file line number Diff line number Diff line change
Expand Up @@ -4,27 +4,10 @@ author: "Jakub Cierocki"
date: "14 04 2020"
output: pdf_document
---
WPROWADZENIE

```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
```
Rozważania na temat "customer churn", czyli zakończenie współpracy klienta z przedsiębiorstwem było w kręgu zainteresowania naukowców od wielu lat. Firmy, w szczególności banki są zainteresowane takimi klientami i analizowaniem ich zachowania, gdyż pozyskiwania nowych klientów zwykle jest o wiele droższym zabiegiem, niż utrzymanie dotychczasowych. Przykładowo, jeśli Spotify zidentyifkowałby segment osób, które byłyby obciążone ryzykiem churnowania, przedsiębiorstwo mogłoby zasypać ich specjalnymi ofertami, zachęcających ich do dalszego korzystania z ich usług.

## R Markdown
Kolejnym argumentem potwierdzającym znaczenie badania jest ryzyko powielającej się zależności, która powoduje długotrwałą strate klientów, której przedsiębiorstwo mogłoby uniknąć, analizując zachowania oraz cechy klientów w grupie ryzyka.

This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see <http://rmarkdown.rstudio.com>.

When you click the **Knit** button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

```{r cars}
summary(cars)
```

## Including Plots

You can also embed plots, for example:

```{r pressure, echo=FALSE}
plot(pressure)
```

Note that the `echo = FALSE` parameter was added to the code chunk to prevent printing of the R code that generated the plot.
W ninejszym raporcie zbadamy, jakie czynniki wpływają na decyzję klienta w przyadku zmiany banku. Skupimy się na czynnikach ekonomicznych, ale również aspektach psychofizycznych, które będą znacząco wpływać na wynik badanego przez nas zagadnienia.
33 changes: 15 additions & 18 deletions work1.R
Original file line number Diff line number Diff line change
Expand Up @@ -5,14 +5,14 @@ library(stringr)
library(ggplot2)
library(GGally)
library(scorecard)
library(funModeling)
# library(caret)
# library(ranger)
library(caret)
library(ranger)


rm(list = ls())

source("funs.R")

data_raw <- read_csv("data/dataset1.csv")
data1 <- data_raw %>%
mutate(Geography = factor(Geography), Gender = factor(Gender),
Expand Down Expand Up @@ -41,17 +41,14 @@ iv(data1, "Exited", "NotSpain", positive = "No")

opt_bin <- woebin(data1, "Exited", "Age", positive = "No")#[[1]]$breaks

data2 <- data1 %>% mutate(Age_bin2 = discretize_rgr(Age, Exited, max_n_bins = 6))
data2 <- data2 %>% woebin_ply(opt_bin, to = "bin") %>% mutate(Age_bin = as.factor(Age_bin))

# opt_bin2 <- discretize_get_bins(data1, 4, input = "Age")

head(data2$Age_bin2)
plot(data2$Age_bin)
plot(data2$Age_bin2)

iv(data2, y = "Exited", positive = "No")

#### łączenie zmiennych w celu uzyskania zbliżonej liczby kategorii (nieobciążone oceny ważności parametrów i IV)

# dodałem funkcję w pliku funs.R
opt_bin2 <- woebin(data1,"Exited","Balance",positive = "No")
opt_bin3 <- woebin(data1,"Exited","CreditScore",positive = "No")
opt_bin4 <- woebin(data1,"Exited","NumOfProducts",positive = "No")
opt_bin5 <- woebin(data1,"Exited","EstimatedSalary",positive = "No")
opt_bin6 <- woebin(data1,"Exited","Tenure",positive = "No")
data2 <- data1 %>% woebin_ply(opt_bin, to = "bin") %>% mutate(Age_bin =as.factor(Age_bin))
data2 <- data2 %>% woebin_ply(opt_bin2, to = "bin") %>% mutate(Balance_bin = as.factor(Balance_bin))
data2 <- data2 %>% woebin_ply(opt_bin3, to = "bin") %>% mutate(CreditScore_bin = as.factor(CreditScore_bin))
data2 <- data2 %>% woebin_ply(opt_bin4, to = "bin") %>% mutate(NumOfProducts_bin = as.factor(NumOfProducts_bin))
data2 <- data2 %>% woebin_ply(opt_bin5, to = "bin") %>% mutate(EstimatedSalary_bin = as.factor(EstimatedSalary_bin))
data2 <- data2 %>% woebin_ply(opt_bin6, to = "bin") %>% mutate(Tenure_bin =as.factor(Tenure_bin))

0 comments on commit d47e406

Please sign in to comment.