Étude
article thumbnail
Qu'est-ce qu'un KPI ? & Mesurer pour performer
Etc 2023. 12. 1. 18:39

"Indicateur clé de performance" ou KPI est un outil essentiel pour évaluer l'efficacité d'une stratégie marketing ou commerciale. Les KPI sont définis en fonction des objectifs spécifiques de l'entreprise et peuvent comprendre des mesures telles que le taux de conversion, le retour sur investissement, le coût par lead, le taux de rétention des clients, et plus encore. Ces indicateurs aident les ..

article thumbnail
Model evaluation(1) (A/B 테스트와 MAB, 유의확률의 함정, 분석가의 주관적 판단과 스토리텔링)
Etc/TAVE 2023. 5. 1. 19:20

A/B test and MAB A/B Test A/B 테스트는 두 가지 버전의 웹 페이지 또는 앱을 비교하여 어느 버전이 더 효과적인지 판별하는 실험적인 방법이다. 보통 사용자 경험, 구매율, 클릭율 등의 지표를 비교하여 어떤 버전이 더 성과가 좋은지를 알아낸다. A/B 테스트를 통해 사전에 검증을 거치고 최적의 디자인이나 기능을 적용하여 사용자들에게 더 나은 경험을 제공할 수 있다. 예를 들면, 다음과 같은 두 가지 시안의 배너를 각 접속자에게 무작위로 노출하여 더 높은 클릭률(Click-Thorugh-Rate, CTR)을 보이는 배너를 채택한다. 이 차이가 통계적으로 유의미한 차인인지는 Z-test나 T-test를 통해 검정한다. A/B Test의 주제와 절차 웹사이트 내비게이션 배치와 문구 등 UI..

article thumbnail
Time Series analysis
Etc/TAVE 2023. 4. 8. 16:36

시계열 자료: 시간의 흐름에 따라 관측된 자료 관측치의 통계량 변화를 시간의 흐름에 따라 순차적(Sequentially)으로 데이터화하고 현황을 모니터링하거나 미래의 수치를 예측하는분석 방법. ex) 주가 전망, 수요 예측, 연도별 GDP, 일일 미세먼지량 시계열 분석의 목적 - 탐색 목적 : 외부 인자와 관련된 계절적인 패턴, 추세 등을 설명하고 인과관계를 규명 - 예측 목적 : 과거 데이터 때턴을 통해 미래의 값을 예측 시계열 모형 a_t가 백색잡음이라고 할 때, X_t를 다음과 같이 정의하면 X_t는 시계열로 정의된다. t가 1에 가까워 질수록 과거 자료를 나타낸다. 이 때, 자료가 충분히 많을 때, a1의 계수 (1/2)^(t-1)은 거의 0을 곱하는 거라고 보면 된다. 따라서 오차(a_t)가 ..

article thumbnail
Lec. 6-2: Softmax classifier 의 cost함수
Etc/TAVE 2023. 3. 26. 01:37

Sigmoid sigmoid function을 통해 0부터 1사이에서 A에 해당하는 값, B에 해당하는 값, C에 해당하는 값이 각각 출력된다. n개의 값을 Softmax function를 적용하면 다음과 같은 형태의 값을 갖게된다. 1. 0~1사이의 값을 갖게 된다. 2. 전체의 sum이 1이 된다. 즉, 전체의 확률에 대해서 알 수 있다. Cross-entropy cost function 예측한 값과 실제 값이 얼마나 차이있는지 확인하기 위해 Cost function을 설계 Cross-entropy 를 통한 실제값과 예측값의 차이를 확인한다. 예측이 맞았을때 Cost function이 0 / 아니면 굉장히 큰값

article thumbnail
Lec. 6-1 - Softmax Regression
Etc/TAVE 2023. 3. 26. 00:33

Logistic Regression 독립 변수의 선형 결합을 이용하여 사건의 발생 가능성을 예측하는 데 사용되는 통계 기법이다. 로지스틱 회귀에서는 함수가 반환하는 값이 0에서 1사이에 오게 하기 위해, 선형회귀의 결과를 sigmoid 함수에 입력해서 반환된 값을 예측값으로 사용한다. Logistic Classfication은 위와 같이 데이터들을 구분하는 hyperplane을 찾아내는 과정. Multinomial Classification(다중 분류) 데이터를 0과 1 둘 중 하나가 아닌, 보다 다양한 범주로 분류하는 것 세 개의 식을 따로 쓰면 복잡하기 때문에 하나로 통합시켜 준다. 이진 분류의 수만큼 늘어난 가중치 행렬(W)과 예측값(Y^)을 확인할 수 있다. 위와 같이 행렬의 곱셈을 통해서 여러 ..

article thumbnail
Lec. 7-2 Learning and test data sets
Etc/TAVE 2023. 3. 25. 22:27

Training and test sets Online learning 데이터 셋이 클 경우 이를 나눠서 조금씩 학습시킬 수 있는데, 이전에 학습된 정보에 새로운 정보를 더해가면서 학습하는 위와 같은 방식을 online learning이라고 한다. Accurary 모델의 성능은 정확도(Acc.)를 가지고 평가할 수 있다.

article thumbnail
Lab. 7-2 Learning and test data sets
Etc/TAVE 2023. 3. 25. 22:26

MNIST Dataset - training시킬 data가 많기 때문에 batch로 잘라서 학습시킴 - batch_size = 한 번에 몇 개씩 학습시킬 것인지 epoch - 1 epoch = 전체 데이터셋을 한번 다 학습시킨 것 - 1 epoch을 batch size로 잘라서 학습시키는 것

article thumbnail
Lec. 7-1 Learning rate, data preprocessing, overfitting
Etc/TAVE 2023. 3. 25. 16:16

lec 07-1: 학습 rate, Overfitting, 그리고 일반화 (Regularization) - YouTube Learning rate 조절하는 방법 data preprocessing overfitting 방지하는 방법 Learning rate Learning rate는 경사하강법에서 보폭의 크기라고 생각하면 된다. Learning rate: Overshooting Learning rate를 너무 크게 설정한다면 보폭이 너무 크기 때문에 최적점을 지나칠 수 있고 정신없이 왔다갔다 하기 때문에 최적의 지점을 찾지 못할 수도 있다. Small learning rate 반대로 너무 맞게 설정한다면 보폭이 너무 짧아 시간이 오래걸리거나 제 시간안에 최적점을 찾지 못하게 된다. 또는 최적점이 아님에도 s..

article thumbnail
article thumbnail
2023 상반기 시험 일정
Etc 2023. 1. 31. 23:27

3월 19일 SQL 개발자 4월 8일 빅데이터분석기사 필기 중간고사 5월 13일 DELF B2 ?????? 5월 24일 정보처리기사 필기 기말고사 6월 24일 빅데이터분석기사 실기 7월 22일 정보처리기사 실기 화이팅~