let us not love with words or tongue but actions and truth.
728x90

IT 159

1005 Spatial Access Methods 3 - The Linear Quadtree

The quadtree : 공간을 반복적으로 4등분해 나가는 기법 Quadrant’s name : NW, NE, SW and SE 각각의 Quadrant는 하나의 disk page와 mapping이 됨 quadtree는 depth가 다름 ** image indexing 할 때 주로 많이 사용 ** Quadtree의 단점: 데이터들이 한쪽영역에 몰려있을 경우 트리의 balance가 깨짐 The quadtree에서의 point query ** oid는 상세한 정보까지 다 가지고 있는 indexing 방법임 1. 처음에 point의 위치를 보고 a, b, c, d 중 어느 가지로 내려갈지를 정함 2. 그 다음 x, y, z, t 중에 어느 가지로 내려갈지 정함 3. 그 다음 5, 14, 6 중 어느것이 p를 ..

확률 분포 추정

확률밀도 함수가 주어지지 않았을 때는 어떻게 풀 것인가 → Gaussian확률 밀도함수가 주어졌을 때는 bayesian 결정이론을 사용했음 → 확률 분포(확률밀도 함수) 를 추정해야함 베이지안 분류기에서 우리가 알아야 되는것은 1. 사전확률 ( sample / N(표본수) ) bias가 있을것이라고 생각이 된다면 사전확률은 무시해도 됨 (주사위 면적이 다를 것이라고 생각된다면) 2. 확률 밀도함수 (클래스 별) a. parameter를 알면 추정할 수 있음 = parameter density function (likelihood: 최대우도법) b. non-parametric density function (비모수 추정법) → Parzen windown density / knn density estimat..

IT/패턴인식 2022.10.02

Spatial Access Methods 1 - Space-Driven Structure

Spatial Access Methods 1 : spatial data를 위한 indexing 기법 Spatial data에 indexing 이 필요한 이유 data가 방대하고 무거워 indexing이 필요함 컴퓨팅 시간 및 disk I/O를 최소화 할 수 있음 indexing 효과 데이터가 커지더라도 n개의 데이터에 대해 log(N)의 시간을 기대할 수 있음 각 타입에 최적화된 indexing이 따로 있음 points, lines, and polygons타입별 사용 indexing이 있음 (oid) 모든 것을 다 커버하는 general 한 indexing이 있음 (mbb) eg) minimum bounding box (mbb), minimum bounding rectangle(mbr) entry를 나타..

정규분포에서 베이시안 분류기

정규분포(가우시안분포) 정규분포(가우시안분포)는 parametric density function임 → 평균과 분산으로 표현이 가능함 ** 가우시안 x 가우시안 = 가우시안 ( 계산에 유리함) d-dimension에서 ∑ 는 공분산을 뜻함 σ의 제곱 = ∑ 이 전장에서 배웠던 우도함수 참고하기.. 위의 식에서 양변에 로그를 취함 gi(x)는 변수 x에 대한 2차 식 → Why? X(transpose) * X 식이므로 역행렬 공식 참고** https://blog.naver.com/suhan80/222697306428 결정경계(decision boundary) gi(x)=gj(x)인 점 즉, gij(x)=0인 분별함수 특이상황 공분산 행렬이 같은 상황 (문제를 간단하게 하기위해서도 씀) 따라서 2차항이 없어..

IT/패턴인식 2022.09.29

Spatial DB system 0921

An Example World Database - 기본 SQL many to one, one to one의 관계는 별도의 table로 저장하지 않음 (foreign key만 가지고 있으면 되므로) >> City(Name, Country, Pop,Capital, Shape) >> River(Name, Origin, Length, Shape) Origin = country name ** 밑줄은 foreign key Three Components of SQL 1. Data Definition Language (DDL) : 정의표 Creation and modification of relational schema Schema objects include relations, indexes, etc. 2. Data..

Bellman equation 정리

1. bellman equation Bellman Equation - V에 대하여 >> 그 state에서 어떤 action을 취했을 때의 reward와 그 다음 state에서의 가치의 합이다. [Stochastic environments] stochastic한 환경에서 다음단계로 이동할 때 위의식을 일반화하면 여기에서 우변을 bellman backup이라고 함 [Stochastic environments] stochastic한 policy로 다음단계로 이동할 때 **pi 는 policy라는 뜻임 더 간단히 아래와 같이 표현할 수 있음 Bellman Equation - Q에 대하여 [Stochastic environments] stochastic한 환경에서 다음단계로 이동할 때 [Stochastic env..

IT/강화학습 2022.09.27

cmap을 활용한 산점도 그리기(Label Encoder활용)

cmap을 활용한 산점도 그리기를 연습해보려고 합니다. cmap을 활용하게 되면 일일이 색상을 정해주지 않아도, 다양한 값에대해 colorbar의 값과 매칭해주어 색상을 표현할 수 있습니다. 아래와 같은 그림처럼 표현이 가능한 것입니다. 현재 아래와 같은 데이터가 있다고 가정해볼게요. 수학성적(평균) 영어성적(평균) 학급 85.7 93.2 A 82.1 77.8 B 92.1 85.2 C 95.2 88.3 D 학급에 해당하는 값이 색깔로 표현되게 만들 예정입니다. 하지만, 아래와 같이 범주형 컬럼인 class를 그대로 넣어주면 1 plt.scatter(x=df['math'], y=df['eng'], c=df['class'], cmap='viridis') cs c of shape (50232,) not acc..

IT/파이썬 2022.09.22
728x90