let us not love with words or tongue but actions and truth.

IT/SNS분석 13

[SNS analysis]Network measures2

SNS Network measures를 하는 이유 1. Who are the central figures (influential individuals) in the network? – 중심도 파악을 위해(Centrality) 2. What interaction patterns are common in friends? (interaction pattern을 찾기위해- level of interaction) – Reciprocity(상호성) and Transitivity – Balance and Status 3. Who are the like-minded users and how can we find these similar individuals? – Similarity(유사도 측정을 위해) 이번에는 2번,..

IT/SNS분석 2022.04.12

Network measures 1

SNS Network measures를 하는 이유 1. Who are the central figures (influential individuals) in the network? – 중심도 파악을 위해(Centrality) 2. What interaction patterns are common in friends? (interaction pattern을 찾기위해- level of interaction) – Reciprocity(상호성) and Transitivity – Balance and Status 3. Who are the like-minded users and how can we find these similar individuals? – Similarity(유사도 측정을 위해) Centrali..

IT/SNS분석 2022.03.29

Graph algorithms

The traversal technique guarantees that 1. All users are visited; and 2. No user is visited more than once. graph algorithms의 2가지 main techniques 1. Depth-First Search (stack 기법을 사용함 - FILO) 2. Breadth-First Search (BFS) (queue를 사용함 -FIFO) DFS의 코드 간략화(push) 단, 밑줄 친 빨간 부분은 if node에 방문마크가 안되어있는 것만 push해서 S 스택에 넣으라는 명령어로 바꿔주어야지 속도가 빨라짐 BFS와 DFS의 차이점은 BFS는 neighborhood의 노드를 먼저 방문한 다음에, 그 다음에 다른 노드로 ..

IT/SNS분석 2022.03.22

[SNS analysis] 용어정리 및 그래프 종류

다양한 그래프의 종류 1. directed/undirected graph 2. null / empty graph null graph: 노드와 edge모두 0인 그래프 empty graph: 노드만 있고 edge가 없는 그래프 empty graph ⊃ null graph 3. simple graph/multigraph 4. webgraph directed multigraph로 보통 webgraph를 표현 5. signed graph foes or friends 관계를 표현할 수 있음 ( or social status) 그래프 관련 용어정리 incident하다라는 표현은 두 edge가 하나의 endpoint를 공유하고 있을 때 또한 방향성이 있는 edge라면 그 방향성도 같을 때, incident 하다고 할..

IT/SNS분석 2022.03.15

[SNS analysis] 그래프 관련 기본 개념

소셜 미디어 데이터의 5가지 특징 1. participation: 사용자의 높은 참여도 2. openness 3. conversation 4. community 5. connectedness 소셜미디어 mining challenges 1. big data paradox: 데이터는 많지만, 양질의 데이터라고는 할 수 없음 2. obtaining sufficient samples: sample 규모를 적절히 정하기 어려움 3. noise removal fallacy: 전처리를 얼마나 할 것인가에 대한 문제점 4. evaluation dilemma: ground truth의 부재로, 분석 결과의 정확도를 확인하기 어려움 graph 종류 1. directed graph = arc 2. undirected gra..

IT/SNS분석 2022.03.08