Itsycal 은 macOS 우측 상단 메뉴바에 작은 캘린더 프로그램이다.

Itsycal for Mac

공식 홈페이지에 가서 다운로드 받는다.

다운로드된 Itsycal

 

macOS 에서도 윈도우처럼 다양한 인스톨러가 있다.

보통은 Applications 폴더에 설치되도록 스크립트를 작성해주지만,

Itsycal은 직접 Application 폴더에 넣어줘야한다.

Itsycal을 application 폴더로 옮기세요

 

그렇다면, 다운받은 Itsycal를 클릭하고 드래그 하여 응용 프로그램 폴더에 넣는다.

다운로드에 있는 Ityscal을 옮길 때면,

꼭 어릴적 컴퓨터실에서 게임하려고 exe만 복사하는 느낌이 든다.

 

파인더에서 응용 프로그램을 누르면 Itycal이 있는 걸 확인가능하다.

잘 들어와있다.

실행해보면 우측 상단에 캘린더가 생긴걸 볼 수 있다.

전체 달력, 일정을 꽤나 Fancy하게 만들어준다.

우측 상단 캘린더

데이터 집합(data set)은 데이터 객체(data object)의 모임이다.

데이터 객체는 다수의 속성(attribute)에 의해서 기술된다.

- 속성이란, 객체에 따라 또는 시간에 따라 변하는 객체의 특성

속성의 타입 (Types of Attributes)

속성을 표현하기 위해 사용된 값은 속성 자신의 특성이 아닌 특성을 가질 수 있고, 그 역도 성립한다.

숫자(Numeric)와 범주(Categorical) 로 나눌 수 있다.

숫자형 속성 : 실수, 정수 / 범주형 속성 - 가능성있는 유한 집합의 값

 

Categorical / 정성적(Qualitative) 속성

- 명목형(Nominal) : 순서가 없이 구별 가능한 값을 가짐; ID numbers, eye color, zip codes

- 서열형(Ordinal) : 순서를 정함; height in {tall, medium, short}

Numeric / 정량적(Quantitative) 속성

- 구간(Interval) : 일정한 간격, 정수; calendar dates, temperature in Celsius or Fahrenheit 

- 비율(Ratio) : 실수 ; length, mass, counts

속성이 상이한 타입들

유일성(Distinctness) : = , !=

순서(Order) : <. >

덧셈(Addition) : +, -

곱셈(Multiplication) : *, / 

 

- Nominal : distinctness

- Ordinal : distinctness & order

- Interval : distinctness, order, & addition

- Ratio : all 4 properties

값의 개수에 의한 속성 기술

속성들을 구분하는 독립적인 방법은 속성이 가질 수 있는 값의 개수를 이용하는 것이다.

이산(discrete) : 유한개의 값 또는 셀 수 있는 무한 집합의 값을 갖는다.

- zip codes, counts

- 대개 정수를 표현

- 이진(binary) 속성은 특별한 케이스

연속(continuous) : 실수 값을 가지며 온도, 높이, 무게와 같은 속성을 예로 들 수 있다.

데이터 집합의 타입

타입은 다양하며 계속 다양해지고 있다. 

Record Data

- Data Matrix : attribute 는 차원을 의미, m x n

- Document Data : bag of word 처럼, 얼마나 빈도수가 있는지 측정, 요즘은 임베딩을 주로 함

- Transaction Data : association rule

Graph

- World Wide Web

- Molecular Structures

Ordered

- Sequence Data

- Time series Data

- Spatial Data

'CSE > Data Mining' 카테고리의 다른 글

Data Mining - Data (1)  (0) 2025.03.07
Data Mining - Introduction  (0) 2025.03.06

성공적인 데이터 마이닝을 위해서는 데이터에 관련된 문제를 이해해야 한다.

데이터 타입

데이터 객체를 서술하기 위해 사용된 속성(attribute)들이 정량적이든, 정성적이든, 상이한 타입을 가질 수 있다.

- 시계열 데이터, 서로간 관계를 가지는 객체

데이터 타입은 데이터의 분석에 사용하게 될 도구와 기법을 결정한다.

Collection of data objects and their attributes

데이터 품질

종종 완벽하지 못한 데이터는 어느정도 불완전성을 알고리즘으로 감내할 수 있다.

데이터 품질을 개선하고자 이해하려고 노력하면 대개 분석 결과의 품질이 개선 된다.

- 잡음, 이상치의 존재, 누락되거나 비-일관적이거나 중복된 데이터, 편중 등

데이터 전처리

원시 데이터는 분석에 적합한 형태로 처리되어야한다.

품질 개선과 특정 데이터 마이닝 기법이나 도구에 맞게끔 데이터를 수정하는게 목표이다.

- 예를 들어, 연속성 속성인 길이의 경우 특정 기법에 적용하기 위해 단기, 중간, 장기와 같은 이산 범위로 변환할 필요가 있다.

관계 측면에서의 데이터 분석

데이터 객체들 간 관계를 발견하고 난 후, 데이터 자체보다는 관계에 남아 있는 분석을 수행한다.

- 객체 유사도나 거리를 계산하고 난 후, 이러한 유사도나 거리를 기반으로 분류, 군집화 등을 수행할 수 있다.

 

'CSE > Data Mining' 카테고리의 다른 글

Data Mining - Data (2)  (0) 2025.03.08
Data Mining - Introduction  (0) 2025.03.06

+ Recent posts