본문 바로가기

분류 전체보기156

[관계형 데이터베이스] - ER 다이어그램 (Entity-Relationship Diagram) 1. 개요 ER 다이어그램은 ER 모델 (Entity-Relationship Model)을 기반으로 데이터베이스의 논리적 구조를 표현하기 위한 도구이다. ER 다이어그램에는 ER 모델과 같이 개체 (entity), 속성 (property), 관계 (relationship)가 존재한다. 2. 구성 요소 ER 다이어그램을 구성하는 각 구성 요소들의 기호는 아래의 [그림 1]과 같다. [그림 1] ER 다이어그램의 구성 요소 및 기호 위의 [그림 1]에 나타낸 기호 이외에도 total participation은 double line으로, subtype과 supertype 관계는 supertype에서 subtype으로 향하는 화살표로 나타낸다. 3. ER 다이어그램의 변환 ER 다이어그램은 데이터베이스를 설계하.. 2016. 12. 10.
[관계형 데이터베이스] - 데이터베이스 정규화 (Database Normalization) 1. 데이터베이스 정규화 관계형 데이터베이스의 설계 단계에서 데이터의 중복을 최소화하기 위해 데이터의 구조를 결정하는 작업을 정규화 (normalization)라고 한다. 일반적으로 데이터베이스 정규화 작업에서는 크고 제대로 조직되지 않은 테이블들과 테이블 간의 관계를 작고 잘 조직된 것으로 변경한다. 2. First Normal Form (1NF) 테이블에 존재하는 필드가 모두 scalar value만을 가지며, 필드의 값이 모두 atomic 할 때, 1NF라고 한다. 여기에서 atomic 하다는 것은 테이블에 중복되는 항목이 존재하지 않아야 한다는 것과 같다. 1NF에서 "중복되는 항목이 없다"에 대한 정의는 명확한 것이 아니기 때문에 1NF에 대한 정의 또한 여러 개가 존재할 수 있다. [그림 1].. 2016. 12. 9.
[관계형 데이터베이스] - ER 모델 (Entity-Relationship Model) 1. 개요 ER 모델 (Entity-Relationship model)은 데이터베이스를 디자인 하기 위해 이용되는 모델링 기법으로, 데이터베이스에 대한 요구 사항을 그래픽적으로 표현하는 방법이다. ER 모델에서는 데이터베이스에 저장되는 데이터들을 추상화하여 나타내기 때문에 특정 DBMS 및 하드웨어에 독립적으로 데이터베이스의 구조를 나타낼 수 있다. 2. 개체 (Entity) ER 모델에서 개체는 개별적으로 구별될 수 있는 모든 것을 말한다. 예를 들어, 어떠한 회사의 직원 정보가 저장된 데이터베이스에서는 직원, 부서 등이 개체가 된다. 개체에는 weak entity와 regular entity가 있다. weak entity: 개체가 가진 속성들로는 개체를 고유하게 정의할 수 없는 개체를 말한다. 예를 .. 2016. 12. 7.
[관계형 데이터베이스] - 함수 종속성 (Functional Dependency) 1. 함수 종속성 관계형 데이터베이스의 설계에서 중복된 데이터가 최소화되도록 데이터베이스의 구조를 결정하는 것을 정규화 (normalization)라고 한다. 정규화된 데이터베이스가 그렇지 않은 데이터베이스에 비하여 더욱 효율적으로 데이터에 대한 연산을 수행할 수 있는 것은 매우 당연한 것이다. 이러한 데이터베이스의 정규화 과정에서 함수 종속성이라는 개념은 매우 중요하게 이용된다.함수 종속성은 수학에서의 함수와 같이 두 필드의 집합이 many-to-one 관계로 사상되는 것을 말한다. 즉, 함수와 같이 어떠한 값을 통해 종속 관계에 있는 다른 값을 유일하게 결정할 수 있다는 것이다. 데이터베이스에서의 함수 종속성을 더욱 명확하게 정의하면 다음과 같다. 어떤 테이블 $R$에 존재하는 필드들의 부분집합을 각.. 2016. 11. 13.
[관계형 데이터베이스] - 데이터베이스와 뷰 1. 뷰 (View)의 개념 뷰는 다른 테이블을 기반으로 만들어진 가상의 테이블을 의미한다. 뷰는 실제로 데이터를 저장하고 있지 않으며, 논리적으로만 존재한다. 그러나 데이터베이스 사용자는 실제로 데이터가 존재하는 테이블과 동일하게 뷰를 조작할 수 있다. SQL 기반의 데이터베이스에서는 뷰를 named table, derived table, virtual table이라고 말하기도 한다.아래의 [그림 1]은 department 테이블에서 생성된 두 개의 뷰를 보여준다. 하나의 뷰는 공과대학에 소속된 학과만을 포함하고 있으며, 다른 하나의 뷰는 상경대학에 소속된 학과만을 포함하고 있다. [그림 1] 뷰의 생성 데이터베이스 사용자는 [그림 1]과 같이 하나의 실제 데이터 (테이블)로부터 가상의 논리적 구조 (.. 2016. 11. 13.
[관계형 데이터베이스] - 무결성 (Integrity) 1. 데이터의 무결성 데이터의 무결성은 데이터의 정확성, 일관성, 유효성이 유지되는 것을 말한다. 데이터의 무결성을 유지하는 것은 데이터베이스 관리시스템 (DBMS)의 중요한 기능이며, 주로 데이터에 적용되는 연산에 제한을 두어 데이터의 무결성을 유지한다. 데이터베이스에서 말하는 무결성에는 다음과 같은 4가지 종류가 있다. 1) 개체 무결성 (Entity integrity)모든 테이블이 기본 키 (primary key)로 선택된 필드 (column)를 가져야 한다. 기본 키로 선택된 필드는 고유한 값을 가져야 하며, 빈 값은 허용하지 않는다. 2) 참조 무결성 (Referential integrity)관계형 데이터베이스 모델에서 참조 무결성은 참조 관계에 있는 두 테이블의 데이터가 항상 일관된 값을 갖도.. 2016. 11. 13.
샘플링 (Sampling), 양자화 (Quantization) 및 부호화 (Coding) 1. 샘플링 (Sampling) 컴퓨터는 0과 1 같은 이산적인 자료들로 구성된다. 그러나 실세계에서는 0과 1사이에도 무한히 많은 수가 존재한다. 샘플링은 연속적인 시간에 대해 생성되는 데이터를 이산적인 시간에 대한 데이터로 변환하는 과정이다. [그림 1] 아날로그 데이터에 대한 샘플링 컴퓨터에서는 연속적인 시간에 대한 데이터에 포함되어 있는 무한히 많은 정보를 모두 저장할 수 없기 때문에 위의 [그림 1]과 같이 0, 1, 2, ... 와 같은 일정 시간 간격으로 데이터를 읽는 샘플링을 수행한다. 2. 양자화 (Quantizaton) 샘플링은 연속적인 시간에 대해 생성되는 데이터를 이산적인 시간에 대한 데이터로 변환하는 과정이다. 실세계의 아날로그 데이터는 시간뿐만 아니라, 데이터가 표현하는 값에 대.. 2016. 10. 24.
정보이론과 엔트로피 1. 정보이론에서 엔트로피가 갖는 의미 물리학에서 엔트로피는 어떠한 물리계의 무질서한 정도를 의미한다. 정보이론에서도 엔트로피는 무질서한 정도를 뜻하며, 더욱 엄밀히 말하자면 "불확실성"을 의미한다. 아래의 [그림 1-a]는 엔트로피가 낮은 데이터이고, [그림 1-b]는 엔트로피가 높은 데이터이다. [그림 1] 데이터와 엔트로피 위의 [그림 1-a]의 데이터에서는 모든 영역이 검은색이므로 불확실성이 낮다. 즉, 데이터 중에 어떤 부분을 선택하더라도 검은색이 추출된다는 것을 확실하게 말할 수 있다. 그러나 [그림 1-b]의 데이터에서는 흰색과 검은색이 무작위하게 분포되어 있기 때문에 불확실성이 높다.위의 [그림 1-a]와 같은 데이터를 표현할 때는 검은색을 표현하는 단 하나의 비트 1만 있으면 충분할 것이.. 2016. 10. 20.
[C#] - Microsoft Text Analytics API 1. API 소개 마이크로소프트의 Cognitive Services에는 Emotion API 이외에도 Text Analytics API를 제공한다. Text Analytics API의 주요 기능으로는 아래와 같은 두 가지가 있다. 감성 분석 (sentiment analysis): 문장이 긍정 또는 부정을 나타내는지 판별하는 기능중요 문구 추출 (key phrase extraction): 문장의 주제가 되는 문구들을 추출하는 기능 Text Analytics API에서는 이외에도 문장 작성에 이용된 언어 판별, 주제 추출 기능을 제공한다. 이 글에서는 Text Analytics API를 이용하여 감성 분석과 중요 문구 추출 기능을 이용하는 방법에 대해 설명한다. 2. API 키 발급Text Analytics.. 2016. 10. 9.
[머신러닝] - RNNs (Recurrent Neural Networks) 1. 개요 기존의 FNNs (Feedforward Neural Networks)는 각각의 학습 벡터에 대해 독립적으로 학습을 진행하였다. 그러나 실세계에서는 문장, 영상 및 음성 데이터 등 시간 $t-1$에서의 입력과 결과가 $t$에서의 입력과 결과에 영향을 주는 경우가 많이 존재한다. [그림 1] 플립 북 (Flip book) 플립 북 (flip book)은 이전과 다음의 데이터가 서로 연관되어 있는 대표적인 예시이다. 플립 북이라는 것은 어떠한 동작을 하나의 종이에 그리고, 다음 종이에는 해당 동작을 미세하게 변화시킨 그림을 그리는 작업을 반복하여 마치 그림이 움직이는 것과 같은 효과를 보여주는 것이다 [그림 1]. 플립 북에서 $n-1$번째 종이에 그려진 그림이 $n$번째 종이에 그려질 그림에 영향.. 2016. 10. 6.
[C#] - Microsoft Emotion API 1. API 소개 최근 마이크로소프트는 컴퓨터 비전, 음성 인식, 언어 분석 등의 기능을 Cognitive Services라는 이름으로 제공하고 있다. 마이크로소프트의 Cognitive Services는 일정 제약 조건 하에서 무료로 이용해볼 수 있으며, C# 및 Java, JavaScript, PHP, Python 등의 다양한 언어로 API를 이용할 수 있다. 이 글에서 소개하는 것은 Cognitive Services에서 제공하는 Emotion API이다. Emotion API는 사진을 입력받아서 사진에 나타나는 인물들의 감정을 분석하는 기능을 제공한다. Emotion API는 사진에 나타나는 모든 인물들의 감정을 아래와 같은 8가지의 감정으로 분석하여 JSON 형태의 결과값으로 반환한다. anger .. 2016. 10. 5.
[C#] - Visual Studio에서 Metro UI Framework 추가하기 1. Metro 디자인 Metro 디자인은 과도한 그래픽을 제외하고, 콘텐츠를 주로 하는 UI를 설계하는 것을 원칙으로 한다. 원래 Metro 디자인은 마이크로소프트에서 윈도우 폰과 윈도우 8, 윈도우 10의 개발을 위해 발전되었으나, 최근에는 웹 어플리케이션과 앱 어플리케이션 등 다양한 디자인 분야에서 이용되고 있다.Metro 디자인의 가장 큰 특징은 단색, 그라데이션의 제거 등과 같은 심플함이다. Metro 디자인의 심플한 아이콘과 콘텐츠 위주의 구성은 직관적이며, 누구나 쉽게 디자인 할 수 있다. 반대로 애플의 iOS 등은 실물을 단순화한듯한 디자인을 많이 이용하는데, 이는 Metro 디자인과 비교할 때 많은 차이점이 있다 [그림 1]. [그림 1] 애플의 다지인 컨셉과 마이크로소프트의 Metro .. 2016. 10. 3.