본문 바로가기

IT

(29)
[시나공 토막강의] 40-43강 정리 40강. 관계형 데이터베이스 구조 - 관계형 데이터베이스는 2차원적인 표(Table)를 이용해서 데이터 상호 관계를 정의하는 데이터베이스 - 코드에 의해 처음 제안, 개체(Entity)와 관계(Relationship)를 모두 릴레이션(Relation)이라는 표(Table)로 표현하기 때문에 각 릴레이션이 별개로 존재 - 장점 : 간결하고 보기 편리, 다른 데이터베이스로의 변환이 용이 - 단점 : 성능이 다소 떨어짐 1. 관계형 데이터베이스의 릴레이션 구조 - 릴레이션(Relation)은 데이터들을 표(Table)의 형태로 표현한 것으로 구조를 나타내는 릴레이션 스키마와 실제 값들인 릴레이션 인스턴스로 구성 - 릴레이션 스키마 : 속성 이름들, 릴레이션 인스턴스 : 각 튜플들, 이걸 합친 표 : 릴레이션 ..
[시나공 토막강의] 36-39강 정리 36강. 데이터 모델의 개념 - 현실 세계의 정보들을 컴퓨터에 표현하기 위해서 단순화, 추상화하여 체계적으로 표현한 개념적 모형 - 데이터, 데이터의 관계, 데이터의 의미 및 일관성, 제약 조건 등을 기술하기 위한 개념적 도구들로 구성되어 있음 - 데이터베이스 설계 과정에서 데이터의 구조(Schema)를 논리적으로 표현하기 위해 지능적 도구로 사용됨 - 데이터 모델 구성 요소 : 개체, 속성, 관계 - 데이터 모델 종류 : 개념적 데이터 모델, 논리적 데이터 모델, 물리적 데이터 모델 - 데이터 모델에 표시할 요소 : 구조, 연산, 제약 조건 1. 개념적 데이터 모델 - 현실 세계에 대한 인간의 이해를 돕기 위해 현실 세계에 대한 인식을 추상적 개념으로 표현하는 과정 - 속성들로 기술된 개체 타입과 이 ..
[시나공 토막강의] 34-35강 정리 34강. 데이터베이스 개요 1. 데이터 저장소 - 데이터들을 논리적인 구조로 조직화하거나, 물리적인 공간에 구축한 것을 의미 - 논리 데이터 저장소 : 데이터 및 데이터 간의 연관성, 제약조건을 식별하여 논리적인 구조로 조직화한 것 - 물리 데이터 저장소 : 논리 데이터 저장소를 소프트웨어가 운용될 환경의 물리적 특성을 고려하여 실제 저장장치에 저장한 것 2. 데이터 베이스(Database) - 여러 사람에 의해 공동으로 사용될 데이터를 중복을 배제하여 통합하고, 쉽게 접근하여 처리할 수 있도록 저장장치에 저장하여 항상 사용할 수 있도록 운영하는 운영 데이터 - 통합된 데이터(Integrated Data) : 자료의 중복을 배제한 데이터의 모임 - 저장된 데이터(Stored Data) : 컴퓨터가 접근할..
[시나공 토막강의] 31-33강 정리 31강. 데이터 전환(ETL; Extraction, Transformation, Load, 즉 추출, 변환, 적재 과정) - 기존 정보 시스템에 축적되어 있는 데이터를 추출(Extraction)하여 새로 개발할 정보 시스템에서 운영할 수 있도록 변환(Transformation)한 후, 적재(Loading)하는 일련의 과정 - 데이터 이행(Data Migration) 또는 데이터 이관이라고도 함 - 데이터 전환 계획서 : 데이터 전환이 필요한 대상을 분석하여 데이터 전환 작업에 필요한 모든 계획을 기록하는 문서 - 주요 항목 : 데이터 전환 개요, 대상 및 범위, 환경 구성, 조직 및 역할, 일정, 전환 방안, 정비 방안, 비상 계획, 데이터 복구 대책 32강. 데이터 검증 - 원천 시스템의 데이터를 목적..
[시나공 토막강의] 26-30강 정리 26강. 프로젝트 일정(Scheduling) 계획 - 프로젝트의 프로세스를 이루는 소작업을 파악하고 예측된 노력을 각 소작업에 분배하여 소작업의 순서와 일정을 정하는 것 - 프로젝트 일정 계획에 사용되는 기능 : WBS, PERT/CPM, 간트 차트 등 1. PERT(Program Evaluation and Review Technique, 프로그램 평가 및 검토 기술) - 프로젝트에 필요한 전체 작업의 상호 관계를 표시하는 네트워크 - 각 작업별로 다음과 같이 단계를 나누어 종료시기를 결정함 : 낙관적, 가능성이 있는, 비관적인 경우 - 개발 경험이 없어 소요 기간 예측이 어려운 프로젝트 일정 계획에 사용 - 노드와 간선으로 구성되며 원 노드에는 작업을, 간선에는 낙관치, 기대치, 비관치를 표시 - 결정..
[시나공 토막강의] 22-25강 정리 22강. 비용 산정 기법 1. 소프트웨어 비용 산정 - 개발에 소요되는 인원, 자원, 기간 등으로 소프트웨어의 규모를 확인하여 개발 계획 수립에 필요한 비용을 산정 - 너무 높게 산정할 경우 예산 낭비와 일의 효율성 저하 초래, 너무 낮게 산정할 경우 개발자의 부담이 가중되며 품질 문제 발생 가능 ex) 하향식 비용 산정 기법, 상향식 비용 산정 기법 2. 소프트웨어 비용 결정 요소 1) 프로젝트 요소 : - 제품 복잡도 : 소프트웨어의 종류에 따라 발생할 수 있는 문제점들의 난이도 - 시스템 크기 : 소프트웨어의 규모에 따라 개발해야 할 시스템의 크기 - 요구되는 신뢰도 : 일정 기간 내 주어진 조건 하에서 프로그램이 필요한 기능을 수행하는 정도 2) 자원 요소 : - 인적 자원 : 소프트웨어 개발 관..
[시나공 토막강의] 20-21강 정리 20강. 소프트웨어 개발 방법론 - 소프트웨어 개발, 유지보수 등에 필요한 여러 가지 일들의 수행 방법, 그 과정에서 필요한 각종 기법 및 도구를 표준화한 것 - 목적은 소프트웨어의 생산성과 품질 향상 ex) 구조적, 정보공학, 객체지향, 컴포넌트 기반(CBD), 제품 계열, 애자일 방법론 1. 구조적 방법론 - 정형화된 분석 절차에 따라 사용자 요구사항을 파악하여 문서화하는 처리 중심의 방법론 - 1960년대까지 가장 많이 적용 - 쉬운 이해 및 검증 가능한 프로그램 코드 생성이 목적, 분할과 정복(Divide and Conquer) 원리를 적용 - 개발 절차 : 타당성 검토 -> 계획 -> 요구사항 -> 설계 -> 구현 -> 시험 -> 운용/유지보수 2. 정보공학 방법론 - 계획, 분석, 설계, 구축..
[Codeit] DataFrame 다루기 사용하고 있는 환경은 Anaconda Navigator 의 Jupyter 근데 사실 코드잇에는 창 안에 강의 부분과 실행기 부분이 따로 있어서 바로 코딩해서 테스트 가능. 2022.11.15(화) 드디어 긴 회피를 멈추고 마주한 data science 공부.. 1. Data Frame 인덱싱 02 ~ 04 방송사 시청률 받아오기 loc : 위치 찾는 메소드(location) 예를 들어, df.loc['A', 20] 이라고 치면 행 이름이 A, 열 이름이 20인 위치를 찾아서 데이터값을 출력한다. df.loc[:, 'A] 에서 : 는 '모든' 을 의미해서 A열의 모든 행들의 값을 다 출력한다. df.loc[:,('A','B')] 는 열이 A 혹은 B 인 모든 행들의 값을 다 출력한다. - 05 카드사 고객..