제 3 장. 파일의 구조

파일의 구조에 대해 알아 보도록 하겠습니다.

3-1. 매체에 의한 분류

마그네틱 테이프 파일, 마그네틱 디스크 파일, 마그네틱 드럼 파일, 카드 파일

3-2. 내용에 의한 분류.

(1) 마스터 파일(Master File)

이 파일은 기본이 되는 정보를 모두 기록하는 파일로서, 이파일에 수록된 각 장기간에 걸쳐 유지되며 주기적인 변동이나 추가, 삭제시 균형이 유지되는 기본 파일이다. 신입사원 대장이나 은행의 원장과 같이 장기간에 걸쳐 보존된다.

(2) 트랜잭션 파일(Transaction File)

마스타 파일을 갱신 하거나 수정하기 위해 사용하는 파일로, 일반업무 처리에서 전표와 같은 역활을 하는 것으로 갱신용 데이터나 조합용 데이터를 기록해 두는 임시 FILE이다.

【참고】갱신(Update)

구 마스터 파일(master file)의 내용을 변경하거나 수정하여 신(최근) 마스터파일(master file)을 작성하는 것

(3) 히스토리 파일(History File)

기록 파일로 파일이 파괴됬을 때 파일을 원상 복구하기위한 파일.

(4) 섬머리 파일(Summary File)

합계파일로 집계에 편리하게 하기 위하여 다른 파일의 합계를 모아놓은 파일.

(5) Sort파일

레코드가 특정 항목을 기준으로 순서 있게 배열되어 있은 파일을 의미하고, 특정 항목을 기준으로 순서 있게 배열되어 있지 않은 파일을 랜덤 파일(Random File)이라 한다. 순서적으로 배열된 파일은 다음과 같은 종류가 있다.

① 오름차순 파일(Ascending File)

레코드가 작은순에서 큰순으로 정렬된 파일

② 내림차순 파일(Descending File)

레코드가 큰순에서 작은순으로 정렬된 파일

3-3. 편성(구조)에 의한 분류

3-3-1. 순차(Sequential) 파일

특정한 키(KEY)항목을 기준으로 순서적으로 배열된 파일로 하나의 RECORD를 ACCESS한 다음 저절로 그 다음에 위치한 RECORD를 ACCESS하며 기존의 FILE에 새로운 RECORD를 추가할 때 시간의 낭비가 있는 특성을 갖는 파일이다. 대표적인 매체는 마그네틱 테이프(Magnetic Tape)이다.

【예】순차(Sequential) 파일

데이터1데이터2데이터3데이터4데이터5

(1)장점

① 어떠한 입출력 매체에서도 처리가 가능하다.

② 공간이 없으므로 효율이 좋다.

(2) 단점

① 필요한 레코드를 삽입하는 경우 파일 전체를 복사(Copy)하여야 한다.

② 레코드의 검색시 효율이 나쁘다.

【참고】SAM(Sequential Access Method)

File내의 자료를 순서적으로 처리하는 방법

3-3-2. 직접 파일(Direct : Random File )

색인을 사용하지 않기 때문에 고속으로 Access가 가능하며 레코드가 기록될 번지와 레코드를 식별하는 키(Key)와는 특별히 정해진 관계가 있어서 어느 레코드도 자신이 가지고 있는 키를 분석함으로써 액세스(Access)될수 있다.

(1) 장점

① 랜덤 처리에 적합하다.

② 어떤 레코드도 평균 엑세스시간으로 검색이 가능하다.

③ 오퍼레이팅 시스템(Operating System)에 의해 키이(Key)변환을 자동으로 처리해 준다.

④ 데이타 레코드를 호출(Access)할때 그 레코드가 결합되어 있는 번지(Address)를 직접 이용자측이 지정한다.

(2) 단점

Key변환에 따라 공백이 많이 생긴다.

【참고】DAM(Direct Access Method)

DAM은 반드시 key가 있어야 하며, 기억장치의 이용 효율이 SAM에 비하여 낮다. 그러므로 DAM은 파일의 크기에 비하여 적은 양의 데이터를 처리함에 유리하다.

3-3-3. 색인순차파일(Index Sequential File)

간단하게 색인표를 만들어 이 색인표를 이용하여 순편성 처리와 랜덤(Random)처리의 양쪽이 가능한 편성법으로 TRACK안에서는 RECORD들이 SORTING되어 있어야 하며 하나의 인덱스(Index)에 있는 키이(Key)의 값들은 모두 서로 달라야 한다.

(1) ISAM 파일 구성 3요소

· DASD 장치이어야 한다. · KEY 순서대로 정렬(SORT)되어 있어야 한다. · FIXED LENGTH 레코드이어야 한다.

(2) Index 구성

기본구역(prime data area)색인구역(index area)오버플로우 구역(overflow area)
카운트 구역키 구역데이타 구역트랙색인 구역실린더 색인 구역마스터 색인 구역

① 기본구역 (prime data area)

실제 데이타가 수록된 구역.

② 색인구역(index area)

자료가 보관된 주소를 보관하는 구역으로 트랙색인 구역, 실린더 색인 구역, 마스터 색인 구역등이 있으며 이중 트랙, 실린더 구역은 반드시 필요한 요소이다.

【참고】Index

색인, 목차처럼 대표적인 값을 모아 그것이 위치하고 있는 위치만을 가르킬 수 있도록 어떤 값을 모아 놓은것.

③ 오버플로우 구역 (overflow area)

추가 항목을 저장하는 구역.

(3) 장점

① 순편성(Sequential) 처리와 랜덤(Random)처리가 가능하다.

② 레코드를 추가 삽입하는 경우 파일 전체를 복사할 필요가 없다.

(4) 단점

① 색인 또는 오버플로우(Overflow)부분의 공란(Space)이 필요하다.

② 색인을 사용한 엑세스(Access)이므로 시간이 느리다.

③ 오버플로우 레코드가 많은 경우 파일을 재편성 해야한다.

3-3-4. 리스트편성(List Organization)

대형 데이타 베이스, 네트 워크 데이타 베이스, 계층 구조 데이타 베이스에 서 널리 사용하는 구조로 네트 워크 데이타 베이스, 계층 구조 데이타 베이스의 경우 리스트 편성에 의하지 않으면 레코드 검색이 매우 어렵게된다.

(1) 장점

① 데이터 레코드의 추가및 삭제를 할 필요가 있을때 파일 전체를 복사할 필요가 없다

② 포인터(Pointer)를 사용하므로 레코드의 추가, 삭제가 간단하게 처리 된다.

(2) 단점

① 파일의 구조가 복잡하여 처리의 효율이 떨어진다.

② 포인터(Pointer)를 사용하는 관계로 예비 영역이 필요하다.

3-3-5. 각 파일의 특징 순서

(1) 새로운 레코드를 추가할때 가장 빠른 구조

① 리스트(List)구조 ② 랜덤(Random)구조 ③ 축차(Sequential)구조

(2) 기억장소를 절약하는 잇점이 많은 구조

① 축차구조(Sequential) ② 리스트구조(List) ③랜덤(Random)구조

(3) 레코드 검색이 가장 빠른 자료구조

① 랜덤(Random)구조 ③ 리스트(List)구조 ③축차(Sequential)구조

3-3-6. 파일의 활동성(File Activity Ratio)

(1) 파일의 활동성(File Activity Ratio)

(2) 순서적 또는 비순서적인 경우 파일 활동율

순서적 또는 비순서적으로 처리 하느냐는 파일 활동율은 10%이상은 순서처리, 10%이하일때에는 랜덤처리가 적합하다.

3-3-7. 파일의 유지관리

(1) 파일의 보수(유지)(Maintenance)

자료의 추가, 갱신, 삭제 등의 처리로 파일을 최신의 내용으로 유지시키기 위한 처리 방법

(2) 부합(matching)

수많은 데이터에서 조건에 합치되는 것만큼 골라내는 처리

(3) 병합(Merge)

이미 분류된 2개 이상의 자료를 합하여 1개의 자료로 만드는 작업

【참고】상대파일(Relative File)

Relative File에서의 엑세스 모드(Access Mode)는

① Sequential, ② Random, ③ Dynamic이다.


이상 “파일의 구조”에 대해 알아 보았습니다.

댓글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다