해시 구조
- Hash Table: 키(Key) 값(Value)구조로 저장하는 데이터구조
- Key를 통해 데이터를 받아올 수 있으므로, 속도가 빨라진다.
- 파이썬 딕셔너리(Dictionary)타입이 해시 테이블의 예
- 보통 배열로 미리 해시 테이블 사이즈만큼 생성 후에 사용한다.
- 파이썬에서는 해시를 별도 구현할 이유가 없다.(딕셔너리타입이 존재)
시간 복잡도
- 일반적인 경우(충돌이 없는 경우)는 O(1)
- 최악의 경우(충돌이 모두 발생하는 경우)는 O(n)
해시테이블의 경우, 일반적인 경우를 기대하고 만들기 때문에 시간복잡도는 O(1)이라고 할 수 있다.
용어
- 해시(Hash): 임의 값을 고정 길이로 변환하는 것
- 해시 테이블(Hash Table): 키 값의 연산에 의해 직접 접근이 가능한 데이터 구조
- 해싱 함수(Hashing Function): Key에 대해 산술 연산을 이용해 데이터 위치를 찾을 수 있는 함수
- 해시 값(Hash Value) 또는 해시 주소(Hash Address): Key를 해싱 함수로 연산해서 해시 값을 알아내고, 이를 기반으로 해시 테이블에서 해당 Key에 대한 데이터 위치를 찾을 수 있다.
- 슬롯(Slot): 한 개의 데이터를 저장할 수 있는 공간
해시 테이블의 장단점과 용도
해시 테이블의 장점
- 데이터 저장/읽기 속도가 빠르다.(검색 속도가 빠름)
- 해시는 키에 대한 데이터가 있는지(중복) 확인이 쉽다.
해시 테이블의 단점
- 일반적으로 저장공간이 좀 더 많이 필요하다.
- 여러 키에 해당하는 주소가 동일할 경우 충돌을 해결하기 위한 별도 자료구조가 필요하다.
용도
- 검색이 많이 필요한 경우
- 저장, 삭제, 읽기가 빈번한 경우
- Cache 구현(중복 확인이 쉽기 때문이다.)
리스트 변수를 이용하여 해시 테이블 구현
hash_table = list([0 for i in range(10)]) # 0부터 9까지의 리스트를 0으로 초기화
# Key를 생성하는 함수
def get_key(data):
return hash(data)
# Key를 이용하여 Hash address를 생성하는 함수
def hash_function(key):
return key % 10
# data, value를 해시 테이블에 저장하는 함수
def save_data(data, value):
hash_address = hash_function(get_key(data))
hash_table[hash_address] = value
# 데이터값으로 Value값을 가져오는 함수
def read_data(data):
hash_address = hash_function(get_key(data))
return hash_table[hash_address]
실행 결과
'Python > 자료구조와 알고리즘' 카테고리의 다른 글
[자료구조] 해시 테이블(Hash Table) - Linear Probling 기법 (0) | 2021.01.21 |
---|---|
[자료구조] 해시 테이블(Hash Table) - Chaining기법 (0) | 2021.01.21 |
[자료구조] 링크드 리스트(Linked List) - 이중 연결 리스트(Doubly Linked List) (0) | 2021.01.16 |
[자료구조] 링크드 리스트(Linked List) - 단순 연결 리스트(Simple Linked LIst) (0) | 2021.01.16 |
[자료구조] 스택(Stack) (0) | 2021.01.11 |