이진 탐색 알고리즘
순차 탐색
- 리스트 안에 있는 특정한 데이터를 찾기 위해 앞에서부터 데이터를 하나씩 차례대로 확인하는 방법
- 보통 정렬되지 않은 리스트에서 데이터를 찾아야 할 때 사용
- 리스트 자료형에서 count() 메서드를 이용할 때도 내부에서 순차 탐색이 수행됨
이진 탐색 : 반으로 쪼개면서 탐색하기
- 배열 내부의 데이터가 정렬되어 있어야만 사용할 수 있는 알고리즘
- 데이터가 이미 정렬되어 있다면 매우 빠르게 데이터를 찾을 수 있음
- 탐색 범위를 절반씩 좁혀가며 데이터를 탐색함
- 이진 탐색은 탐색하고자 하는 범위의 시작점, 끝점, 중간점으로 위치를 나타내는 변수 3개를 사용함
- 찾으려는 데이터와 중간점 위치에 있는 데이터를 반복적으로 비교해서 원하는 데이터를 찾음
이진 탐색 예시
이미 정렬된 10개의 데이터 중에서 값이 4인 원소 찾기
1. 시작점과 끝점을 확인하고 둘 사이 중간점을 정한다. 중간점이 실수일 때는 소수점 이하를 버린다.
[ 시작점 [0], 중간점 [4], 끝점[9] ]
중간점 [4]의 데이터 8과 찾으려는 데이터 4를 비교 → 중간점 데이터가 더 크므로 중간점을 기준으로 왼쪽에 있는 값만 확인 → 끝점을 [3]으로 옮긴다.
2. 중간점은 1.5에서 소수점 이하를 버린 [1]이다.
[ 시작점 [0], 중간점 [1], 끝점[3] ] 중간점에 위치한 데이터 2가 찾으려는 데이터 4보다 작으므로 값이 2 이하인 데이터는 더 이상 확인할 필요 X → 시작점을 [2]로 변경한다.
3. [ 시작점 [2], 끝점 [3] ] 이때 중간점은 [2]이다. 중간점에 위치한 데이터 4는 찾으려는 데이터와 동일하므로 탐색을 종료한다.
전체 데이터의 개수는 10개이지만, 이진 탐색을 이용해 총 3번의 탐색으로 원소를 찾을 수 있었다.
이진 탐색은 한 번 확인할 때마다 확인하는 원소의 개수가 절반씩 줄어든다는 점에서 시간 복잡도가 O(log N)이다.
재귀 함수로 구현한 이진 탐색 소스코드
def binary_search(arr, target, start, end):
if start>end:
return None
mid = (start + end) // 2
if arr[mid] == target:
return mid
elif arr[mid] > target:
return binary_search(arr, target, start, mid-1)
else:
return binary_search(arr, target, mid+1, end)
n, target = list(map(int, input().split()))
arr = list(map(int, input().split()))
binary_search(arr, target, 0, n-1)
# 이진 탐색 수행 결과 출력
result = binary_search(arr, target, 0, n - 1)
if result == None:
print("원소가 존재하지 않습니다.")
else:
print(result + 1)
반복문으로 구현한 이진 탐색 소스코드
def binary_search(arr, target, start, end):
while start <= end:
mid = (start + end) // 2
# 찾은 경우 중간점 인덱스 반환
if arr[mid] == target:
return mid
# 중간점의 값보다 찾고자 하는 값이 작은 경우 왼쪽 확인
elif arr[mid] > target:
end = mid - 1
# 중간점의 값보다 찾고자 하는 값이 큰 경우 오른쪽 확인
else:
start = mid + 1
return None
n, target = list(map(int, input().split()))
arr= list(map(int, input().split()))
# 이진 탐색 수행 결과 출력
result = binary_search(arr, target, 0, n - 1)
if result == None:
print("원소가 존재하지 않습니다.")
else:
print(result + 1)
트리 자료구조
- 데이터베이스는 내부적으로 대용량 데이터 처리에 적합한 트리 자료구조를 이용하여 항상 데이터가 정렬되어 있음
- 트리 자료구조: 노드와 노드의 연결로 표현 (노드: 정보의 단위, 어떠한 정보를 가지고 있는 개체)
트리의 특징
1. 트리는 부모노드와 자식노드의 관계로 표현된다.
2. 트리의 최상단 노드 = 투르노드 / 트리의 최하단 노드 = 단말노드
3. 트리의 일부를 떼어내도 트리구조이다 = 서브트리
4. 계층적이고 정렬된 데이터를 다루는데 적합하다. ( ex 파일 시스템 )
이진 탐색 트리
- 이진 탐색이 동작할 수 있도록 고안된, 효율적인 탐색이 가능한 자료구조
이진 탐색 트리의 특징
왼쪽 자식 노드 < 부모 노드 < 오른쪽 자식 노드가 성립해야 이진 탐색 트리라 할 수 있음
이진 탐색 트리 데이터 조회 과정
빠르게 입력받기
- 이진 탐색 문제는 입력 데이터가 많거나, 탐색 범위가 매우 넓은 편
- 데이터의 개수가 1,000만 개를 넘어가거나, 탐색 범위의 크기가 1,000억 이상이라면 이진 탐색 알고리즘을 의심할 것
- 입력 데이터의 개수가 많은 문제에 input() 함수를 사용하면 동작 속도가 느려 시간 초과로 오답이 될 수 있음
- 입력 데이터가 많은 문제는 sys 라이브러리의 readline() 함수를 이용할 것
import sys
input_data = sys.stdin.readline().rstrip()
print(input_data)
- sys 라이브러리를 사용할 때는 한 줄 입력받고 나서 rstrip() 함수를 꼭 호출해야 함
→ 소스코드에 readline()으로 입력하면 입력 후 엔터(Enter)가 줄 바꿈 기호로 입력되는데, 이를 제거하기 위함
참조 (그림)
[이것이 코딩테스트다] 15일차 - 순차탐색, 이진탐색, 트리자료구조
본문은 [이것이 취업을 위한 코딩테스트다 - 나동빈] 책을 공부하고 작성한 글입니다. Chapter 7 이진탐색 이진탐색을 학습하기 전, 순차탐색을 먼저 알아야한다. 순차탐색 리스트안에 있는 요소들
gammistory.tistory.com
참고 서적
이것이 취업을 위한 코딩 테스트다 with 파이썬