자료구조 | 알고리즘

이진 탐색 알고리즘

seulll 2024. 1. 31. 14:18

 순차 탐색 

- 리스트 안에 있는 특정한 데이터를 찾기 위해 앞에서부터 데이터를 하나씩 차례대로 확인하는 방법

- 보통 정렬되지 않은 리스트에서 데이터를 찾아야 할 때 사용

- 리스트 자료형에서 count() 메서드를 이용할 때도 내부에서 순차 탐색이 수행됨


 이진 탐색  :  반으로 쪼개면서 탐색하기

- 배열 내부의 데이터가 정렬되어 있어야만 사용할 수 있는 알고리즘

- 데이터가 이미 정렬되어 있다면 매우 빠르게 데이터를 찾을 수 있음

- 탐색 범위를 절반씩 좁혀가며 데이터를 탐색함

- 이진 탐색은 탐색하고자 하는 범위의 시작점, 끝점, 중간점으로 위치를 나타내는 변수 3개를 사용함

- 찾으려는 데이터와 중간점 위치에 있는 데이터를 반복적으로 비교해서 원하는 데이터를 찾음

 

이진 탐색 예시

이미 정렬된 10개의 데이터 중에서 값이 4인 원소 찾기

 

1. 시작점과 끝점을 확인하고 둘 사이 중간점을 정한다. 중간점이 실수일 때는 소수점 이하를 버린다. 

 [ 시작점 [0], 중간점 [4], 끝점[9] ]

중간점 [4]의 데이터 8과 찾으려는 데이터 4를 비교 → 중간점 데이터가 더 크므로 중간점을 기준으로 왼쪽에 있는 값만 확인 → 끝점을 [3]으로 옮긴다.

 

2. 중간점은 1.5에서 소수점 이하를 버린 [1]이다.

 [ 시작점 [0], 중간점 [1], 끝점[3] ] 중간점에 위치한 데이터 2가 찾으려는 데이터 4보다 작으므로 값이 2 이하인 데이터는 더 이상 확인할 필요 X → 시작점을 [2]로 변경한다.

3. [ 시작점 [2], 끝점 [3] ] 이때 중간점은 [2]이다. 중간점에 위치한 데이터 4는 찾으려는 데이터와 동일하므로 탐색을 종료한다.

 

전체 데이터의 개수는 10개이지만, 이진 탐색을 이용해 총 3번의 탐색으로 원소를 찾을 수 있었다. 

이진 탐색은 한 번 확인할 때마다 확인하는 원소의 개수가 절반씩 줄어든다는 점에서 시간 복잡도가 O(log N)이다. 

 

재귀 함수로 구현한 이진 탐색 소스코드

def binary_search(arr, target, start, end):
    if start>end:
        return None
    mid = (start + end) // 2
    if arr[mid] == target:
        return mid
    elif arr[mid] > target:
        return binary_search(arr, target, start, mid-1)
    else:
        return binary_search(arr, target, mid+1, end)
    
n, target = list(map(int, input().split()))  
arr = list(map(int, input().split()))  
binary_search(arr, target, 0, n-1)

# 이진 탐색 수행 결과 출력
result = binary_search(arr, target, 0, n - 1)
if result == None:
    print("원소가 존재하지 않습니다.")
else:
    print(result + 1)

 

반복문으로 구현한 이진 탐색 소스코드

def binary_search(arr, target, start, end):
    while start <= end:
        mid = (start + end) // 2
        # 찾은 경우 중간점 인덱스 반환
        if arr[mid] == target:
            return mid
        # 중간점의 값보다 찾고자 하는 값이 작은 경우 왼쪽 확인
        elif arr[mid] > target:
            end = mid - 1
        # 중간점의 값보다 찾고자 하는 값이 큰 경우 오른쪽 확인
        else:
            start = mid + 1
    return None


n, target = list(map(int, input().split()))

arr= list(map(int, input().split()))

# 이진 탐색 수행 결과 출력
result = binary_search(arr, target, 0, n - 1)
if result == None:
    print("원소가 존재하지 않습니다.")
else:
    print(result + 1)

 트리 자료구조 

- 데이터베이스는 내부적으로 대용량 데이터 처리에 적합한 트리 자료구조를 이용하여 항상 데이터가 정렬되어 있음

- 트리 자료구조: 노드와 노드의 연결로 표현 (노드: 정보의 단위, 어떠한 정보를 가지고 있는 개체)

트리의 특징

    1. 트리는 부모노드와 자식노드의 관계로 표현된다.

    2. 트리의 최상단 노드 = 투르노드 / 트리의 최하단 노드 = 단말노드

    3. 트리의 일부를 떼어내도 트리구조이다 = 서브트리

    4. 계층적이고 정렬된 데이터를 다루는데 적합하다. ( ex 파일 시스템 )


 이진 탐색 트리 

- 이진 탐색이 동작할 수 있도록 고안된, 효율적인 탐색이 가능한 자료구조

이진 탐색 트리의 특징

왼쪽 자식 노드 < 부모 노드 < 오른쪽 자식 노드가 성립해야 이진 탐색 트리라 할 수 있음

 

이진 탐색 트리 데이터 조회 과정


 빠르게 입력받기 

- 이진 탐색 문제는 입력 데이터가 많거나, 탐색 범위가 매우 넓은 편

- 데이터의 개수가 1,000만 개를 넘어가거나, 탐색 범위의 크기가 1,000억 이상이라면 이진 탐색 알고리즘을 의심할 것

- 입력 데이터의 개수가 많은 문제에 input() 함수를 사용하면 동작 속도가 느려 시간 초과로 오답이 될 수 있음

- 입력 데이터가 많은 문제는 sys 라이브러리의 readline() 함수를 이용할 것

import sys
input_data = sys.stdin.readline().rstrip()

print(input_data)

 

- sys 라이브러리를 사용할 때는 한 줄 입력받고 나서 rstrip() 함수를 꼭 호출해야 함

  → 소스코드에 readline()으로 입력하면 입력 후 엔터(Enter)가 줄 바꿈 기호로 입력되는데, 이를 제거하기 위함

 


 

참조 (그림)

 

[이것이 코딩테스트다] 15일차 - 순차탐색, 이진탐색, 트리자료구조

본문은 [이것이 취업을 위한 코딩테스트다 - 나동빈] 책을 공부하고 작성한 글입니다. Chapter 7 이진탐색 이진탐색을 학습하기 전, 순차탐색을 먼저 알아야한다. 순차탐색 리스트안에 있는 요소들

gammistory.tistory.com

 

참고 서적

이것이 취업을 위한 코딩 테스트다 with 파이썬