'Collection'에 해당되는 글 2건

  1. 2008.06.03 Collection 하나 더..
  2. 2008.06.03 Collection Framework

Collection 하나 더..

Java 2008.06.03 11:31

여태 개발하면서 무지 많이 써오던 컬랙션들. 성능이나 별다른 고민없이 걍 대충 써왔던 것 같다. "켄트 벡의 구현 패턴"이란 책을 보다 보니 자세한 설명이 있어서 그 동안 알고 있던것과 더불어 정리해 두는 게 조을 것 같다.


1. 인터페이스

The core collection interfaces.

Queue는 거의 사용하지 않고 책에 없으니까 생략 ^^


  - 배열

     가장 단순하지만 가장 유연하지 못한 컬렉션.

     크기가 고정되어 있고 원소 접근 방법이 용이하면 빠르다.

     단순한 연산의 경우 배열은 다른 컬렉션에 비해 시간, 공간 모든 면에서 효율적이다.

     일반적으로 배열 접근(element[i])은 ArrayList를 사용했을 때(elements.get(i))에 비해 10배 이상

     빠르다고 한다.

     대부분의 경우 유연성 문제 때문에 배열보다는 다른 컬렉션을 사용하고, 프로그램의 일부에서 성능이

     중요한 경우 배열을 사용하는 것도 고려하는 것이 좋을 듯


  - Iterable

     기본적인 컬렉션 인터페이스로 순차 열람(iteration)을 지원한다.

     어떤 변수를 Iterable로 선언하는 것은 그 변수가 여러 개의 값을 갖고 있음을 뜻할 뿐이다.

     실제로 Iterable 인터페이스를 살펴 보면 자바 컬렉션의 모든 인터페이스, 구현 클래스들이 implement

     하고 있는 것을 확인할 수 있고 Iterable에 정의된 메소드는 Iterator<T> iterator() 뿐이다.

     Iterator를 이용하면 Iterator 인터페이스에서 지원하는 세가지 메소드

     (hasNext(), next(), remove())를 사용할 수 있다.

     자바 5에서는 암묵적으로 iterator() 메소드를 호출하여

     for (Element element : elements) {

         ......

     }

     의 형식으로 간편하게 루프를 구성할 수 있게 한다.

     실제 프로그램에서는 Iterable 인터페이스를 직접 사용할 일은 없으니 이런게 있다고 정도만 알아두면

     될것이다.


  - Collection

     Iterable을 상속하며, 원소의 추가, 삭제, 검색, 크기 지원 등의 메소드를 추가로 지원한다.

    

  - List

     원소의 순서가 정의되어 있으며, 컬렉션상의 위치를 통해 원소에 접근할 수 있다.

     따라서 List를 사용하면 컬렉션 상에서의 인덱스를 통해 어떤 원소를 접근 할 수 있다.

    원소간의 순서가 중요한 경우, 예를 들어 도착 순서대로 메세지를 처리하는 큐의 경우에는 리스트를

    사용해야 한다.


  - Set

     중복된 원소가 없는 컬렉션

     중복원소(상호간 equals()의 결과가 참인 원소)를 허용하니 않는 컬렉션

     원소 사이의 순서가 없으므로, 이전 순차 열람할 때의 원소 순서가 다음 순차 열람할 때 보장되지

     않는다.

    

  - SortedSet

     중복된 원소가 없으며 원소간의 순서가 정해진 컬렉션

     컬렉션에 추가된 순서나 명시적인 인덱스 번호에 따라 순서가 정해지는 List와 달리

     SortedSet은 Comparator에 의해 순서를 정한다. 명시적인 순서를 제공하지 않는 경우에는

     "자연 순서(natural order)"가 사용된다. 예를 들어 문자열은 알파벳 순으로 정렬

    

     아래는 Comparator의 사용예

     public Collection<String> getAlphabeticalAuthors() {

         Comparator<Author> sorter = new Comparator<Author>() {

             public int compare(Author o1, Author o2) {

                 if (o1.getLastName().equals(o2.getLastName())) {

                     return o1.getFirstName().compareTo(o2.getFirstName());

                 return o1.getLastName().compareTo(o2.getLastName());

             }

         };

         SortedSet<Author> results = new TreeSet<Author>(sorter);

         for (Book each: getBooks()) {

             results.add(each.getAuthor());

         }

         return results;

     }


  - Map

     키에 의해 원소를 저장하고 접근하는 컬렉션

     Map은 List처럼 키를 사용해서 원소를 저장하지만, List가 정수만을 키로 사용할 수 있는 반면

     Map은 임의의 객체를 키로사용할 수 있다.

     또 Map는 다른 컬렉션 인터페이스와는 형태가 상이하여 다른 컬렉션 인터페이스를 상속하지 않고,

     내부적으로 키에 대한 컬렉션과 데이터에 대한 컬렉션의 2개 컬렉션을 유지한다.


컬렉션을 사용할 때는 항상 인터페이스를 선언하여 사용

List<String> list = new ArrayList<String>();

Map<String, String> map = new HashMap<String, String>();

Collection 인터페이스를 사용하면 유연성은 가장 높겠지만 실제 사용한 적은 거의 없는 것 같다.

List, Set, Map이면 ㅇㅋㅂㄹ


2. 구현

컬렉션에 대해 구현 클래스를 선택하는 것은 주로 성능과 관련이 있다.

위의 표에 소개한 구현 이외에도 무지하게 많은 구현들이 있다. 각 구현체의 특성을 살펴보고 필요한 것을

가져다 사용하면 된다.

일단 가장 단순한 구현을 사용하여 시작하고 추후 경험에 따라 튜닝하는 것이 좋다.

컬렉션중 가장 많이 사용되는 클래스는 ArrayList이며, 그 다음은 HashSet이다.

(이클립스와 JDK에서 ArrayList는 3400번, HashSet은 800번 사용되었다고 한다.)


  - Collection 구현

     Collection 인터페이스만 구현한 클래스는 없는 듯 하다. 단순한 컬렉션이 필요한 경우

     그냥 ArrayList를 사용하자. ArrayList 사용시 성능상 문제되는 부분은 컬렉션의 크기에 비례해서

     연산 시간이 커지는 contains(Ojbect)와 이 메소드를 이용하는 다른 메소드(remove() 등)이 있다.

     이 때 중복 원소들을 제거해도 상관이 없다면 HashSet으로 교체하면 좋다. 그러나 중복 원소가 이미

     없는 경우라면 별 차이가 없을 수도 있다.


  - List 구현

     ArrayList와 LinkedList

     ArrayList는 원소 접근이 빠르고 원소 추가 및 제거가 느린 반면

     LinkedList는 원소 접근이 느리지만 원소 추가와 제거는 빠르다.


  - Set, SortedSet 구현

     HashSet은 가장 빠르지만 원소간의 순서를 보장해주지 않는다.

     LinkedHashSet은 원소 간 순서를 보장해 주지만 원소 추가 삭제 시 30% 정도 시간이 더 걸린다.

     TreeSet은 Comparator에 따라서 원소를 정렬하지만 원소 추가 삭제 시간이

     logn(n은 컬렉션의 크기)에 비례해서 커진다.


  - Map 구현

     Map 구현은 Set 구현과 비슷한 패턴을 보인다.

     HashMap은 가장 빠르고 단순하다.

     LinkedHashMap은 컬렉션에 추가된 원소 간의 순서를 보장한다.

     TreeMap(SortedMap 의 구현)은 키의 순서에 따라 순차 열람이 가능하지만 원소의 추가 제거 시간이

     logn(n은 컬렉션의 크기)에 비례한다.


3. Collections

Collections는 다른 컬렉션 인터페이스에 넣기 적절치 않은 기능들을 모아 놓은 유틸리티 클래스이다.


  - 검색

     indexOf() 연산에 걸리는 시간은 리스트의 크기에 비례한다. 원소들이 정렬되어 있을 경우

     Collections.binarySearch(list, element)를 사용하여 log2n에 비례하는 시간에 검색할 수 있다.

     원소가 리스트에 존재하지 않는다면 음수를 반환하고, 리스트가 정렬되어 있지 않다면 결과는 예측불가


  - 정렬

     reverse(list)는 리스트에 속해 있는 모든 원소 간의 순서를 거꾸로 바꾼다.

     shuffle(list)는 순서를 임의로 바꾼다.

     sort(list), sort(list, comparator)는 오름차순으로 원소를 정렬한다.

     이진 검색과 달리 ArrayList와 LinkedList에서 정렬 수행 성능은 거의 같다. 정렬을 수행할 경우

     컬렉션의 원소들이 일단 배열로 복사되어 정렬된 후 다시 본래의 컬렉션으로 복사되기 때문


  - 수정 불가능한 컬렉션

     신뢰할 수 없는 코드에 컬렉션을 전달하는 경우 Collections.unmodifiableCollection() 메소드를

     이용하면 클라이언트가 수정하려 들 경우 예외를 발생시키도록 할 수 있다.


  - 단일 원소 컬렉션

     하나의 원소를 전달해야 하지만 컬렉션 인터페이스를 사용해야 하는 경우 사용

     Set의 경우 Collections.singleton(T o), List와 Map의 경우 singletonList(T o),

     singletonMap(K key, V value)를 사용


  - 무원소 컬렉션

     컬렉션 인터페이스를 사용해야 하지만 전달할 원소가 없는 경우에는 Collections에서 수정할 수 없는

     무원소 컬렉션을 생성해서 사용

     Collections.emptyList(), emptySet(), emptyMap()


  - 동기화 컬렉션

     이전 시대의 유물인 Vector와 Hashtable이 ArrayList와 HashMap간의 차이점은 전자가 쓰레드 안전인

     반면 후자는 아니라는 것이다.

     동기화가 필요없는 경우라면 ArrayList, HashMap을 사용하고 동기화가 필요한 경우

     Collections.synchronizedCollection(), Collections.synchronizedList(),

     Collections.synchronizedSet(), Collections.synchronizedMap()를 사용하여

     ArrayList, HashMap을 래핑하면 멀티 쓰레드 환경에서도 걱정이 사라진다.

[출처] 자바 Collection|작성자 바람의혼

Posted by 용식

Collection Framework

Java 2008.06.03 10:59
출처 : http://www.javacafe.or.kr/lecture/cafeLecture/general/My%20Webs/Collection%20Framework.htm

Collection Framework

 

만든이: 송지훈
소속: JavaCafe 부시샵
email: johnleen@hanmail.net

 

이번 강좌를 통해 자바의 자료구조인 Collection Framework 에 대해 자세하게 알아보도록 하겠다. 가장 기본적이고 중요한 부분임에도 불구하고 프로그래밍을 공부하는 많은 사람들이 소홀히 생각하는 부분이다. 이 기회에 필자의 강좌를 통해 다시 한번 자바의 컬렉션 프레임워크에 대해 깊이 있는 이해를 할 수 있었으면 한다. 이 강좌에선 1.4에 추가된 새로운 자료구조, 정확하게 2개의 Map 계열 클래스와 1개의 Set 계열 클래스, 총 3가지를 포함해서 그 이전에 존재하는 자료구조 클래스들 모두를 설명한다.

 

1. 자바의 자료구조 Collection Framework 의 구조

다음 그림은 java.util 패키지 안의 컬렉션 프레임워크의 인터페이스를 관계를 나타내는 UML Class Diagram 을 보여주고 있다.
아래 그림에서 실선으로 그려진 화살표는 상속(extend)을 의미한다. 또한 "::" 을 기준으로 왼쪽은 패키지, 오른쪽은 이름을 나타낸다. 네모 안의 보라색 동그라미 안에 i 라고 써있는 것은 해당 객체가 인터페이스라는 것을 의미한다. 또 컬렉션 인터페이스를 구현한 클래스들을 설명할 때 나오겠지만 점선으로 그려진 화살표는 구현(implements)을 의미하고 클래스이기 때문에 녹색 동그라미안에 C 라는 글자가 쓰여있는 것을 보게 될 것이다. (참고로 필자는 이클립스 플러그인으로 제공되는 OMANDO 라는 UML 툴을 사용했다)

그림에서 볼 수 있듯이 자바의 컬렉션 프레임워크는 크게 두가지로 구분된다. 바로 Collection 과 Map 이다. Collection 은 다시 Set 과 List 로 구분된다.

또한 아래 Class Diagram 에서 볼 수 있듯이 Collection 인터페이스를 구현한 클래스들과 연계해서 편리하게 저장된 요소(Element)들을 다룰 수 있는 2가지 인터페이스가 있다.

  • Note :: 요소(Element) 는 객체로 생각해도 무방하다. 그 이유는 자바의 컬렉션 프레임워크의 구성 클래스들에 저장하거나 꺼내오는 요소의 타입이 객체의 최상위 타입인 Object 이기 때문이다. 따라서 int 등의 primary type 데이터는 랩퍼(Wrapper) 클래스로 감싸서 넣어야 한다. 예를 들어, int 의 경우엔 Integer 로 감싸서 클래스로 만들어 넣는 것이다. 아래 컬렉션 계열 인터페이스들을 보면 추가-삭제 메소드들의 파라미터와 리턴값이 모두 Object 인 것을 확인할 수 있을 것이다.

  • Issue :: J2SDK1.5 에선 primary type 도 랩퍼 클래스로 감싸지 않고 자동으로 컬렉션 클래스들에 넣어도 되는 auto-boxing 기능을 제공해 줄 예정이다.(내부에서 자동으로 적절한 타입으로 변환시켜 주게 됨) 참고로 C# 에선 이미 auto-boxing 기능이 제공되고 있다. auto-boxing 에 대한 자세한 내용은 이 글의 후반부에 다루도록 하겠다.

항상 숲과 나무를 같이 볼 수 있는 시야를 갖추어야 무엇이든 제대로, 깊이 있게 이해할 수 있다. 따라서 다시 한번 위에 있는 자바의 컬렉션 프레임워크의 전체 구조를 표현한 Class Diagram 을 살펴보도록 하자. 각 인터페이스들에 대한 자세한 설명은 아래 부분에서 하도록 하겠다.

Top

2. Collection Framework 인터페이스들과 클래스들

그럼 이제 자바의 자료구조인 Collection, Set, List, Map 등은 어떤 특징에 따라 구분한 것인지를 알아보겠다. 아래의 표에 각각의 특성을 정리해놨다. 아래 표를 주의 깊게 보도록 하자.

Package

Definition

 java.util.Collection

 순서 없는 단순한 요소들의 집합

 java.util.Set

 중복을 허용하지 않는 요소들의 집합

 java.util.List

 순차적 나열, 순서지정 가능한 요소들의 집합

 java.util.Map

 Key와 Key에 대응하는 값으로 이루어진 구조

 java.util.SortedSet

 값들이 정렬된 Set

 java.util.SortedMap

 key 가 정렬된 Map

그럼 먼저 Collection 인터페이스를 구현한 어떤 클래스들이 존재하는지 Set, List 로 나눠서 살펴보자. 아래의 표는 Collection 의 구성을 표현한 표다. 표에서 인터페이스와 해당 인터페이스를 구현한 실제 클래스들를 보여주고 있다.

Interface Implementation

Collection 

 Set HashSet LinkedHashSet TreeSet
 List ArrayList LinkedList Vector Stack

아래의 표는 Map 인터페이스를 구현한 클래스들이다. 역시 인터페이스와 그 구현 클래스들을 보여주고 있다.

Interface

Implementation

Map HashMap LinkedHashMap IdentityHashMap WeakHashMap Hashtable TreeMap

이제 해당 인터페이스와 그 구현 클래스들의 특징이 어떤 것이고 어떻게 사용되는를 자세히 살펴보도록 하겠다.

Top

2-1. Collection 인터페이스

우선 먼저 Collection 인터페이스를 살펴보도록 하자.

    package java.util;

    public interface Collection {
        // Query Operations
        int size();
        boolean isEmpty();
        boolean contains(Object o);
        Iterator iterator();
        Object[] toArray();
        Object[] toArray(Object a[]);

        // Modification Operations
        boolean add(Object o);
        boolean remove(Object o);

        // Bulk Operations
        boolean containsAll(Collection c);
        boolean addAll(Collection c);
        boolean removeAll(Collection c);
        boolean retainAll(Collection c);
        void clear();

        // Comparison and hashing
        boolean equals(Object o);
        int hashCode();
    }
 

위 코드에서 주석으로 설명된 부분에서 알 수 있듯이 기능에 따라 4가지 분류의 메소드들로 나눌 수 있다. 그럼 각 기능에 따른 메소드들을 자주 사용되는 것들 위주로 간단히 살펴보도록 하겠다.

첫번째로 쿼리(Query) 오퍼레이션들을 살펴보자. 쿼리 오퍼레이션은 컬렉션 안에 저장된 요소의 개수(size() 메소드)나 저장된 요소가 있는지(isEmpty() 메소드), 컬렉션 안에 해당 메소드 안에 파라미터로 전달한 Object 요소가 들어있는지(contains(Object o) 메소드) 등의 여부를 질의하는 메소드들의 분류다. 나중에 예제 소스에서도 살펴보겠지만 iterator() 메소드는 컬렉션 안에 저장된 요소들을 Iterator 에 순차적으로 저장한 후 그 Iterator 객체를 리턴해준다.

두번째는 변경(Modification) 오퍼레이션들이다. 메소드 이름만으로도 쉽게 알 수 있듯이 하나의 요소를 컬렉션에 추가(add(Object o)), 삭제(remove(Object o)) 하는 메소드들이다.

세번째는 대량으로 요소의 변경을 가하는 오퍼레이션들이다. 여기서 상당히 간편하게 사용될 수 있는 addAll(Collection c) 메소드가 있는데 이것은 파라미터로 들어온 컬렉션 객체가 갖고 있는 요소들 모두를 저장하는 메소드이고 removeAll(Collection c) 메소드는 반대로 파라미터로 들어온 컬렉션 객체가 갖고 있는 요소들 모두를 제거한다. 이외에 clear() 메소드는 해당 컬렉션 객체의 모든 요소를 전부 제거한다.

마지막으로 비교(Comparison) 및 해싱(Hashing)을 위한 오퍼레이션들을 정의하는 메소드다. 자주 쓰이지 않으므로 별도의 언급은 하지 않겠다.

Top

2-2. Set 인터페이스와 구현 클래스들

Set 인터페이스를 살펴보자. Collection 인터페이스를 상속하므로 큰 차이점은 없고 단지 "Set" 은 중복을 허용하지 않는 자료구조였다는 것을 다시 한번 기억하도록 하자.

    package java.util;

    public interface Set extends Collection {
        // Query Operations
        int size();
        boolean isEmpty();
        boolean contains(Object o);
        Iterator iterator();
        Object[] toArray();
        Object[] toArray(Object a[]);

        // Modification Operations
        boolean add(Object o);
        boolean remove(Object o);

        // Bulk Modification Operations
        boolean containsAll(Collection c);
        boolean addAll(Collection c);
        boolean removeAll(Collection c);
        boolean retainAll(Collection c);
        void clear();

        // Comparison and hashing
        boolean equals(Object o);
        int hashCode();
    }
 

위 코드를 보면 Collection 과 동일한 메소드만을 제공해주는 것을 볼 수 있다. 단지 구현 클래스 내부에 equals(Object o) 메소드를 이용해서 중복을 허용하지 않도록 체크하는 기능이 더해져 있다.

그럼 이제부터 Set 을 구현한 클래스들을 살펴보도록 하겠다.

2-2-1. HashSet

 

2-2-2. LinkedHashSet(1.4에서 추가)

 

2-2-3. TreeSet

 

Top

2-3. List 인터페이스와 구현 클래스들

List 인터페이스는 순서 붙일 수 있는 컬렉션이다. 이 인터페이스의 사용자는 List 내의 어디에 각 요소가 삽입될까를 정밀하게 제어 할 수 있다. 사용자는 정수값의 인덱스(List 내의 위치)에 의해 요소에 액세스(access) 하거나 List 내의 요소를 검색할 수가 있다. Set 과는 다르게, 보통 일반적으로 List는 중복하는 요소를 허가한다.

    package java.util;

    public interface List extends Collection {
        // Query Operations
        int size();
        boolean isEmpty();
        boolean contains(Object o);
        Iterator iterator();
        Object[] toArray();
        Object[] toArray(Object a[]);

        // Modification Operations
        boolean add(Object o);
        boolean remove(Object o);

        // Bulk Modification Operations
        boolean containsAll(Collection c);
        boolean addAll(Collection c);
        boolean addAll(int index, Collection c);
        boolean removeAll(Collection c);
        boolean retainAll(Collection c);
        void clear();

        // Comparison and hashing
        boolean equals(Object o);
        int hashCode();

        // Positional Access Operations
        Object get(int index);
       Object set(int index, Object element);
       void add(int index, Object element);
       Object remove(int index);
        // Search Operations
        int indexOf(Object o);
       int lastIndexOf(Object o);


        // List Iterators
        ListIterator listIterator();
       ListIterator listIterator(int index);


        // View
        List subList(int fromIndex, int toIndex);
    }
 

Collection 인터페이스에서 제공해주던 메소드들에 List 인터페이스의 특징인 특정 위치의 요소를 찾거나 특정 위치에 요소를 추가하는 등의 메소드들이 추가되었다. 메소드 이름이 워낙 일관되고 명확하게 잘 지어져 있기 때문에(필자가 자바를 좋아하는 이유 중 하나) 메소드 이름만으로도 대강 어떤 역할을 하는지 짐작할 수 있을 것이다. List 인터페이스에서 추가된 메소드들은 Bold 를 주어 표현해놨다.

2-3-1. ArrayList

 

2-3-2. LinkedList

 

2-3-3. Vector

 

2-3-4. Stack

 

Top

2-4. Map 인터페이스와 구현 클래스들

Map 인터페이스는 키(key)를 값(value)에 매핑(mapping) 한다. 또한 Map은 동일한 키를 복수 등록할 수 없고 각 키는 1 개의 값밖에 매핑 할 수 없다. 즉, 하나의 키 값에 대응하는 하나의 값을 갖는 자료구조다.

    package java.util;

    public interface Map {
         // Query Operations
        int size();
        boolean isEmpty();
         boolean containsKey(Object key);
        boolean containsValue(Object value);
        Object get(Object key);

         // Modification Operations
        Object put(Object key, Object value);
        Object remove(Object key);

        // Bulk Modification Operations
        void putAll(Map t);
         void clear();

         // Views
        Set keySet();
        Collection values();
        Set entrySet();
        interface Entry {
            Object getKey();
            Object getValue();
            Object setValue(Object value);
            boolean equals(Object o);
             int hashCode();
        }

         // Comparison and hashing
        boolean equals(Object o);
        int hashCode();
    }
 

// 설명

2-4-1. HashMap

 

2-4-2. LinkedHashMap(1.4에서 추가)

 

2-4-3. IdentityHashMap(1.4에서 추가)

 

2-4-4. WeakHashMap

 

2-4-5. Hashtable

 

2-4-6. TreeMap

 

Top

2-5. Enumeration 와 Iterator 인터페이스

Collection Framework 에는 Enumeration 와 Iterator 라는 인터페이스가 있다. 사전적인 의미로는 반복, 순환이라는 뜻을 지니고 있다. 어떤 객체들의 모임이 있을 때(Collection 계열 구현 클래스들, Collection 인터페이스에 iterator() 메소드가 있었음을 기억해라) 이 객체들을 어떤 순서에 의해서 하나씩 꺼내 쓰기 위한 인터페이스라고 할 수 있다. 원래 Java 2 이전는 Enumeration 이라는 인터페이스가 많이 사용되었지만 최근에는 Iterator 인터페이스가 더 많이 사용된다. 그 이유는 각 인터페이스를 살펴보며 알아보기로 하겠다.

2-5-1. Enumeration

아래의 Enumeration 인터페이스의 코드를 보자.

    package java.util;

    public interface Enumeration {
         boolean hasMoreElements();
        Object nextElement();
    }
 

이 인터페이스는 단지 두개의 메소드만을 제공한다. 이 인터페이스의 사용은 상당히 간단하다. hasMoreElements() 메소드로 인터페이스 안에 다음 요소가 있는지를 질의한다. 만약 true 가 리턴되었다면(다음 인덱스에 요소가 있다는 의미) nextElement() 메소드로 다음 요소를 꺼내서 사용하면 되는 것이다.

java.util.StringTokenizer 클래스가 Enumeration 인터페이스를 구현하고 있다. 따라서 StringTokenizer 클래스가 제공하는 메소드들 중에서 Enumeration 에서 정의한 2개의 메소드가 제공되는 것을 볼 수 있을 것이다.

2-5-2. Iterator

아래의 코드는 Iterator 인터페이스다.

    package java.util;

    public interface Iterator {
         boolean hasNext();
        Object next();
        void remove();
    }
 

Enumeration 과의 차이점은 단지 remove() 메소드가 추가된 것 뿐이다. hasNext() 와 next() 메소드는 이름만 약간 다를 뿐 Enumeration 인터페이스의 hasMoreElements() 와 nextElement() 와 정확히 일치하는 기능을 한다.

그럼 왜 Enumeration 대신 Iterator 를 Java 2에서 추가해서 사용할까? 그것은 Enumeration 인터페이스는 집합 내에서 요소를 제거할 방법이 없기 때문이다. 그것을 보완하기 위해 나온 것이 Iterator 인터페이스다.

Top

3. J2SDK1.5 에서 추가될 auto-boxing 과 generic

 

Top

4. 자주 사용되는 컬렉션 객체들의 퍼포먼스 표

4-1. Set 객체

  동기화 설명
HashSet no 가장 빠른 집합. HashMap 보다 느리지만 Set 인터페이스를 구현하고 있다. HashMap 은 Set 이 아니라 Map 임.
TreeSet no HashSet보다 느리다. 차례대로 키를 사용할 수 있다. (키가 정렬됨)

4-2. Map 객체

  동기화 설명
HashMap no 가장 빠른 매핑.
Hashtable yes HashMap 보다 느리지만 동기화한 HashMap 보다 빠르다.
TreeMap no Hashtable 과 HashMap 보다 느리다. 차례대로 키를 사용할 수 있다. (키가 정렬됨)

4-3. List 객체

  동기화 설명
ArrayList no 가장 빠른 리스트.
LinkedList no 다른 리스트보다 느리지만 큐로 이용했을 경우 더 빠를 수도 있다. 느린 이유는 ArrayList 나 Vector, Stack 과 달리 array 계열이 아니기 때문.
Vector yes ArrayList 보다 느리지만 동기화한 ArrayList 보다 빠르다.
Stack yes Vector 와 동일한 속도. LIFO 큐 기능을 제공한다.

필자생각 :: HashMap, ArrayList 에 동기화를 걸어 사용하는것 보다 동기화된 Hashtable, Vector 를 사용하는 것이 더 빠른것으로 미루어 짐작컨데 Hashtable, Vector 경우에는 동기화가 되어 있는 내부 메소드들이 JIT 컴파일러에 의해 최적화 되는음.

Top

5. 효율적인 컬렉션 객체들의 사용

*** Vector-Hashtable vs ArrayList-HashMap ***
보통 일반적으로 Vector 와 Hashtable 을 주로 사용하고 있을 것이다.
컬렉션 객체들은 모든 메소드가 synchronized 되어 있기 때문에 동시에 여러 스레드가 접근 할 수 없.

반명 동일한 기능을 하는데도 불구하고 ArrayList 와 HashMap 은 메소드가 synchronized 로 되어있지 않아서 스레드들이
해당 객체에 동시접근이 가능다.

은행에서 현금 입출금에 관련된것처럼 반드시 미션크리티컬한 로직이 필요한 곳에선
VectorHashtable을 사용하는게 바람직하고 당연하지만 필자는 초보 분들이 프로그래밍한 코드에서 멀티스레드 접근을 해도 무방한데도 불구하고 모두 Vector니면 Hashtable을 사용하는 것을 많이 봐왔다. 이건 특히나 jsp 처럼 시간을 다투는 프로그램에선 치명타. 동기화가 필요한지 아닌지를 잘 판단해서 정확히 필요한 곳에만 Vector나 Hashtable을 사용하고 그 이외의 부분에선 ArrayList HashMap 을 사용해야 할 것이다.

이미 다 아는 얘기라고 하실지도 모르겠지만 모르시는 분들이 너무 많아서 다시 한번 언급해봤다.

필자의 경우에는 효율을 좀 더 높이기 위해 동기화가 필요한 부분도 ArrayList 나 HashMap 에다가 락을 걸어서 멀티스레드의 폐해를 피해가는 방식을 사용하고 있다. 모든 경우에 이렇게 한다는 것은 아니고 예를 들어 데이터를 넣는 부분은 멀티스레드 접근이 허용되지만 데이터를 꺼낸 후 삭제해야 하는 부분은 동기화가 필요하다고 가정했을 때 동기화가 필요한 "데이터를 꺼낸 후 삭제" 하는부분에만 락을 걸어서 동기화 블럭을 최소화시켜서 좀 더 효율을 가져간다는 것이다.

데이터를
컬렉션 객체에 넣(put) 가져오고(get) 삭제하는(remove) 등의 모든 부분에 동기화가 필요하다면 당연히 그냥 이미 그런 용도로 만들어진 VectorHashtable 을 사용하는 것이 편하 또 이렇게 사용 하는 것이 ArrayList HashMap 의 모든 메소드에 락을 걸어 사용하는 것보다 더 빠르다.

Top

6. 아쉬움을 남긴채 강좌를 마무리하며

자바의 컬렉션 프레임워크는 매년 자바의 가장 훌륭한 라이브러리로 선정되는 파트다. 그만큼 설계적인 측면에서나 구현적인 측면에서 배울 것이 많은 부분이다. 필자는 지금까지 바로 이 자바의 컬렉션 프레임워크에 대해 설명을 했다. 하지만 아쉬움이 남는다. 그 이유는 필자가 "물고기 잡는 법"을 가르쳐 준 것이 아니라 물고기를 잡아서 준 것이기 때문이다. 즉, 어떻게 이런 자료구조(구현 클래스들)를 만들지에 대한 강좌가 아니라 단순히 만들어진 자료구조를 어떻게 이용하는지에 초점을 맞춰서 설명했다는 것이다.

필자가 독자분들에게 한가지 당부를 한다면 이미 만들어져 있는 api 를 단순히 이용하기 보다는 직접 만들어서 사용할 수 있는 능력을 키우라는 것이다. 그게 진정 창조적인 그리고 프로페셔널한 개발자가 되기 위한 길이라고 필자는 생각한다. 따라서 우선 독자분들은 컬렉션 프레임워크의 구현 클래스들이 어떻게 만들어졌는지를 직접 J2SDK 폴더 안의 src.zip 파일의 압축을 풀어서 분석해봤으면 한다. 그리고 나름대로 직접 그런 자료구조를 구현하기 위한 방법들도 생각해보고 가능하다면 직접 구현해보았으면 한다. 그럼 이제 결코 짧지 않았던 컬렉션 프레임워크 강좌를 마무리하겠다.

Posted by 용식