- 1 1. Set คืออะไร?
- 2 2. สเปคพื้นฐานและประโยชน์ของ Set
- 3 3. คลาสการใช้งานหลักและลักษณะเฉพาะของแต่ละคลาส
- 4 4. วิธีการทั่วไปและวิธีการใช้งาน
- 5 5. Common Use Cases and Typical Scenarios
- 6 6. Performance Considerations and Pitfalls
- 7 7. Comparison Chart (Overview)
- 8 8. Frequently Asked Questions (FAQ)
- 9 9. Conclusion
1. Set คืออะไร?
ในโปรแกรมมิ่ง Java, Set เป็นหนึ่งในประเภทคอลเลกชันที่สำคัญที่สุด คำว่า “Set” มาจากคณิตศาสตร์ และเช่นเดียวกับเซตในคณิตศาสตร์ มันมีลักษณะสำคัญที่ ไม่สามารถมีสมาชิกซ้ำกันได้.
Set ใช้เมื่อคุณต้องการจัดการเฉพาะ ค่าที่ไม่ซ้ำกัน ไม่ว่าจะเป็นประเภทข้อมูลเป็นตัวเลข, สตริง, หรืออ็อบเจกต์.
ความแตกต่างระหว่าง Set กับ List?
Java Collections Framework มีโครงสร้างข้อมูลหลายแบบ เช่น List และ Map ในบรรดาเหล่านั้น Set และ List มักถูกเปรียบเทียบ ความแตกต่างหลักของพวกมันมีดังต่อไปนี้:
- List : อนุญาตให้มีค่าซ้ำและรักษาลำดับของสมาชิก (ตามดัชนี).
- Set : ไม่อนุญาตให้มีค่าซ้ำ และลำดับของสมาชิกไม่รับประกัน (ยกเว้นการใช้งานบาง implementation).
โดยสรุป List คือ “คอลเลกชันที่มีลำดับ” ในขณะที่ Set คือ “คอลเลกชันของสมาชิกที่ไม่ซ้ำกัน”.
ตัวอย่างเช่น หากคุณต้องการจัดการ ID ของผู้ใช้โดยไม่มีการซ้ำซ้อน Set จะเป็นตัวเลือกที่เหมาะสม.
ข้อดีของการใช้ Set
- การกำจัดค่าซ้ำโดยอัตโนมัติ แม้จะได้รับข้อมูลจำนวนมากจากผู้ใช้ เพียงแค่เพิ่มสมาชิกลงใน Set ก็รับประกันว่าค่าซ้ำจะถูกเก็บเพียงครั้งเดียว ซึ่งช่วยลดความจำเป็นในการตรวจสอบค่าซ้ำด้วยตนเองและทำให้การทำงานง่ายขึ้น.
- การค้นหาและการลบที่มีประสิทธิภาพ Set ถูกออกแบบให้ทำการตรวจสอบการมีอยู่และการลบได้อย่างรวดเร็ว แม้ว่าประสิทธิภาพจะแตกต่างกันตาม implementation (เช่น HashSet หรือ TreeSet).
ควรใช้ Set เมื่อใด?
- เมื่อจัดการข้อมูลที่ ต้องไม่ซ้ำกัน เช่น ที่อยู่อีเมลของผู้ใช้หรือ ID
- เมื่อต้องการรับประกันความเป็นเอกลักษณ์ของข้อมูล
- เมื่อคุณต้องการสร้างรายการของค่าที่ไม่ซ้ำกันจากชุดข้อมูลขนาดใหญ่อย่างมีประสิทธิภาพ
ดังที่แสดงข้างต้น Set เป็นกลไกมาตรฐานใน Java สำหรับการจัดการคอลเลกชันที่ไม่อนุญาตให้มีค่าซ้ำอย่างชาญฉลาด.
ในส่วนต่อไปนี้ เราจะสำรวจสเปคของ Set, รูปแบบการใช้งาน, และตัวอย่างโค้ดที่เป็นรูปธรรมอย่างละเอียด.
2. สเปคพื้นฐานและประโยชน์ของ Set
ใน Java, Set ถูกกำหนดโดยอินเทอร์เฟซ java.util.Set. การทำให้คลาสทำตามอินเทอร์เฟซนี้ทำให้คุณสามารถแสดงคอลเลกชันของสมาชิกที่ไม่ซ้ำกันโดยไม่มีค่าซ้ำ. มาดูสเปคหลักและข้อได้เปรียบของ Set อย่างละเอียด.
ลักษณะพื้นฐานของอินเทอร์เฟซ Set
Set มีลักษณะดังต่อไปนี้:
- ไม่มีสมาชิกซ้ำ หากคุณพยายามเพิ่มสมาชิกที่มีอยู่แล้ว มันจะไม่ถูกเพิ่ม ตัวอย่างเช่น แม้คุณจะเรียก
set.add("apple")สองครั้ง ก็จะมี “apple” เก็บเพียงหนึ่งรายการ. - ลำดับไม่รับประกัน (ขึ้นกับการทำงาน) Set ไม่รับประกันลำดับของสมาชิกโดยค่าเริ่มต้น อย่างไรก็ตาม implementation บางอย่างเช่น
LinkedHashSetและTreeSetจะจัดการสมาชิกในลำดับที่กำหนด. - การจัดการกับสมาชิก null การอนุญาตให้มีค่า null ขึ้นอยู่กับ implementation ตัวอย่างเช่น
HashSetอนุญาตให้มีสมาชิก null หนึ่งค่า ในขณะที่TreeSetไม่อนุญาต.
ความสำคัญของ equals และ hashCode
ว่าสมาชิกสองตัวจะถือเป็นค่าซ้ำใน Set หรือไม่ จะกำหนดโดยเมธอด equals และ hashCode.
เมื่อใช้คลาสที่กำหนดเองเป็นสมาชิกของ Set หากไม่ทำการ override เมธอดเหล่านี้อย่างถูกต้องอาจทำให้เกิดค่าซ้ำที่ไม่คาดคิดหรือพฤติกรรมการจัดเก็บที่ไม่ถูกต้อง.
equals: กำหนดว่าสองอ็อบเจกต์เท่ากันในเชิงตรรกะหรือไม่hashCode: คืนค่าตัวเลขที่ใช้สำหรับการระบุอย่างมีประสิทธิภาพ
ประโยชน์ของการใช้ Set
Set มีข้อได้เปรียบเชิงปฏิบัติดังนี้:
- การกำจัดค่าซ้ำอย่างง่าย เพียงแค่เพิ่มค่าเข้า Set ก็รับประกันว่าค่าซ้ำจะถูกลบโดยอัตโนมัติ ลดความจำเป็นในการตรวจสอบด้วยตนเอง.
- การค้นหาและการลบที่มีประสิทธิภาพ Implementation เช่น
HashSetให้การค้นหาและการลบที่รวดเร็ว มักจะทำงานดีกว่า List. - API ที่เรียบง่ายและเข้าใจง่าย เมธอดพื้นฐานเช่น
add,removeและcontainsทำให้การใช้ Set ง่าย.
การทำงานภายในและประสิทธิภาพ
หนึ่งในการใช้งาน Set ที่พบบ่อยที่สุด, HashSet, ใช้ HashMap ภายในเพื่อจัดการองค์ประกอบ. สิ่งนี้ทำให้การเพิ่ม, ลบ, และค้นหาองค์ประกอบทำได้ด้วยความซับซ้อนเวลาเฉลี่ย O(1).
หากต้องการการจัดลำดับหรือการเรียงลำดับ, คุณสามารถเลือกการใช้งานเช่น LinkedHashSet หรือ TreeSet ตามความต้องการของคุณ.
3. คลาสการใช้งานหลักและลักษณะเฉพาะของแต่ละคลาส
Java มีการใช้งานหลักหลายแบบของอินเทอร์เฟซ Set. แต่ละแบบมีลักษณะเฉพาะที่แตกต่างกัน, ดังนั้นการเลือกแบบที่เหมาะสมกับกรณีการใช้งานของคุณจึงสำคัญ.
ที่นี่, เราจะอธิบายสามการใช้งานที่พบบ่อยที่สุด: HashSet, LinkedHashSet, และ TreeSet.
HashSet
HashSet เป็นการใช้งาน Set ที่พบบ่อยที่สุด.
- ลักษณะเฉพาะ
- ไม่รักษาลำดับขององค์ประกอบ (ลำดับการแทรกและลำดับการวนอาจแตกต่างกัน).
- ใช้
HashMapภายใน, ให้ การเพิ่ม, ค้นหา, และลบที่เร็ว. - อนุญาตให้มีองค์ประกอบ
nullเพียงหนึ่งตัว. - กรณีการใช้งานทั่วไป
- เหมาะเมื่อคุณต้องการกำจัดข้อมูลซ้ำและลำดับไม่สำคัญ.
- ตัวอย่างโค้ด
Set<String> set = new HashSet<>(); set.add("apple"); set.add("banana"); set.add("apple"); // Duplicate is ignored for (String s : set) { System.out.println(s); // Only "apple" and "banana" are printed }
LinkedHashSet
LinkedHashSet ขยายฟังก์ชันของ HashSet โดย รักษาลำดับการแทรก.
- ลักษณะเฉพาะ
- องค์ประกอบจะถูกวนตามลำดับที่ถูกแทรก.
- จัดการภายในโดยใช้การผสมผสานของตารางแฮชและลิงก์ลิสต์.
- ช้ากว่า
HashSetเล็กน้อย, แต่มีประโยชน์เมื่อลำดับสำคัญ. - กรณีการใช้งานทั่วไป
- เหมาะที่สุดเมื่อคุณต้องการกำจัดข้อมูลซ้ำพร้อมคงลำดับการแทรก.
- ตัวอย่างโค้ด
Set<String> set = new LinkedHashSet<>(); set.add("apple"); set.add("banana"); set.add("orange"); for (String s : set) { System.out.println(s); // Printed in order: apple, banana, orange }
TreeSet
TreeSet เป็นการใช้งาน Set ที่ทำการ เรียงลำดับองค์ประกอบโดยอัตโนมัติ.
- ลักษณะเฉพาะ
- ใช้ Red-Black Tree ภายใน (โครงสร้างต้นไม้ที่สมดุล).
- องค์ประกอบจะถูกเรียงลำดับโดยอัตโนมัติในลำดับจากน้อยไปมาก.
- สามารถกำหนดลำดับแบบกำหนดเองได้โดยใช้
ComparableหรือComparator. - ไม่อนุญาตค่า
null. - กรณีการใช้งานทั่วไป
- มีประโยชน์เมื่อคุณต้องการความเป็นเอกลักษณ์และการเรียงลำดับอัตโนมัติพร้อมกัน.
- ตัวอย่างโค้ด
Set<Integer> set = new TreeSet<>(); set.add(30); set.add(10); set.add(20); for (Integer n : set) { System.out.println(n); // Printed in order: 10, 20, 30 }
สรุป
- HashSet : เหมาะที่สุดสำหรับประสิทธิภาพสูงเมื่อไม่ต้องการลำดับ
- LinkedHashSet : ใช้เมื่อลำดับการแทรกสำคัญ
- TreeSet : ใช้เมื่อจำเป็นต้องมีการเรียงลำดับอัตโนมัติ
การเลือกการใช้งาน Set ที่เหมาะสมขึ้นอยู่กับความต้องการเฉพาะของคุณ. เลือกตัวที่เหมาะสมที่สุดและใช้มันอย่างมีประสิทธิภาพ.
4. วิธีการทั่วไปและวิธีการใช้งาน
อินเทอร์เฟซ Set มีเมธอดต่าง ๆ สำหรับการดำเนินการกับคอลเลกชัน. ด้านล่างเป็นเมธอดที่ใช้บ่อยที่สุด, พร้อมอธิบายด้วยตัวอย่าง.
เมธอดหลัก
add(E e)เพิ่มองค์ประกอบลงใน Set. หากองค์ประกอบนั้นมีอยู่แล้วจะไม่ถูกเพิ่ม.remove(Object o)ลบองค์ประกอบที่ระบุออกจาก Set. คืนค่า true หากสำเร็จ.contains(Object o)ตรวจสอบว่า Set มีองค์ประกอบที่ระบุหรือไม่.size()คืนค่าจำนวนองค์ประกอบใน Set.clear()ลบองค์ประกอบทั้งหมดจาก Set.isEmpty()ตรวจสอบว่า Set ว่างหรือไม่.iterator()คืนค่า Iterator เพื่อวนผ่านองค์ประกอบ.toArray()แปลง Set เป็นอาเรย์.
ตัวอย่างการใช้งานพื้นฐาน
Set<String> set = new HashSet<>();
// Add elements
set.add("apple");
set.add("banana");
set.add("apple"); // Duplicate ignored
// Get size
System.out.println(set.size()); // 2
// Check existence
System.out.println(set.contains("banana")); // true
// Remove element
set.remove("banana");
System.out.println(set.contains("banana")); // false
// Clear all elements
set.clear();
System.out.println(set.isEmpty()); // true
Iterating Over a Set
Since Set does not support index-based access (e.g., set.get(0)), use an Iterator or enhanced for-loop.
// Enhanced for-loop
Set<String> set = new HashSet<>();
set.add("A");
set.add("B");
set.add("C");
for (String s : set) {
System.out.println(s);
}
// Using Iterator
Iterator<String> it = set.iterator();
while (it.hasNext()) {
String s = it.next();
System.out.println(s);
}
Important Notes
- Adding an existing element using
adddoes not change the Set. - Element order depends on the implementation (HashSet: unordered, LinkedHashSet: insertion order, TreeSet: sorted).
5. Common Use Cases and Typical Scenarios
Java Sets are widely used in many situations where duplicate values must be avoided. Below are some of the most common and practical use cases encountered in real-world development.
Creating a Unique List (Duplicate Removal)
When you want to extract only unique values from a large dataset, Set is extremely useful.
For example, it can automatically remove duplicates from user input or existing collections.
Example: Creating a Set from a List to Remove Duplicates
List<String> list = Arrays.asList("apple", "banana", "apple", "orange");
Set<String> set = new HashSet<>(list);
System.out.println(set); // [apple, banana, orange]

Ensuring Input Uniqueness
Sets are ideal for scenarios where duplicate values must not be registered, such as user IDs or email addresses.
You can immediately determine whether a value already exists by checking the return value of add.
Set<String> emailSet = new HashSet<>();
boolean added = emailSet.add("user@example.com");
if (!added) {
System.out.println("This value is already registered");
}
Storing Custom Classes and Implementing equals/hashCode
When storing custom objects in a Set, proper implementation of equals and hashCode is essential.
Without them, objects with the same logical content may be treated as different elements.
Example: Ensuring Uniqueness in a Person Class
class Person {
String name;
Person(String name) {
this.name = name;
}
@Override
public boolean equals(Object obj) {
if (this == obj) return true;
if (obj == null || getClass() != obj.getClass()) return false;
Person person = (Person) obj;
return Objects.equals(name, person.name);
}
@Override
public int hashCode() {
return Objects.hash(name);
}
}
// Example usage
Set<Person> people = new HashSet<>();
people.add(new Person("Taro"));
people.add(new Person("Taro")); // Without proper implementation, duplicates may occur
System.out.println(people.size()); // 1
Fast Lookup and Data Filtering
Because Set provides fast lookups via contains, it is often used for filtering and comparison tasks.
Converting a List to a Set can significantly improve performance when repeatedly checking for existence.
Example: Fast Keyword Lookup
Set<String> keywordSet = new HashSet<>(Arrays.asList("java", "python", "c"));
boolean found = keywordSet.contains("python"); // true
6. Performance Considerations and Pitfalls
While Set is a powerful collection for managing unique elements, improper usage can lead to unexpected behavior or performance issues. This section explains key performance characteristics and common pitfalls.
Performance Differences by Implementation
- HashSet ใช้ hash table ภายใน ให้ประสิทธิภาพ เฉลี่ย O(1) สำหรับการเพิ่ม ลบ และค้นหา ประสิทธิภาพอาจลดลงหากจำนวนองค์ประกอบมากเกินไปหรือเกิด hash collisions บ่อยครั้ง
- LinkedHashSet ประสิทธิภาพคล้าย HashSet แต่มี overhead เพิ่มเติม เนื่องจากรักษาลำดับการแทรก ในกรณีส่วนใหญ่ ความแตกต่างไม่สำคัญเว้นแต่จัดการข้อมูลขนาดใหญ่มาก
- TreeSet ใช้ Red-Black Tree ภายใน ส่งผลให้ประสิทธิภาพ O(log n) สำหรับการเพิ่ม ลบ และค้นหา ช้ากว่า HashSet แต่ให้การเรียงลำดับอัตโนมัติ
Using Mutable Objects as Set Elements
ต้องระมัดระวังเป็นพิเศษเมื่อเก็บ mutable objects ใน Set
HashSet และ TreeSet พึ่งพาค่า hashCode หรือ compareTo เพื่อจัดการองค์ประกอบ
หากค่าพวกนี้เปลี่ยนหลังจากการแทรก การค้นหาและลบอาจล้มเหลว
Example: Pitfall with Mutable Objects
Set<Person> people = new HashSet<>();
Person p = new Person("Taro");
people.add(p);
p.name = "Jiro"; // Modifying after insertion
people.contains(p); // May return false unexpectedly
เพื่อหลีกเลี่ยงปัญหานี้ แนะนำอย่างยิ่งให้ใช้ immutable objects เป็นองค์ประกอบของ Set เสมอเมื่อเป็นไปได้
Handling null Values
- HashSet / LinkedHashSet : อนุญาต null element หนึ่งตัว
- TreeSet : ไม่อนุญาต null (โยน NullPointerException)
Other Important Notes
- Modification during iteration การแก้ไข Set ขณะวนซ้ำอาจทำให้เกิด
ConcurrentModificationExceptionใช้Iterator.remove()แทนการแก้ไข Set โดยตรง - Choosing the right implementation ใช้
LinkedHashSetหรือTreeSetเมื่อลำดับสำคัญHashSetไม่รับประกันลำดับ
7. Comparison Chart (Overview)
ตารางด้านล่างสรุปความแตกต่างระหว่าง implementation หลักของ Set เพื่อการเปรียบเทียบที่ง่าย
| Implementation | No Duplicates | Order Preserved | Sorted | Performance | null Allowed | Typical Use Case |
|---|---|---|---|---|---|---|
| HashSet | Yes | No | No | Fast (O(1)) | One allowed | Duplicate removal, order not required |
| LinkedHashSet | Yes | Yes (Insertion order) | No | Slightly slower than HashSet | One allowed | Duplicate removal with order preservation |
| TreeSet | Yes | No | Yes (Automatic) | O(log n) | Not allowed | Duplicate removal with sorting |
Key Takeaways
- HashSet : ตัวเลือกเริ่มต้นเมื่อลำดับไม่สำคัญและประสิทธิภาพสำคัญ
- LinkedHashSet : ดีที่สุดเมื่อต้องรักษาลำดับการแทรก
- TreeSet : เหมาะสมเมื่อต้องการการเรียงลำดับอัตโนมัติ
8. Frequently Asked Questions (FAQ)
Q1. Can primitive types (int, char, etc.) be used in a Set?
A1. ไม่ ใช้ wrapper classes เช่น Integer หรือ Character แทน
Q2. What happens if the same value is added multiple times?
A2. เก็บเฉพาะการแทรกครั้งแรก add method คืนค่า false หากองค์ประกอบมีอยู่แล้ว
Q3. When should I use List vs Set?
A3. ใช้ List เมื่อลำดับหรือ duplicates สำคัญ และ Set เมื่อต้องการ uniqueness
Q4. What is required to store custom objects in a Set?
A4. Override equals และ hashCode อย่างถูกต้อง
Q5. How can I preserve insertion order?
A5. ใช้ LinkedHashSet
Q6. How can I sort elements automatically?
A6. ใช้ TreeSet
Q7. Can Set contain null values?
A7. HashSet และ LinkedHashSet อนุญาต null หนึ่งตัว; TreeSet ไม่
Q8. How do I get the size of a Set?
A8. ใช้ size()
Q9. How can I convert a Set to a List or array?
A9.
- To array:
toArray() - To List:
new ArrayList<>(set)
Q10. Can I remove elements while iterating?
A10. ได้ แต่ใช้เฉพาะ Iterator.remove()
9. Conclusion
บทความนี้ครอบคลุม Java Set collections จากพื้นฐานถึงการใช้งานขั้นสูง ประเด็นสำคัญรวมถึง:
- Set ออกแบบมาเพื่อจัดการ collections ของ unique elements ทำให้เหมาะสำหรับการกำจัด duplicates
- Implementation หลักรวม HashSet (เร็ว ไม่เรียง), LinkedHashSet (ลำดับการแทรก), และ TreeSet (เรียงลำดับ)
- กรณีใช้งานทั่วไปรวมการลบ duplicates, ตรวจสอบ uniqueness, จัดการ custom objects, และค้นหาเร็ว
- การเข้าใจลักษณะประสิทธิภาพและหลุมพรางเช่น mutable objects และกฎการวนซ้ำเป็นสิ่งจำเป็น
- ตารางเปรียบเทียบและ FAQ ให้คำแนะนำปฏิบัติสำหรับการพัฒนาในโลกจริง
การเชี่ยวชาญการใช้คอลเลกชัน Set ทำให้การเขียนโปรแกรม Java สะอาด ปลอดภัย และมีประสิทธิภาพมากขึ้น
ต่อไป พิจารณาการรวม Set กับ List หรือ Map เพื่อสร้างโครงสร้างข้อมูลและโซลูชันที่ซับซ้อนยิ่งขึ้น.

