MySQL ROW_NUMBER() समझाया गया (MySQL 8.0): रैंकिंग, शीर्ष‑N क्वेरीज़, और डुप्लिकेशन हटाना

1 1. परिचय
- 1.1 लक्षित पाठक
- 1.2 ROW_NUMBER() के लाभ
2 2. ROW_NUMBER() फंक्शन क्या है?
3 3. व्यावहारिक उपयोग के मामले
4 4. अन्य विंडो फ़ंक्शनों की तुलना
5 5. MySQL संस्करण 8.0 से नीचे के लिए विकल्प
6 6. सावधानियां और सर्वोत्तम प्रथाएं
7 7. निष्कर्ष

1. परिचय

MySQL संस्करण 8.0 ने कई नई सुविधाओं का परिचय दिया, और सबसे उल्लेखनीय में से एक विंडो फंक्शनों का समर्थन है। इस लेख में, हम सबसे अधिक उपयोग किए जाने वाले फंक्शनों में से एक पर ध्यान केंद्रित करेंगे: ROW_NUMBER()।

ROW_NUMBER() फंक्शन डेटा विश्लेषण और रिपोर्टिंग के लिए शक्तिशाली क्षमताएं प्रदान करता है, जो विशिष्ट शर्तों के आधार पर डेटा को सॉर्ट और रैंक करना आसान बनाता है। यह लेख बुनियादी उपयोग और व्यावहारिक उदाहरणों से लेकर पुराने MySQL संस्करणों के लिए वैकल्पिक दृष्टिकोणों तक सब कुछ समझाता है।

लक्षित पाठक

बुनियादी SQL ज्ञान वाले शुरुआती से मध्यवर्ती उपयोगकर्ता
इंजीनियर और डेटा विश्लेषक जो MySQL का उपयोग करके डेटा प्रोसेस और विश्लेषण करते हैं
कोई भी जो नवीनतम MySQL संस्करण में माइग्रेट करने पर विचार कर रहा है

ROW_NUMBER() के लाभ

यह फंक्शन आपको विशिष्ट शर्तों के आधार पर प्रत्येक पंक्ति को एक अद्वितीय संख्या आवंटित करने की अनुमति देता है। उदाहरण के लिए, आप आसानी से “बिक्री के अवरोही क्रम में रैंकिंग बनाएं” या “डुप्लिकेट डेटा निकालें और व्यवस्थित करें” जैसी क्वेरी लिख सकते हैं।

पुराने संस्करणों में, आपको अक्सर उपयोगकर्ता-परिभाषित चरों का उपयोग करके जटिल क्वेरी लिखनी पड़ती थी। ROW_NUMBER() के साथ, आपकी SQL सरल और अधिक पढ़ने योग्य हो जाती है।

इस लेख में, हम ठोस क्वेरी उदाहरणों का उपयोग करेंगे और उन्हें शुरुआती-अनुकूल तरीके से समझाएंगे। अगले अनुभाग में, हम इस फंक्शन के बुनियादी सिंटैक्स और व्यवहार को करीब से देखेंगे।

2. ROW_NUMBER() फंक्शन क्या है?

ROW_NUMBER() फंक्शन, जो MySQL 8.0 में नया जोड़ा गया है, एक प्रकार का विंडो फंक्शन है जो पंक्तियों को क्रमिक संख्याएं आवंटित करता है। यह पंक्तियों को एक विशिष्ट क्रम और/या प्रत्येक समूह के अंदर नंबरिंग कर सकता है, जो डेटा विश्लेषण और रिपोर्टिंग के लिए अत्यंत उपयोगी है। यहां हम व्यावहारिक उदाहरणों के साथ बुनियादी सिंटैक्स को विस्तार से समझाएंगे।

ROW_NUMBER() का बुनियादी सिंटैक्स

सबसे पहले, ROW_NUMBER() का बुनियादी प्रारूप निम्नलिखित है।

SELECT
    column_name,
    ROW_NUMBER() OVER (PARTITION BY group_column ORDER BY sort_column) AS row_num
FROM
    table_name;

प्रत्येक तत्व का अर्थ

ROW_NUMBER() : प्रत्येक पंक्ति को एक क्रमिक संख्या आवंटित करता है।
OVER : विंडो फंक्शन के लिए विंडो को परिभाषित करने के लिए उपयोग किया जाने वाला कीवर्ड।
PARTITION BY : निर्दिष्ट कॉलम द्वारा डेटा को समूहित करता है। वैकल्पिक। यदि छोड़ा जाए, तो सभी पंक्तियों पर नंबरिंग लागू होती है।
ORDER BY : संख्याएं आवंटित करने के लिए उपयोग किया जाने वाला क्रम निर्धारित करता है, अर्थात् सॉर्टिंग मानदंड।

बुनियादी उदाहरण

उदाहरण के लिए, मान लीजिए कि आपके पास “sales” नामक एक तालिका है जिसमें निम्नलिखित डेटा है।

employee	department	sale
A	Sales Department	500
B	Sales Department	800
C	Development Department	600
D	Development Department	700

प्रत्येक विभाग में बिक्री के अवरोही क्रम में क्रमिक संख्याएं आवंटित करने के लिए, निम्नलिखित क्वेरी का उपयोग करें।

SELECT
    employee,
    department,
    sale,
    ROW_NUMBER() OVER (PARTITION BY department ORDER BY sale DESC) AS row_num
FROM
    sales;

परिणाम

employee	department	sale	row_num
B	Sales Department	800	1
A	Sales Department	500	2
D	Development Department	700	1
C	Development Department	600	2

इस परिणाम से, आप देख सकते हैं कि प्रत्येक विभाग के अंदर बिक्री के आधार पर रैंकिंग प्रदर्शित की गई है।

PARTITION BY का उपयोग कैसे करें

उपरोक्त उदाहरण में, डेटा को “department” कॉलम द्वारा समूहित किया गया है। यह प्रत्येक विभाग के लिए एक अलग अनुक्रम आवंटित करता है।

यदि आप PARTITION BY को छोड़ देते हैं, तो नंबरिंग सभी पंक्तियों पर एक अनुक्रम के रूप में आवंटित की जाती है।

SELECT
    employee,
    sale,
    ROW_NUMBER() OVER (ORDER BY sale DESC) AS row_num
FROM
    sales;

परिणाम

employee	sale	row_num
B	800	1
D	700	2
C	600	3
A	500	4

ROW_NUMBER() की विशेषताएं और सावधानियां

अद्वितीय नंबरिंग : भले ही मान समान हों, आवंटित संख्याएं अद्वितीय होती हैं।
NULLs का हैंडलिंग : यदि ORDER BY में NULLs शामिल हैं, तो वे आरोही क्रम में पहले और अवरोही क्रम में अंत में दिखाई देते हैं।
प्रदर्शन प्रभाव : बड़े डेटासेट के लिए, ORDER BY महंगा हो सकता है, इसलिए उचित इंडेक्सिंग महत्वपूर्ण है।

3. व्यावहारिक उपयोग के मामले

यहां MySQL के ROW_NUMBER() फंक्शन का उपयोग करने के व्यावहारिक परिदृश्य दिए गए हैं। यह फंक्शन डेटा रैंकिंग और डुप्लिकेट्स हैंडलिंग जैसे कई वास्तविक दुनिया के मामलों में उपयोगी है।

3-1. प्रत्येक समूह के अंदर रैंकिंग

उदाहरण के लिए, मान लीजिए आप बिक्री डेटा का उपयोग करके “प्रत्येक विभाग में बिक्री के आधार पर कर्मचारियों को रैंक” करना चाहते हैं। नीचे दिया गया डेटासेट उदाहरण के रूप में उपयोग करें।

employee	department	sale
A	Sales Department	500
B	Sales Department	800
C	Development Department	600
D	Development Department	700

क्वेरी उदाहरण: विभाग के अनुसार बिक्री रैंकिंग

SELECT
    employee,
    department,
    sale,
    ROW_NUMBER() OVER (PARTITION BY department ORDER BY sale DESC) AS rank
FROM
    sales;

परिणाम:

employee	department	sale	rank
B	Sales Department	800	1
A	Sales Department	500	2
D	Development Department	700	1
C	Development Department	600	2

इस प्रकार, प्रत्येक विभाग को बिक्री के अवरोही क्रम में अपना क्रमांक मिलता है, जिससे रैंकिंग बनाना आसान हो जाता है।

3-2. शीर्ष N पंक्तियों को निकालना

अब, देखते हैं कि आप “प्रत्येक विभाग में बिक्री के आधार पर शीर्ष 3 कर्मचारियों को निकालना” चाहते हैं।

क्वेरी उदाहरण: शीर्ष N पंक्तियों को निकालें

WITH RankedSales AS (
    SELECT
        employee,
        department,
        sale,
        ROW_NUMBER() OVER (PARTITION BY department ORDER BY sale DESC) AS rank
    FROM
        sales
)
SELECT
    employee,
    department,
    sale
FROM
    RankedSales
WHERE
    rank <= 3;

परिणाम:

employee	department	sale
B	Sales Department	800
A	Sales Department	500
D	Development Department	700
C	Development Department	600

यह उदाहरण प्रत्येक विभाग में बिक्री के आधार पर केवल शीर्ष 3 पंक्तियों को प्राप्त करता है। जैसा कि आप देख सकते हैं, ROW_NUMBER() न केवल रैंकिंग के लिए बल्कि शीर्ष परिणामों को फ़िल्टर करने के लिए भी उपयुक्त है।

3-3. डुप्लिकेट डेटा को ढूँढना और हटाना

डेटाबेस में कभी-कभी डुप्लिकेट रिकॉर्ड होते हैं। ऐसे मामलों में, आप ROW_NUMBER() का उपयोग करके उन्हें आसानी से संभाल सकते हैं।

क्वेरी उदाहरण: डुप्लिकेट का पता लगाएँ

SELECT *
FROM (
    SELECT
        employee,
        sale,
        ROW_NUMBER() OVER (PARTITION BY employee ORDER BY sale DESC) AS rank
    FROM
        sales
) tmp
WHERE rank > 1;

यह क्वेरी तब डुप्लिकेट का पता लगाती है जब एक ही कर्मचारी नाम के लिए कई रिकॉर्ड मौजूद होते हैं।

क्वेरी उदाहरण: डुप्लिकेट हटाएँ

DELETE FROM sales
WHERE id IN (
    SELECT id
    FROM (
        SELECT
            id,
            ROW_NUMBER() OVER (PARTITION BY employee ORDER BY sale DESC) AS rank
        FROM
            sales
    ) tmp
    WHERE rank > 1
);

सारांश

ROW_NUMBER() विभिन्न परिदृश्यों में उपयोगी है, जैसे:

प्रत्येक समूह के भीतर रैंकिंग
शीर्ष N पंक्तियों को निकालना
डुप्लिकेट का पता लगाना और हटाना

यह जटिल डेटा प्रोसेसिंग और विश्लेषण को सरल और अधिक कुशल बनाता है।

4. अन्य विंडो फ़ंक्शनों की तुलना

MySQL 8.0 में, ROW_NUMBER() के अलावा, RANK() और DENSE_RANK() जैसे विंडो फ़ंक्शन भी हैं जिन्हें रैंकिंग और स्थिति गणना के लिए उपयोग किया जा सकता है। जबकि इनके कार्य समान हैं, उनका व्यवहार और परिणाम अलग होते हैं। यहाँ हम प्रत्येक फ़ंक्शन की तुलना करेंगे और बताएँगे कि उन्हें कब उपयोग करना चाहिए।

4-1. RANK() फ़ंक्शन

RANK() फ़ंक्शन रैंक असाइन करता है, समान मानों को समान रैंक देता है और अगले रैंक नंबर को छोड़ देता है।

मूल सिंटैक्स

SELECT
    column_name,
    RANK() OVER (PARTITION BY group_column ORDER BY sort_column) AS rank
FROM
    table_name;

उदाहरण

निम्नलिखित डेटा का उपयोग करके, बिक्री रैंक की गणना करें।

employee	department	sale
A	Sales Department	800
B	Sales Department	800
C	Sales Department	600
D	Sales Department	500

क्वेरी उदाहरण: RANK() का उपयोग

SELECT
    employee,
    sale,
    RANK() OVER (ORDER BY sale DESC) AS rank
FROM
    sales;

परिणाम:

employee	sale	rank
A	800	1
B	800	1
C	600	3
D	500	4

मुख्य बिंदु:

समान बिक्री राशि (800) वाले A और B दोनों को रैंक “1” माना जाता है।
अगला रैंक “2” छोड़ दिया जाता है, इसलिए C रैंक “3” प्राप्त करता है।

4-2. DENSE_RANK() फ़ंक्शन

DENSE_RANK() फ़ंक्शन भी समान मानों को समान रैंक देता है, लेकिन यह अगले रैंक नंबर को नहीं छोड़ता।

मूल सिंटैक्स

SELECT
    column_name,
    DENSE_RANK() OVER (PARTITION BY group_column ORDER BY sort_column) AS dense_rank
FROM
    table_name;

उदाहरण

ऊपर के समान डेटा का उपयोग करके, DENSE_RANK() फ़ंक्शन आज़माएँ।

क्वेरी उदाहरण: DENSE_RANK() का उपयोग

SELECT
    employee,
    sale,
    DENSE_RANK() OVER (ORDER BY sale DESC) AS dense_rank
FROM
    sales;

परिणाम:

employee	sale	dense_rank
A	800	1
B	800	1
C	600	2
D	500	3

मुख्य बिंदु:

समान बिक्री राशि (800) वाले A और B दोनों को रैंक “1” माना जाता है।
RANK() के विपरीत, अगला रैंक “2” से शुरू होता है, इसलिए रैंकिंग निरंतरता बनी रहती है।

4-3. ROW_NUMBER() कैसे अलग है

ROW_NUMBER() फ़ंक्शन अन्य दो से इस बात में अलग है कि यह एक अद्वितीय संख्या असाइन करता है, भले ही मान समान हों।

उदाहरण

SELECT
    employee,
    sale,
    ROW_NUMBER() OVER (ORDER BY sale DESC) AS row_num
FROM
    sales;

परिणाम:

employee	sale	row_num
A	800	1
B	800	2
C	600	3
D	500	4

मुख्य बिंदु:

यदि मान समान हों, तो प्रत्येक पंक्ति को एक अद्वितीय संख्या मिलती है, इसलिए कोई डुप्लिकेट रैंक नहीं होते।
यह तब उपयोगी होता है जब आपको सख्त क्रम नियंत्रण या प्रति‑पंक्ति अद्वितीयता की आवश्यकता होती है।

4-4. त्वरित उपयोग‑केस सारांश

Function	Ranking behavior	Typical use case
ROW_NUMBER()	Assigns a unique number	When you need sequential numbering or unique identification per row
RANK()	Same rank for ties; skips the next rank number	When you want rankings with gaps reflecting ties
DENSE_RANK()	Same rank for ties; does not skip rank numbers	When you want continuous ranks without gaps

सारांश

ROW_NUMBER(), RANK(), और DENSE_RANK() को स्थिति के अनुसार उपयुक्त रूप से उपयोग किया जाना चाहिए।

ROW_NUMBER() सबसे अच्छा है जब आपको प्रत्येक पंक्ति के लिए अद्वितीय संख्याएँ चाहिए।
RANK() उपयोगी है जब आप चाहते हैं कि टाई वाले रिकॉर्ड एक ही रैंक साझा करें और रैंक अंतर को उजागर करना चाहते हैं।
DENSE_RANK() उपयुक्त है जब आप बिना अंतर के निरंतर रैंक चाहते हैं।

5. MySQL संस्करण 8.0 से नीचे के लिए विकल्प

MySQL 8.0 से पहले के संस्करणों में, ROW_NUMBER() और अन्य विंडो फ़ंक्शन समर्थित नहीं हैं। हालांकि, आप उपयोगकर्ता‑परिभाषित वेरिएबल्स का उपयोग करके समान व्यवहार प्राप्त कर सकते हैं। यह अनुभाग MySQL 8.0 से नीचे के संस्करणों के लिए व्यावहारिक विकल्पों को समझाता है।

5-1. उपयोगकर्ता‑परिभाषित वेरिएबल्स का उपयोग करके क्रमिक क्रमांक

MySQL 5.7 और उससे पहले, आप उपयोगकर्ता‑परिभाषित वेरिएबल्स का उपयोग करके प्रत्येक पंक्ति को क्रमिक संख्या असाइन कर सकते हैं। चलिए निम्नलिखित उदाहरण देखते हैं।

उदाहरण: विभाग द्वारा बिक्री रैंकिंग

नमूना डेटा:

employee	department	sale
A	Sales Department	500
B	Sales Department	800
C	Development Department	600
D	Development Department	700

क्वेरी:

SET @row_num = 0;
SET @dept = '';

SELECT
    employee,
    department,
    sale,
    @row_num := IF(@dept = department, @row_num + 1, 1) AS rank,
    @dept := department
FROM
    (SELECT * FROM sales ORDER BY department, sale DESC) AS sorted_sales;

परिणाम:

employee	department	sale	rank
B	Sales Department	800	1
A	Sales Department	500	2
D	Development Department	700	1
C	Development Department	600	2

5-2. शीर्ष N पंक्तियों को निकालना

शीर्ष N पंक्तियों को प्राप्त करने के लिए, आप समान तरीके से उपयोगकर्ता‑परिभाषित वेरिएबल्स का उपयोग कर सकते हैं।

क्वेरी:

SET @row_num = 0;
SET @dept = '';

SELECT *
FROM (
    SELECT
        employee,
        department,
        sale,
        @row_num := IF(@dept = department, @row_num + 1, 1) AS rank,
        @dept := department
    FROM
        (SELECT * FROM sales ORDER BY department, sale DESC) AS sorted_sales
) AS ranked_sales
WHERE rank <= 3;

परिणाम:

employee	department	sale	rank
B	Sales Department	800	1
A	Sales Department	500	2
D	Development Department	700	1
C	Development Department	600	2

यह क्वेरी विभाग के अनुसार रैंक असाइन करती है और फिर केवल शीर्ष 3 पंक्तियों को निकालती है।

5-3. डुप्लिकेट का पता लगाना और हटाना

आप उपयोगकर्ता‑परिभाषित वेरिएबल्स का उपयोग करके डुप्लिकेट डेटा को भी संभाल सकते हैं।

क्वेरी उदाहरण: डुप्लिकेट खोजें

SET @row_num = 0;
SET @id_check = '';

SELECT *
FROM (
    SELECT
        id,
        name,
        @row_num := IF(@id_check = name, @row_num + 1, 1) AS rank,
        @id_check := name
    FROM
        (SELECT * FROM customers ORDER BY name, id) AS sorted_customers
) AS tmp
WHERE rank > 1;

क्वेरी उदाहरण: डुप्लिकेट हटाएँ

DELETE FROM customers
WHERE id IN (
    SELECT id
    FROM (
        SELECT
            id,
            @row_num := IF(@id_check = name, @row_num + 1, 1) AS rank,
            @id_check := name
        FROM
            (SELECT * FROM customers ORDER BY name, id) AS sorted_customers
    ) AS tmp
    WHERE rank > 1
);

5-4. उपयोगकर्ता‑परिभाषित वेरिएबल्स का उपयोग करते समय सावधानियां

सत्र निर्भरता

उपयोगकर्ता‑परिभाषित वेरिएबल्स केवल वर्तमान सत्र में मान्य होते हैं। इन्हें विभिन्न क्वेरी या सत्रों में पुनः उपयोग नहीं किया जा सकता।

प्रसंस्करण क्रम पर निर्भरता

उपयोगकर्ता‑परिभाषित वेरिएबल्स निष्पादन क्रम पर निर्भर होते हैं, इसलिए ORDER BY को सही ढंग से सेट करना महत्वपूर्ण है।

SQL पठनीयता और रखरखाव

क्वेरी जटिल हो सकती हैं, इसलिए MySQL 8.0 और बाद में विंडो फ़ंक्शन का उपयोग करने की सलाह दी जाती है।

सारांश

In MySQL के 8.0 से नीचे के संस्करणों में, आप उपयोगकर्ता‑परिभाषित वेरिएबल्स का उपयोग करके विंडो फ़ंक्शन्स के स्थान पर क्रमिक क्रमांक और रैंकिंग लागू कर सकते हैं। हालांकि, क्योंकि क्वेरीज़ अधिक जटिल हो जाती हैं, संभव हो तो नए संस्करण में माइग्रेट करने पर विचार करना बेहतर है।

6. सावधानियां और सर्वोत्तम प्रथाएं

MySQL का ROW_NUMBER() फ़ंक्शन और वेरिएबल‑आधारित विकल्प बहुत सुविधाजनक हैं, लेकिन उन्हें सटीक और कुशलता से चलाने के लिए कुछ महत्वपूर्ण बिंदुओं को ध्यान में रखना आवश्यक है। यह अनुभाग प्रदर्शन अनुकूलन के लिए व्यावहारिक सावधानियों और सर्वोत्तम प्रथाओं को समझाता है।

6-1. प्रदर्शन संबंधी विचार

1. ORDER BY लागत

ROW_NUMBER() हमेशा ORDER BY के साथ उपयोग किया जाता है। चूंकि इसे सॉर्टिंग की आवश्यकता होती है, बड़े डेटासेट के लिए प्रोसेसिंग समय में काफी वृद्धि हो सकती है।

निवारण:

इंडेक्स का उपयोग करें: ORDER BY में उपयोग किए गए कॉलमों पर इंडेक्स जोड़ें ताकि सॉर्टिंग तेज हो सके।
LIMIT का उपयोग करें: केवल उतनी ही पंक्तियों को प्राप्त करें जितनी आपको वास्तव में चाहिए, ताकि प्रोसेस किए जाने वाले डेटा की मात्रा कम हो।

उदाहरण:

SELECT
    employee,
    sale,
    ROW_NUMBER() OVER (PARTITION BY department ORDER BY sale DESC) AS rank
FROM
    sales
LIMIT 1000;

2. बढ़ी हुई मेमोरी उपयोग और डिस्क I/O

विंडो फ़ंक्शन्स अस्थायी तालिकाओं और मेमोरी का उपयोग करके प्रोसेस किए जाते हैं। जैसे‑जैसे डेटा की मात्रा बढ़ती है, मेमोरी खपत और डिस्क I/O बढ़ सकता है।

निवारण:

क्वेरीज़ को विभाजित करें: प्रोसेसिंग को छोटे क्वेरीज़ में बाँटें और डेटा को चरण‑दर‑चरण निकालें ताकि लोड कम हो।
अस्थायी तालिकाओं का उपयोग करें: निकाले गए डेटा को एक अस्थायी तालिका में संग्रहीत करें और वहाँ से एग्रीगेशन चलाएँ ताकि कार्यभार वितरित हो सके।

6-2. क्वेरी ट्यूनिंग टिप्स

1. निष्पादन योजना जांचें

MySQL में, आप EXPLAIN का उपयोग करके क्वेरी निष्पादन योजना की जाँच कर सकते हैं। यह आपको यह सत्यापित करने में मदद करता है कि इंडेक्स सही ढंग से उपयोग हो रहे हैं या नहीं।

उदाहरण:

EXPLAIN
SELECT
    employee,
    ROW_NUMBER() OVER (PARTITION BY department ORDER BY sale DESC) AS rank
FROM
    sales;

उदाहरण आउटपुट:

id	select_type	table	type	possible_keys	key	key_len	ref	rows	Extra
1	SIMPLE	sales	index	NULL	sale	4	NULL	500	Using index

यदि आप Using index देखते हैं, तो इसका मतलब है कि इंडेक्स उपयुक्त रूप से उपयोग हो रहा है।

2. इंडेक्स को अनुकूलित करें

ORDER BY और WHERE में उपयोग किए गए कॉलमों पर इंडेक्स जोड़ना सुनिश्चित करें। निम्नलिखित पर विशेष ध्यान दें।

सिंगल‑कलम इंडेक्स: सरल सॉर्ट शर्तों के लिए उपयुक्त
कॉम्पोजिट इंडेक्स: जब कई कॉलम शर्तों में शामिल हों तो प्रभावी

उदाहरण:

CREATE INDEX idx_department_sale ON sales(department, sale DESC);

3. बैच प्रोसेसिंग का उपयोग करें

एक बड़े डेटासेट को एक बार में प्रोसेस करने के बजाय, आप डेटा को बैचों में प्रोसेस करके लोड कम कर सकते हैं।

उदाहरण:

SELECT * FROM sales WHERE department = 'Sales Department' LIMIT 1000 OFFSET 0;
SELECT * FROM sales WHERE department = 'Sales Department' LIMIT 1000 OFFSET 1000;

6-3. डेटा संगति बनाए रखना

1. अपडेट्स और पुनर्गणना

जब पंक्तियों को जोड़ा या हटाया जाता है, तो क्रमांक बदल सकता है। आवश्यकतानुसार संख्याओं को पुनः गणना करने के लिए एक तंत्र बनाएं।

उदाहरण:

CREATE VIEW ranked_sales AS
SELECT
    employee,
    sale,
    ROW_NUMBER() OVER (PARTITION BY department ORDER BY sale DESC) AS rank
FROM
    sales;

एक व्यू का उपयोग करने से आप नवीनतम डेटा के आधार पर रैंकिंग को अद्यतन रख सकते हैं।

6-4. सर्वोत्तम‑प्रथा क्वेरी उदाहरण

नीचे एक ऐसा उदाहरण है जो प्रदर्शन और रखरखाव को ध्यान में रखते हुए सर्वोत्तम प्रथाओं को दर्शाता है।

उदाहरण: शीर्ष N पंक्तियों को निकालें

WITH RankedSales AS (
    SELECT
        employee,
        department,
        sale,
        ROW_NUMBER() OVER (PARTITION BY department ORDER BY sale DESC) AS rank
    FROM
        sales
)
SELECT *
FROM RankedSales
WHERE rank <= 3;

यह संरचना पठनीयता और पुनः उपयोगिता को बढ़ाने के लिए एक कॉमन टेबल एक्सप्रेशन (CTE) का उपयोग करती है।

सारांश

जब ROW_NUMBER() या उसके विकल्पों का उपयोग करें, तो इन बिंदुओं को याद रखें:

इंडेक्स अनुकूलन के माध्यम से गति बढ़ाएँ।
एक्जीक्यूशन प्लान की जाँच करके बॉटलनेक की पहचान करें।
डेटा अपडेट की योजना बनाएँ और संगति बनाए रखें।
बैच प्रोसेसिंग और CTEs का उपयोग करके लोड वितरित करें।

इन सर्वोत्तम प्रथाओं को लागू करने से बड़े पैमाने पर डेटा विश्लेषण और रिपोर्टिंग के लिए कुशल प्रसंस्करण संभव होगा।

7. निष्कर्ष

इस लेख में, हमने MySQL के ROW_NUMBER() फ़ंक्शन पर ध्यान केंद्रित किया, बुनियादी उपयोग, व्यावहारिक उदाहरणों से लेकर पुराने संस्करणों के विकल्प, साथ ही चेतावनियों और सर्वोत्तम प्रथाओं तक सब कुछ समझाया। इस भाग में, हम मुख्य बिंदुओं को दोहराएंगे और व्यावहारिक निष्कर्षों का सारांश देंगे।

7-1. ROW_NUMBER() क्यों उपयोगी है

ROW_NUMBER() फ़ंक्शन डेटा विश्लेषण और रिपोर्टिंग के लिए निम्नलिखित तरीकों से विशेष रूप से सुविधाजनक है:

समूहों के भीतर क्रमिक क्रमांकन: विभाग या श्रेणी-आधारित रैंकिंग द्वारा आसानी से बिक्री रैंक बनाना।
शीर्ष N पंक्तियों का निष्कर्षण: विशिष्ट शर्तों के आधार पर डेटा को कुशलतापूर्वक फ़िल्टर और निकालना।
डुप्लिकेट का पता लगाना और हटाना: डेटा सफाई और संगठन के लिए उपयोगी।

क्योंकि यह जटिल क्वेरीज़ को सरल बनाता है, यह SQL की पठनीयता और रखरखाव को काफी सुधारता है।

7-2. अन्य विंडो फ़ंक्शनों के साथ तुलना

RANK() और DENSE_RANK() जैसे विंडो फ़ंक्शनों की तुलना में, ROW_NUMBER() इस बात में अलग है कि यह समान मानों के लिए भी एक अद्वितीय संख्या असाइन करता है।

Function	Feature	Use case
ROW_NUMBER()	Assigns a unique sequential number to each row	Best when you need unique identification or ranking with no duplicates
RANK()	Same rank for ties; skips the next rank number	When you need tie-aware rankings and rank gaps matter
DENSE_RANK()	Same rank for ties; does not skip rank numbers	When you want continuous ranking while handling ties

सही फ़ंक्शन चुनना:
अपने उद्देश्य के लिए सर्वोत्तम फ़ंक्शन का चयन करने से कुशल डेटा प्रसंस्करण संभव होता है।

7-3. पुराने MySQL संस्करणों को संभालना

MySQL 8.0 से नीचे के वातावरण के लिए, हमने उपयोगकर्ता-परिभाषित वेरिएबल्स का उपयोग करके तरीकों को भी प्रस्तुत किया। हालांकि, आपको इन चेतावनियों पर विचार करना चाहिए:

अधिक जटिल SQL के कारण पठनीयता में कमी
कुछ मामलों में क्वेरी अनुकूलन अधिक कठिन हो सकता है
डेटा संगति बनाए रखने के लिए अतिरिक्त हैंडलिंग की आवश्यकता हो सकती है

यदि संभव हो, तो MySQL 8.0 या बाद के संस्करण में माइग्रेट करने और विंडो फ़ंक्शनों का उपयोग करने पर दृढ़ता से विचार करें।

7-4. प्रदर्शन अनुकूलन के मुख्य बिंदु

इंडेक्स का उपयोग करें: गति बढ़ाने के लिए ORDER BY में उपयोग किए गए कॉलम में इंडेक्स जोड़ें।
एक्जीक्यूशन प्लान जांचें: EXPLAIN के साथ पहले से प्रदर्शन को सत्यापित करें।
बैच प्रोसेसिंग अपनाएँ: बड़े डेटासेट को छोटे हिस्सों में प्रोसेस करके लोड वितरित करें।
व्यू और CTEs का उपयोग करें: पुन: उपयोगिता बढ़ाएँ और जटिल क्वेरीज़ को सरल बनाएँ।

इन तकनीकों को लागू करके, आप कुशल और स्थिर डेटा प्रसंस्करण प्राप्त कर सकते हैं।

7-5. अंतिम नोट्स

ROW_NUMBER() एक शक्तिशाली उपकरण है जो डेटा विश्लेषण की दक्षता को काफी बढ़ा सकता है।
इस लेख में, हमने बुनियादी सिंटैक्स और व्यावहारिक उदाहरणों से लेकर चेतावनियों और विकल्पों तक सब कुछ कवर किया।

हम आपको इस लेख के साथ पढ़ते हुए स्वयं क्वेरी चलाने के लिए प्रोत्साहित करते हैं। अपने SQL कौशल को सुधारने से आप अधिक जटिल डेटा विश्लेषण और रिपोर्टिंग को आत्मविश्वास के साथ संभाल सकते हैं।

परिशिष्ट: संदर्भ संसाधन

आधिकारिक दस्तावेज़: MySQL Window Functions
ऑनलाइन SQL वातावरण: SQL Fiddle (एक उपकरण जो आपको ऑनलाइन SQL चलाने और परीक्षण करने देता है)

MySQL ROW_NUMBER() समझाया गया (MySQL 8.0): रैंकिंग, शीर्ष‑N क्वेरीज़, और डुप्लिकेशन हटाना

1. परिचय

लक्षित पाठक

ROW_NUMBER() के लाभ

2. ROW_NUMBER() फंक्शन क्या है?

ROW_NUMBER() का बुनियादी सिंटैक्स

प्रत्येक तत्व का अर्थ

बुनियादी उदाहरण

परिणाम

PARTITION BY का उपयोग कैसे करें

परिणाम

ROW_NUMBER() की विशेषताएं और सावधानियां

3. व्यावहारिक उपयोग के मामले

3-1. प्रत्येक समूह के अंदर रैंकिंग

3-2. शीर्ष N पंक्तियों को निकालना

3-3. डुप्लिकेट डेटा को ढूँढना और हटाना

सारांश

4. अन्य विंडो फ़ंक्शनों की तुलना

4-1. RANK() फ़ंक्शन

मूल सिंटैक्स

उदाहरण

4-2. DENSE_RANK() फ़ंक्शन

मूल सिंटैक्स

उदाहरण

4-3. ROW_NUMBER() कैसे अलग है

उदाहरण

4-4. त्वरित उपयोग‑केस सारांश

सारांश

5. MySQL संस्करण 8.0 से नीचे के लिए विकल्प

5-1. उपयोगकर्ता‑परिभाषित वेरिएबल्स का उपयोग करके क्रमिक क्रमांक

उदाहरण: विभाग द्वारा बिक्री रैंकिंग

5-2. शीर्ष N पंक्तियों को निकालना

5-3. डुप्लिकेट का पता लगाना और हटाना

5-4. उपयोगकर्ता‑परिभाषित वेरिएबल्स का उपयोग करते समय सावधानियां

सारांश

6. सावधानियां और सर्वोत्तम प्रथाएं

6-1. प्रदर्शन संबंधी विचार

1. ORDER BY लागत

2. बढ़ी हुई मेमोरी उपयोग और डिस्क I/O

6-2. क्वेरी ट्यूनिंग टिप्स

1. निष्पादन योजना जांचें

2. इंडेक्स को अनुकूलित करें

3. बैच प्रोसेसिंग का उपयोग करें

6-3. डेटा संगति बनाए रखना

1. अपडेट्स और पुनर्गणना

6-4. सर्वोत्तम‑प्रथा क्वेरी उदाहरण

सारांश

7. निष्कर्ष

7-1. ROW_NUMBER() क्यों उपयोगी है

7-2. अन्य विंडो फ़ंक्शनों के साथ तुलना

7-3. पुराने MySQL संस्करणों को संभालना

7-4. प्रदर्शन अनुकूलन के मुख्य बिंदु

7-5. अंतिम नोट्स

परिशिष्ट: संदर्भ संसाधन

mysqldump गाइड: MySQL और MariaDB के लिए बैकअप, रिस्टोर, विकल्प, और ऑटोमेशन

MySQL सर्वर गायब हो गया: कारण, समाधान और WordPress समाधान (पूर्ण गाइड)