- 1 1. परिचय: आपको MySQL डेटा टाइप सूची को क्यों समझना चाहिए
- 2 2. डेटा टाइप क्या है, और “सही टाइप चुनना” क्यों महत्वपूर्ण है?
- 3 3. MySQL डेटा प्रकार श्रेणियाँ (सारांश सूची)
- 4 3.1 संख्यात्मक प्रकार
- 5 3.2 तिथि और समय प्रकार
- 6 3.3 स्ट्रिंग / बाइनरी प्रकार
- 7 3.4 JSON प्रकार
- 8 3.5 स्पैशियल प्रकार
- 9 4. प्रत्येक डेटा प्रकार को कैसे चुनें और उपयोग करें (मुख्य निर्णय बिंदु)
- 10 4.1 संख्यात्मक प्रकार कैसे चुनें
- 11 4.2 तिथि और समय प्रकार कैसे चुनें
- 12 4.3 स्ट्रिंग प्रकार कैसे चुनें
- 13 4.4 JSON प्रकार कैसे चुनें
- 14 4.5 ENUM / SET प्रकार कैसे चुनें
- 15 4.6 बाइनरी / BLOB प्रकार कैसे चुनें
- 16 5. अभ्यास: टेबल डिज़ाइन करते समय “डेटा टाइप रेफ़रेंस लिस्ट” का उपयोग कैसे करें
- 17 5.1 चरण 1: कॉलम के “उद्देश्य” और “प्रकृति” को स्पष्ट करें
- 18 5.2 चरण 2: आवश्यक रेंज और प्रारूप का अनुमान लगाएं
- 19 5.3 चरण 3: डेटा वॉल्यूम और प्रदर्शन पर विचार करें
- 20 5.4 चरण 4: नमूना डेटा के साथ प्रकारों की पुष्टि करें
- 21 5.5 चरण 5: स्केलेबिलिटी और रखरखाव पर विचार करें
- 22 5.6 चरण 6: CREATE TABLE उदाहरण (व्यावहारिक नमूना)
- 23 6. सामान्य गलतियां और उन्हें कैसे टालें
- 24 6.1 अत्यधिक बड़े डेटा प्रकारों का उपयोग
- 25 6.2 दशमलव मानों के लिए FLOAT/DOUBLE का उपयोग (सटीकता समस्याएँ)
- 26 6.3 अत्यधिक बड़े VARCHAR कॉलम
- 27 6.4 TEXT प्रकारों का अधिक उपयोग
- 28 6.5 डेट/टाइम प्रकारों का चयन बिना उनकी विशेषताओं को समझे
- 29 6.6 ENUM / SET का बहुत सहज उपयोग
- 30 6.7 “सुविधा” के कारण JSON में बहुत अधिक डेटा पैक करना
- 31 6.8 प्रकार परिवर्तन की लागत को कम आंकना
- 32 7. सारांश
- 33 8. अक्सर पूछे जाने वाले प्रश्न
- 33.1 Q1. क्या मुझे INT या BIGINT उपयोग करना चाहिए?
- 33.2 Q2. क्या मुझे VARCHAR या TEXT उपयोग करना चाहिए?
- 33.3 Q3. क्या पैसे को DOUBLE के रूप में स्टोर करना ठीक है?
- 33.4 Q4. मैं DATETIME और TIMESTAMP के बीच अंतर नहीं समझता। मुझे कैसे चुनना चाहिए?
- 33.5 Q5. क्या ENUM का उपयोग सुरक्षित है?
- 33.6 Q6. क्या मैं अभी के लिए सिर्फ JSON उपयोग कर सकता हूँ?
- 33.7 Q7. VARCHAR की अधिकतम लंबाई कैसे तय करूँ?
- 33.8 Q8. यदि मैंने गलत टाइप चुना, तो क्या बाद में बदल सकता हूँ?
1. परिचय: आपको MySQL डेटा टाइप सूची को क्यों समझना चाहिए
जब आप MySQL के साथ टेबल डिज़ाइन करते हैं या एप्लिकेशन को इंटीग्रेट करते हैं, तो सबसे आम सवालों में से एक यह होता है: “इस कॉलम के लिए मुझे कौन सा डेटा टाइप इस्तेमाल करना चाहिए?”
क्या यह INT होना चाहिए? क्या आपको वास्तव में BIGINT की ज़रूरत है? क्या स्ट्रिंग्स के लिए VARCHAR पर्याप्त है, या TEXT बेहतर है? ये विकल्प छोटे लग सकते हैं, लेकिन ये वही बुनियाद बनाते हैं जो बाद में आपके सिस्टम को प्रभावित करती है।
यदि आप डेटा टाइप चुनने के महत्व को कम आँकते हैं, तो आप अक्सर नीचे दिए गए मुद्दों का सामना करेंगे:
- जैसे ही आपका डेटा अपेक्षा से अधिक बढ़ता है, आप स्टोरेज स्पेस बर्बाद करते हैं
- इंडेक्स बloat हो जाते हैं और क्वेरी प्रदर्शन धीरे‑धीरे घटता है
- रेंज से बाहर के मान या ओवरफ़्लो अनपेक्षित बग या एक्सेप्शन का कारण बनते हैं
- आपको बाद में कॉलम टाइप बदलने के लिए मजबूर होना पड़ता है, जिससे बड़े‑पैमाने पर माइग्रेशन की आवश्यकता होती है
दूसरे शब्दों में, MySQL डेटा टाइप को व्यवस्थित रूप से समझना और प्रत्येक उपयोग केस के लिए सही टाइप चुनना प्रदर्शन और मेंटेनबिलिटी दोनों को सुधारने का सबसे तेज़ तरीका है।
यह पेज मुख्यतः निम्नलिखित पाठकों के लिए है:
- वे इंजीनियर जो MySQL के साथ गंभीर सिस्टम विकास शुरू करने वाले हैं
- बैकएंड / इन्फ्रास्ट्रक्चर‑उन्मुख इंजीनियर जो मौजूदा टेबल डिज़ाइनों की समीक्षा करना चाहते हैं
- वेब डेवलपर और प्रोग्रामर जो उपयोग केस के आधार पर “सिफ़ारिश किए गए टाइप” चाहते हैं
हम प्रमुख MySQL डेटा टाइप को एक वर्गीकृत “सूची” के रूप में व्यवस्थित करके शुरू करेंगे। फिर हम मुख्य टाइप—न्यूमेरिक, स्ट्रिंग, डेट/टाइम, JSON, ENUM/SET—की विशेषताओं, सामान्य उपयोग केस और चयन टिप्स को समझाएंगे। अंत में, हम सामान्य डिज़ाइन गलतियों का सारांश और उन्हें कैसे टाला जाए, साथ ही एक FAQ प्रस्तुत करेंगे।
यह केवल “टर्म्स की सूची” नहीं है। यह निर्णय‑लेने के मार्गदर्शन के रूप में संरचित है ताकि आप वास्तविक प्रोजेक्ट्स में टेबल डिज़ाइन करते समय फँसे न रहें। अगले सेक्शन में, चलिए डेटा टाइप के बारे में सोचने और वर्गीकृत सूची की समीक्षा करने में डुबकी लगाते हैं।
2. डेटा टाइप क्या है, और “सही टाइप चुनना” क्यों महत्वपूर्ण है?
डेटाबेस में, “डेटा टाइप” एक नियम है जो निर्धारित करता है कि कॉलम किस प्रकार के मान संग्रहीत कर सकता है।
MySQL कई डेटा टाइप प्रदान करता है—इंटीजर, डेसिमल, स्ट्रिंग, डेट, बाइनरी, JSON, और अधिक—इसलिए आपको अपने उद्देश्य के अनुसार उपयुक्त टाइप चुनना आवश्यक है।
डेटा टाइप की भूमिका
डेटा टाइप केवल “फ़ॉर्मेट श्रेणी” नहीं है। यह एक साथ कई भूमिकाएँ निभाता है:
- डेटा के प्रकार को प्रतिबंधित करना (न्यूमेरिक बनाम स्ट्रिंग, बूलियन, आदि)
- अनुमत रेंज और अंकों की संख्या निर्धारित करना
- आवश्यक मेमोरी (स्टोरेज साइज) तय करना
- इंडेक्स संरचनाओं और खोज प्रदर्शन को प्रभावित करना
- इम्प्लिसिट कन्वर्ज़न और तुलना नियमों को प्रभावित करना (जैसे, स्ट्रिंग कोलेशन)
संक्षेप में, डेटा टाइप केवल “कंटेनर” नहीं हैं—वे मूलभूत डिज़ाइन विकल्प हैं जो पूरे डेटा मैनेजमेंट लाइफ़साइकल को प्रभावित करते हैं।
यदि आप गलत टाइप चुनते हैं तो क्या होता है?
गलत डेटा टाइप चुनने पर वास्तविक कार्य में अक्सर नीचे दिए गए समस्याएँ उत्पन्न होती हैं:
• स्टोरेज बर्बाद करना
उदाहरण के लिए, यदि BIGINT (8 बाइट) पर्याप्त है लेकिन आप गलती से DECIMAL या LONGTEXT उपयोग करते हैं, तो आप अपेक्षा से कहीं अधिक डिस्क स्पेस खपत कर सकते हैं।
• धीमी क्वेरीज़
यदि आप बड़े TEXT कॉलम पर LIKE सर्च का अधिक उपयोग करते हैं, या यदि आप अत्यधिक बड़े न्यूमेरिक टाइप चुनते हैं जिससे इंडेक्स बloat हो जाता है, तो SQL निष्पादन धीमा हो जाता है।
• असंगत मान या ओवरफ़्लो
आप ऐसे मान संग्रहीत कर सकते हैं जो INT में फिट नहीं होते, जिससे अनपेक्षित नकारात्मक मान, राउंडिंग या अन्य समस्याएँ उत्पन्न हो सकती हैं।
• महँगी टेबल परिवर्तन
विशेषकर बड़े टेबलों पर, ALTER TABLE के साथ टाइप बदलने से निम्नलिखित हो सकते हैं:
- लंबी लॉक अवधि
- सेवा पर प्रभाव
- डेटा माइग्रेशन कार्य और अन्य जोखिम
आपको प्रारंभ में समझने वाले मुख्य वर्गीकरण
MySQL डेटा टाइप व्यापक रूप से निम्नलिखित रूप में वर्गीकृत होते हैं:
- न्यूमेरिक टाइप (इंटीजर, डेसिमल)
- स्ट्रिंग टाइप
- डेट और टाइम टाइप
- बाइनरी टाइप
- JSON टाइप
- ENUM / SET टाइप
- स्पैशियल डेटा टाइप
Each category has different trade‑offs—strengths/weaknesses, “light vs. heavy,” and “easy vs. hard to search.” That’s why you need the optimal type selection for each use case.
3. MySQL डेटा प्रकार श्रेणियाँ (सारांश सूची)
In this section, we’ll summarize the data types available in MySQL as a categorized overview list. In practice, the first things you want to confirm are “What types exist?” and “Which one should I use?”
So here we’ll clearly show use cases, key characteristics, and representative type names, and then explain each category in more detail in the following sections.
3.1 संख्यात्मक प्रकार
Numeric types are the foundation for all numeric processing, including integers, decimals, and floating‑point values.
This category is used most frequently for IDs, quantities, prices, flag checks, and many other purposes.
पूर्णांक प्रकार
| Type | Bytes | Characteristics / Use Cases |
|---|---|---|
| TINYINT | 1B | -128 to 127. Ideal for flags and small numbers |
| SMALLINT | 2B | -32,768 to 32,767. Lightweight integers |
| MEDIUMINT | 3B | Integer type that can handle a mid-range |
| INT / INTEGER | 4B | The most common integer type. Often used for IDs |
| BIGINT | 8B | Large values (order numbers, log counters, etc.) |
नोट्स
UNSIGNEDजोड़ने से सकारात्मक सीमा दोगुनी हो जाती है।INTकई मामलों में उपयोग किया जाता है, लेकिनBIGINTको सहजता से उपयोग करने से इंडेक्स भारी हो सकते हैं।
दशमलव / फ्लोटिंग‑पॉइंट प्रकार
| Type | Characteristics |
|---|---|
| DECIMAL | Best for amounts like currency where errors are unacceptable |
| NUMERIC | Synonymous with DECIMAL |
| FLOAT | Memory-efficient, but may introduce rounding errors |
| DOUBLE | Higher precision than FLOAT, but errors can still occur |
नोट्स
- धन के लिए,
DECIMALही एकमात्र उचित विकल्प है। फ्लोटिंग‑पॉइंट प्रकार (FLOAT/DOUBLE) त्रुटियाँ उत्पन्न कर सकते हैं। - कई गणनाओं वाले मामलों में, गति/सटीकता के ट्रेड‑ऑफ़ के कारण
DOUBLEकभी‑कभी चुना जाता है।
अन्य संख्यात्मक प्रकार
| Type | Characteristics |
|---|---|
| BIT | Bit-level flag management (0/1) |
| BOOL / BOOLEAN | Actually an alias for TINYINT(1) |
3.2 तिथि और समय प्रकार
Date/time handling is used very frequently in application development.
Depending on the purpose, factors like “time zone behavior,” “automatic updates,” and “second‑level precision” differ, so choosing the right type matters.
| Type | Characteristics / Use Cases |
|---|---|
| DATE | Date only (YYYY-MM-DD) |
| TIME | Time only (HH:MM:SS) |
| DATETIME | Date + time. Not affected by time zones |
| TIMESTAMP | Date + time. Stored as UNIX time; affected by time zones; can auto-update |
| YEAR | Stores the year only (YYYY) |
नोट्स
- यदि आप “updated at” को स्वचालित रूप से प्रबंधित करना चाहते हैं, तो
TIMESTAMPसुविधाजनक है। - “लॉग” या “इतिहास” के लिए जहाँ सटीक टाइमस्टैम्प संग्रहीत करना चाहते हैं,
DATETIMEआमतौर पर उपयोग किया जाता है।
3.3 स्ट्रिंग / बाइनरी प्रकार
Usernames, emails, passwords, descriptions—strings are often the most complex area in table design.
निश्चित‑लंबाई स्ट्रिंग्स
| Type | Characteristics |
|---|---|
| CHAR(n) | Always reserves space for exactly n characters. Suitable for fixed-length data (e.g., country codes) |
परिवर्तनीय‑लंबाई स्ट्रिंग्स
| Type | Characteristics |
|---|---|
| VARCHAR(n) | The most common string type. Best for data with varying length |
बड़े टेक्स्ट (TEXT परिवार)
| Type | Characteristics |
|---|---|
| TINYTEXT | Up to 255 characters |
| TEXT | Strings up to 64KB |
| MEDIUMTEXT | Up to 16MB |
| LONGTEXT | Up to 4GB |
नोट्स
- जब आपको लेख के मुख्य भाग या लंबी विवरण जैसी बहुत बड़ी स्ट्रिंग्स संग्रहीत करनी हों, तो
TEXTका उपयोग करें। - खोज और इंडेक्स डिज़ाइन के साथ सावधान रहें।
बाइनरी डेटा (BINARY / BLOB)
| Type | Characteristics |
|---|---|
| BINARY / VARBINARY | Fixed-length / variable-length binary data |
| BLOB / MEDIUMBLOB / LONGBLOB | Large binary data such as images and files |
※ सामान्यतः, बड़े फ़ाइलें डेटाबेस में संग्रहीत नहीं की जातीं; एक सामान्य डिज़ाइन यह है कि उन्हें बाहरी स्टोरेज में रखा जाए।
ENUM / SET प्रकार (एन्यूमरेशन)
| Type | Characteristics |
|---|---|
| ENUM | Select exactly one value from a predefined set of strings |
| SET | An enumeration type that allows selecting multiple values |
नोट्स
- यदि बाद में प्रकार परिभाषा बदलनी पड़े, तो रखरखाव भारी हो जाता है
- यह छोटे‑पैमाने, स्थिर उम्मीदवारों के लिए प्रभावी हो सकता है
3.4 JSON प्रकार
| Type | Characteristics |
|---|---|
| JSON | Stores structured data. Officially supported since MySQL 5.7 |
- आप NoSQL‑समान लचीलापन प्राप्त करते हैं जबकि JSON‑विशिष्ट फ़ंक्शन का उपयोग भी कर सकते हैं।
- हालांकि, बार‑बार खोजे जाने वाले डेटा को JSON में पैक करना अनुशंसित नहीं है। यदि इसे सामान्यीकृत किया जा सकता है, तो इसे संरचित तालिकाओं के रूप में मॉडल किया जाना चाहिए।
3.5 स्पैशियल प्रकार
These are used when working with geographic and location data.
| Type | Characteristics |
|---|---|
| GEOMETRY | Base type for spatial data |
| POINT, LINESTRING, POLYGON | Coordinates, lines, areas, and more |
In typical web applications, these aren’t used often, but they are important for map apps and GPS integrations.
4. प्रत्येक डेटा प्रकार को कैसे चुनें और उपयोग करें (मुख्य निर्णय बिंदु)
In this section, we delve deeper into the categories introduced above, focusing on “how to choose in real‑world scenarios.”
Simply knowing the names is not enough—selecting the best‑fit data type has a major impact on maintainability, performance, and future scalability.
4.1 संख्यात्मक प्रकार कैसे चुनें
पूर्णांक प्रकार चुनने के मानदंड
When selecting integer types, focus on these three points:
1. अधिकतम आवश्यक सीमा को समझें
- छोटे काउंटर →
TINYINT - उत्पाद मात्रा / फ़्लैग →
SMALLINT/INT - बड़े‑पैमाने के IDs या लॉग →
BIGINT
Some projects overuse BIGINT for primary keys, but this can easily lead to larger index sizes and may negatively impact performance.
2. सक्रिय रूप से UNSIGNED पर विचार करें
If you only handle positive values (e.g., numeric IDs, inventory counts)
→ using UNSIGNED doubles the range and may allow you to use a smaller type.
3. पैसे या सटीकता‑संकटपूर्ण मानों के लिए, DECIMAL का उपयोग करें
For values where “errors are not acceptable,” avoid FLOAT/DOUBLE and always use DECIMAL.
4.2 तिथि और समय प्रकार कैसे चुनें
The appropriate type depends on your use case.
DATETIME और TIMESTAMP के बीच अंतर
| Item | DATETIME | TIMESTAMP |
|---|---|---|
| Time zone | Not affected | Affected (converted) |
| Storage format | A “string-like” date/time | Stored as UNIX time |
| Auto update | Manual | Can auto-update (e.g., DEFAULT CURRENT_TIMESTAMP) |
| Range | Year 1000 to 9999 | Year 1970 to 2038 |
चयन के सामान्य नियम
- एप्लिकेशन लॉग या इवेंट रिकॉर्ड →
DATETIME(समय क्षेत्र परिवर्तन प्रभावों से बचें) - जब आप स्वचालित रूप से अपडेटेड टाइमस्टैम्प रिकॉर्ड करना चाहते हैं →
TIMESTAMP(सुविधाजनक ऑटो‑अपडेट व्यवहार)
जहाँ YEAR उपयोगी है
- वित्तीय‑वर्ष श्रेणियाँ, रिलीज़ वर्ष, स्थापना वर्ष, आदि → कॉम्पैक्ट रूप से प्रबंधित (1 बाइट)
4.3 स्ट्रिंग प्रकार कैसे चुनें
CHAR और VARCHAR के बीच कैसे निर्णय लें
जब आपको CHAR का उपयोग करना चाहिए
- लंबाई हमेशा स्थिर रहती है: प्रीफ़ेक्चर कोड, देश कोड, निश्चित‑लंबाई पहचानकर्ता, आदि।
- डेटा जिसे तेज़ एक्सेस की आवश्यकता है और जो कम बार अपडेट होता है
जब आपको VARCHAR का उपयोग करना चाहिए
- लंबाई बदलती है: नाम, ईमेल पते, शीर्षक, आदि।
- अधिकांश स्थितियों में सबसे अच्छा डिफ़ॉल्ट विकल्प
क्या आपको TEXT का उपयोग करना चाहिए?
TEXT के लाभ
- बड़े टेक्स्ट का समर्थन करता है (विवरण, लेख के बॉडी आदि)।
TEXT के लिए सावधानियां
- इंडेक्सिंग सीमित है (प्रिफिक्स इंडेक्स आवश्यक हैं)
- JOINs या WHERE क्लॉज़ में उपयोग करने पर प्रदर्शन घट सकता है
- खोज और सॉर्टिंग भारी हो सकती है
सिफारिश:
TEXT का उपयोग “बड़े स्ट्रिंग्स” जैसे बॉडी या नोट्स के लिए करें,
और बाकी सब के लिए यथासंभव VARCHAR का उपयोग करें।

4.4 JSON प्रकार कैसे चुनें
JSON प्रकार बहुत उपयोगी है, लेकिन आपको इसे “सही तरीके से” उपयोग करना चाहिए।
जब JSON अच्छी तरह काम करता है
- लचीले सेटिंग्स या डेटा जिसमें फ़ील्ड्स की संख्या बदलती रहती है
- सीमित लुकअप उपयोग मामलों, या जब एप्लिकेशन इसे विस्तारित/पार्स करता है
- हल्का डेटा संग्रहीत करना जो मास्टर टेबल की आवश्यकता नहीं रखता
जब JSON उपयुक्त नहीं है
- डेटा जिसे आप अक्सर खोजते हैं
- डेटा जो फ़िल्टर्ड सर्च, एग्रीगेशन, या JOINs के लिए उपयोग होता है
- संरचित डेटा जिसे सामान्यीकृत किया जाना चाहिए
सामान्य नियम:
जिस डेटा को आपको खोजने की आवश्यकता है उसे सामान्यीकृत और संरचना के रूप में माना जाना चाहिए।
भूलिए नहीं कि JSON “लचीला है लेकिन खोज के लिए कमजोर है।”
4.5 ENUM / SET प्रकार कैसे चुनें
जब ENUM उपयुक्त है
- स्थितियां निश्चित हैं: उदाहरण के लिए, स्टेटस (
draft/published/archived) - विकल्पों का छोटा सेट जो शायद ही बदलता है
ENUM के लिए सावधानियां
- मान जोड़ने या बदलने के लिए
ALTER TABLEआवश्यक है - एप्लिकेशन‑साइड परिभाषाओं के साथ संगतता खोने का जोखिम
जब SET उपयुक्त है
- छोटे‑पैमाने का डेटा जो कई चयन की आवश्यकता रखता है (जैसे, उपलब्ध सप्ताह के दिन, या जब केवल कुछ टैग विकल्प हों)
SET के लिए सावधानियां
- मानों के संयोजन जटिल हो सकते हैं
- बहु‑मान स्थितियों का प्रबंधन कठिन हो सकता है
4.6 बाइनरी / BLOB प्रकार कैसे चुनें
BINARY / VARBINARY
- टोकन, IDs, हैश मान, आदि।
- निश्चित‑लंबाई बाइनरी (जैसे, 16‑बाइट UUIDs)
BLOB प्रकारों के सामान्य उपयोग केस
- छोटे फ़ाइलें, थंबनेल इमेज, एन्क्रिप्टेड डेटा
लेकिन ध्यान दें
- डेटाबेस में बड़े फ़ाइलें संग्रहीत करने से बैकअप भारी हो जाता है
- पढ़ने/लिखने का लोड भी बढ़ता है → वास्तविक सिस्टम में, बाहरी स्टोरेज + पाथ मैनेजमेंट की सलाह दी जाती है
5. अभ्यास: टेबल डिज़ाइन करते समय “डेटा टाइप रेफ़रेंस लिस्ट” का उपयोग कैसे करें
इस सेक्शन में, हम टेबल डिज़ाइन करते समय MySQL डेटा टाइप लिस्ट को व्यावहारिक वर्कफ़्लो में कैसे उपयोग करें समझाएंगे।
सिर्फ टाइप्स को याद रखने के बजाय, “आपने वह टाइप क्यों चुना” को लॉजिक और चरणों के माध्यम से व्यवस्थित करने से उच्च‑गुणवत्ता वाला डेटाबेस डिज़ाइन बनता है।
5.1 चरण 1: कॉलम के “उद्देश्य” और “प्रकृति” को स्पष्ट करें
पहले, स्पष्ट रूप से परिभाषित करें कि कॉलम में क्या संग्रहीत किया जाएगा।
चेकलिस्ट
- क्या यह संख्यात्मक, स्ट्रिंग, तिथि, या एक फ्लैग है?
- क्या यह चर-लंबाई या निश्चित-लंबाई का है?
- अधिकतम मान या अधिकतम लंबाई क्या है?
- क्या NULL की अनुमति होनी चाहिए?
- क्या यह भविष्य में बढ़ने की संभावना है?
यदि आप यहां अस्पष्ट धारणाओं के साथ आगे बढ़ते हैं, तो प्रकार चयन बाद में अनावश्यक रूप से जटिल हो जाता है।
5.2 चरण 2: आवश्यक रेंज और प्रारूप का अनुमान लगाएं
अगला, उन मानों की ऊपरी/निचली सीमाएं, चरित्र लंबाई, और आवश्यक परिशुद्धता का अनुमान लगाएं जिन्हें आप संग्रहीत करेंगे।
उदाहरण: आईडी कॉलम
- अधिकतम रिकॉर्ड संख्या दसियों मिलियन तक पहुंचेगी? सैकड़ों मिलियन? → यह निर्धारित करने में मदद करता है कि
INTपर्याप्त है याBIGINTआवश्यक है।
उदाहरण: उत्पाद नाम
- औसत 15–25 चरित्र, अधिकतम लगभग 50? →
VARCHAR(50)पर्याप्त है।TEXTअनावश्यक है।
उदाहरण: मूल्य
- क्या परिशुद्धता आवश्यक है? → आपको कुछ जैसे
DECIMAL(10,2)चुनना चाहिए।
5.3 चरण 3: डेटा वॉल्यूम और प्रदर्शन पर विचार करें
मायएसक्यूएल डेटा प्रकार चुनना प्रदर्शन को सीधे प्रभावित करता है।
प्रमुख विचार
- बहुत बड़े प्रकार → भंडारण का अपव्यय और इंडेक्स को भारी बनाते हैं
TEXT/BLOB→ खोज प्रदर्शन को कमजोर करते हैंJSON→ लचीला लेकिन खोज के लिए कमजोरTIMESTAMP→ स्वचालित अपडेट और तुलनाओं के लिए कुशल
विशेष रूप से, इंडेक्स वाले कॉलमों को संभवतः सबसे हल्का डेटा प्रकार उपयोग करना चाहिए।
5.4 चरण 4: नमूना डेटा के साथ प्रकारों की पुष्टि करें
तालिका डिजाइन करने के बाद, दर्जनों से सैकड़ों पंक्तियों का परीक्षण डेटा डालें और व्यवहार की जांच करें।
क्या जांचें
- क्या अनपेक्षित गोलाई या कटौती की समस्याएं हैं?
- क्या
VARCHARपर्याप्त है, या इसेTEXTहोना चाहिए? - क्या तिथि-समय छंटाई और खोज अपेक्षित रूप से व्यवहार करती है?
- JSON पढ़ने/लिखने का प्रदर्शन
यथार्थवादी डेटा के साथ परीक्षण “सैद्धांतिक गलतफहमियों” को कम करता है।
5.5 चरण 5: स्केलेबिलिटी और रखरखाव पर विचार करें
तालिका डिजाइन के अंतिम चरण में, जांचें कि क्या भविष्य के परिवर्तन आसान होंगे।
भारी प्रकार परिवर्तनों के उदाहरण
ENUM(मान जोड़ने परALTER TABLEकी आवश्यकता)TEXT→VARCHAR(विस्तार आसान, संकुचन जोखिमपूर्ण)FLOAT→DECIMAL(अर्थ बदल सकता है)
भविष्य के विस्तार की संभावना का आकलन करके प्रकार चुनें।
5.6 चरण 6: CREATE TABLE उदाहरण (व्यावहारिक नमूना)
नीचे एक उदाहरण तालिका दी गई है जो एक सामान्य वेब एप्लिकेशन में सामान्य डेटा प्रकार चयन मानों को प्रतिबिंबित करती है।
CREATE TABLE products (
id BIGINT UNSIGNED AUTO_INCREMENT PRIMARY KEY,
name VARCHAR(100) NOT NULL,
price DECIMAL(10,2) NOT NULL,
stock INT UNSIGNED NOT NULL DEFAULT 0,
status ENUM('draft', 'published', 'archived') NOT NULL DEFAULT 'draft',
description TEXT,
created_at DATETIME NOT NULL,
updated_at TIMESTAMP NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP
);
इस उदाहरण में प्रमुख बिंदु
- id : भविष्य के पैमाने को ध्यान में रखते हुए
BIGINT UNSIGNEDका उपयोग - name : मध्यम-लंबाई चर स्ट्रिंग →
VARCHAR - price : मौद्रिक मूल्य → सटीक
DECIMAL - stock : इन्वेंटरी गणना →
INT UNSIGNED - status : निश्चित मानों का सेट →
ENUM - description : संभावित रूप से लंबा पाठ →
TEXT - updated_at : सुविधाजनक स्व-अपडेटिंग
TIMESTAMP
जैसा दिखाया गया है, हर प्रकार चुनाव का स्पष्ट तर्क होना चाहिए, और उस तर्क को स्पष्ट रूप से व्यक्त करने की क्षमता अच्छे डिजाइन की पहचान है।
6. सामान्य गलतियां और उन्हें कैसे टालें
क्योंकि मायएसक्यूएल कई डेटा प्रकार प्रदान करता है, वास्तविक परियोजनाओं में कई सामान्य गलतियां अक्सर दिखाई देती हैं।
यह खंड सामान्य गड्ढों को उजागर करता है और व्यावहारिक प्रतिकार प्रदान करता है।
6.1 अत्यधिक बड़े डेटा प्रकारों का उपयोग
सामान्य उदाहरण
- सभी आईडी को
BIGINTबनाना - हर स्ट्रिंग को
VARCHAR(255)सेट करना - गैर-पाठ्य सामग्री के लिए
TEXTका उपयोग
समस्याएं
- अपव्ययित भंडारण
- फूले हुए इंडेक्स जो क्वेरी प्रदर्शन को नुकसान पहुंचाते हैं
- अपव्ययित नेटवर्क बैंडविड्थ (बड़े डेटा हस्तांतरण)
इसे कैसे टालें
- अधिकतम और न्यूनतम मानों का अनुमान पहले से लगाएँ
- प्रमाण के आधार पर
VARCHARकी लंबाई सेट करें - केवल तभी
TEXTका उपयोग करें जब वास्तव में आवश्यक हो
6.2 दशमलव मानों के लिए FLOAT/DOUBLE का उपयोग (सटीकता समस्याएँ)
सामान्य उदाहरण
- कीमतों को
FLOATके रूप में संग्रहीत करना - राउंडिंग त्रुटियों के कारण संख्यात्मक तुलना विफल होना
कैसे बचें
- धन और सटीकता‑महत्वपूर्ण मानों के लिए
DECIMALका उपयोग करें - वैज्ञानिक या अस्थायी गणनाओं को छोड़कर
FLOAT/DOUBLEसे बचें
6.3 अत्यधिक बड़े VARCHAR कॉलम
सामान्य उदाहरण
- डिफ़ॉल्ट रूप में
VARCHAR(255)का उपयोग करना - ऐसे कॉलम के लिए बड़ी लंबाई सेट करना जो केवल लगभग 30 अक्षर संग्रहीत करते हैं
समस्याएँ
- बर्बाद मेमोरी और स्टोरेज
- इंडेक्स अक्सर भारी हो जाते हैं
कैसे बचें
- वास्तविक डेटा से औसत और अधिकतम लंबाई का अनुमान लगाएँ
- अनावश्यक रूप से बड़ी आकार से बचें (उदाहरण: ईमेल पते →
VARCHAR(100))
6.4 TEXT प्रकारों का अधिक उपयोग
सामान्य उदाहरण
- यह मान लेना कि “string = TEXT”
- फ़िल्टरिंग या खोज की आवश्यकता वाले डेटा के लिए
TEXTका उपयोग करना
समस्याएँ
- कई इंडेक्सिंग सीमाएँ
- भारी
LIKEखोजें - JOIN में धीमी प्रोसेसिंग
कैसे बचें
- केवल लंबे‑रूप सामग्री जैसे विवरण या बॉडी के लिए
TEXTका उपयोग करें - जहाँ संभव हो, खोज योग्य स्ट्रिंग्स को
VARCHARमें संग्रहीत करें
6.5 डेट/टाइम प्रकारों का चयन बिना उनकी विशेषताओं को समझे
सामान्य उदाहरण
- सब कुछ के लिए
DATETIMEका उपयोग करना - “updated at” के लिए
DATETIMEका उपयोग करना, जिससे यह स्वतः‑अपडेट नहीं होता - टाइमज़ोन अंतर के कारण टाइमस्टैम्प बदलना
कैसे बचें
- स्वतः‑अपडेट चाहिए:
TIMESTAMP - टाइमज़ोन शिफ्ट से बचना चाहते हैं:
DATETIME - केवल वर्ष चाहिए:
YEAR
6.6 ENUM / SET का बहुत सहज उपयोग
सामान्य उदाहरण
- भविष्य में विकल्प बदल सकते हैं, फिर भी
ENUMका उपयोग करना - कॉमा‑सेपरेटेड सूची की तरह
SETका उपयोग करना
समस्याएँ
- परिवर्तन के लिए
ALTER TABLEआवश्यक है - एप्लिकेशन‑साइड परिभाषाओं के साथ असंगति की संभावना अधिक है
कैसे बचें
- यदि मान बढ़ सकते हैं, तो उन्हें अलग मास्टर टेबल में प्रबंधित करें
- केवल तब
ENUMका उपयोग करें जब सेट छोटा और वास्तव में स्थिर हो
6.7 “सुविधा” के कारण JSON में बहुत अधिक डेटा पैक करना
सामान्य उदाहरण
- संरचनाओं को जो सामान्यीकृत होनी चाहिए, उन्हें JSON में पैक करना
- अक्सर खोजे जाने वाले डेटा को JSON के अंदर संग्रहीत करना
समस्याएँ
- खोज प्रदर्शन घटता है
- इंडेक्स कम प्रभावी / उपयोग करने में कठिन होते हैं
- एप्लिकेशन साइड पर अधिक पार्सिंग कार्य
- स्कीमा‑रहित डिज़ाइन से स्थिरता टूटना आसान हो जाता है
कैसे बचें
- केवल उन डेटा के लिए JSON का उपयोग करें जिन्हें आप खोजते नहीं हैं
- इसे “छोटा, परिवर्तनीय डेटा” जैसे सेटिंग्स तक सीमित रखें
- JOIN और खोज में उपयोग होने वाली जानकारी को सामान्यीकृत करें
6.8 प्रकार परिवर्तन की लागत को कम आंकना
समस्याएँ
- बड़े टेबल पर
ALTER TABLEबहुत भारी हो सकता है - सेवा डाउनटाइम या लंबा लॉक समय हो सकता है
- कुछ मामलों में, डेटा माइग्रेशन आवश्यक होता है
कैसे बचें
- डिज़ाइन चरण में भविष्य की वृद्धि की योजना बनाएँ
ENUMका सावधानीपूर्वक उपयोग करेंDECIMALकी प्रिसीजन/स्केल में जगह रखें (परन्तु अधिक न करें)
7. सारांश
MySQL विभिन्न प्रकार के डेटा टाइप्स प्रदान करता है, और आपका चयन किया गया टाइप प्रदर्शन, स्केलेबिलिटी, और रखरखाव को काफी हद तक प्रभावित कर सकता है।
विशेष रूप से वेब एप्लिकेशन जैसे वातावरण में जहाँ डेटा बढ़ता रहता है, प्रारंभिक डिज़ाइन निर्णय सीधे दीर्घकालिक गुणवत्ता को प्रभावित करते हैं।
इस लेख के मुख्य बिंदु
- डेटा टाइप्स “मान प्रकार, रेंज, प्रिसीजन, स्टोरेज, और प्रदर्शन” को प्रभावित करने वाले महत्वपूर्ण कारक हैं।
- न्यूमेरिक, स्ट्रिंग, डेट/टाइम, JSON, ENUM/SET, और BLOB टाइप्स के अपने-अपने फायदे और कमियां हैं।
- इंटीजर, स्ट्रिंग, और डेट/टाइम टाइप्स सबसे अधिक उपयोग होते हैं, इसलिए सही चयन महत्वपूर्ण है।
- JSON और ENUM सुविधाजनक हैं, लेकिन दुरुपयोग से रखरखाव कठिन हो सकता है।
TEXTऔरBLOBका अधिक उपयोग प्रदर्शन को घटा सकता है।- एक तर्कसंगत डिज़ाइन दृष्टिकोण है: “उद्देश्य → रेंज → प्रदर्शन → स्केलेबिलिटी।”
आज से आप उपयोग कर सकते हैं एक डिज़ाइन चेकलिस्ट
- क्या कॉलम का उद्देश्य स्पष्ट रूप से परिभाषित है?
- क्या आप अधिकतम और न्यूनतम संभावित मानों को समझते हैं?
- क्या चुनी गई
VARCHARलंबाई के पीछे कोई प्रमाण है? - क्या आप पैसे के लिए
DECIMALका उपयोग कर रहे हैं? - क्या “updated at” टाइमस्टैम्प को
TIMESTAMPके साथ और जहाँ उपयुक्त हो, ऑटो‑अपडेट के साथ प्रबंधित किया गया है? ENUMका उपयोग करने से पहले, क्या आपने विचार किया कि भविष्य में मान बढ़ सकते हैं?- क्या आप ऐसे डिज़ाइन से बच रहे हैं जहाँ JSON के अधिक उपयोग से खोज धीमी हो जाती है?
- क्या आपने बड़े डेटासेट पर भारी
ALTER TABLEऑपरेशनों से बचने के लिए डिज़ाइन किया है?
अंत में
MySQL डेटा टाइप चुनने के लिए हमेशा एक ही “सही उत्तर” नहीं होता।
हालाँकि, यदि आप उद्देश्य और भविष्य की वृद्धि को ध्यान में रखकर चुनते हैं, तो आप बड़े मुद्दों को रोक सकते हैं और अपने डेटा संरचना को साफ़ रख सकते हैं।
आखिरकार, सबसे अच्छा चयन आपके प्रोजेक्ट की प्रकृति, डेटा की मात्रा, और एप्लिकेशन की आवश्यकताओं पर निर्भर करता है। लेकिन यदि आप इस लेख में प्रस्तुत मानदंडों को अपनी नींव के रूप में उपयोग करते हैं, तो आप किसी भी स्थिति में बेहतर डेटा टाइप चुन सकते हैं।
आगे, हम एक FAQ सेक्शन प्रस्तुत करेंगे जो वास्तविक कार्य में अक्सर पूछे जाने वाले प्रश्नों का सारांश देगा। जब आप टाइप चयन के बारे में अनिश्चित हों, तो इस FAQ को पहले देखना आपको अधिक सहजता से निर्णय लेने में मदद करेगा।
8. अक्सर पूछे जाने वाले प्रश्न
MySQL डेटा टाइप चुनना ऐसा क्षेत्र है जहाँ निर्णय वास्तविक अनुभव के आधार पर काफी भिन्न हो सकते हैं। यहाँ हम विकास टीमों के सामान्य प्रश्नों को संकलित करते हैं और संक्षिप्त, स्पष्ट उत्तर प्रदान करते हैं।
Q1. क्या मुझे INT या BIGINT उपयोग करना चाहिए?
उ: डिफ़ॉल्ट रूप से INT उपयोग करें। BIGINT केवल तब उपयोग करें जब भविष्य में यह 2.1 बिलियन से अधिक हो सकता है।
INT (4 बाइट) लगभग 2.1 बिलियन तक समर्थन करता है और अधिकांश अनुप्रयोगों के लिए पर्याप्त है। लॉग, उच्च‑ट्रैफ़िक सेवाओं, या उन सिस्टमों के लिए BIGINT पर विचार करें जो बहुत बड़ी संख्या में IDs उत्पन्न कर सकते हैं।
Q2. क्या मुझे VARCHAR या TEXT उपयोग करना चाहिए?
उ: यदि आपको खोज की आवश्यकता है तो VARCHAR उपयोग करें। लंबी सामग्री के लिए TEXT उपयोग करें।
VARCHAR: इंडेक्स‑फ्रेंडली और खोज के लिए बेहतरTEXT: लंबी सामग्री के लिए अच्छा लेकिन खोज या JOINs के लिए आदर्श नहीं
※ TEXT का अधिक उपयोग करने से प्रदर्शन में गिरावट आ सकती है।
Q3. क्या पैसे को DOUBLE के रूप में स्टोर करना ठीक है?
उ: नहीं। हमेशा DECIMAL उपयोग करें।
DOUBLE और FLOAT राउंडिंग त्रुटियाँ उत्पन्न कर सकते हैं, इसलिए वे पैसे या सटीकता‑महत्वपूर्ण मानों के लिए उपयुक्त नहीं हैं। व्यावसायिक सिस्टम में, DECIMAL(10,2) या DECIMAL(12,2) एक सामान्य मानक है।
Q4. मैं DATETIME और TIMESTAMP के बीच अंतर नहीं समझता। मुझे कैसे चुनना चाहिए?
उ: यदि आपको ऑटो‑अपडेट की आवश्यकता है तो TIMESTAMP उपयोग करें। यदि आपको टाइम ज़ोन परिवर्तन के बिना सटीक टाइमस्टैम्प स्टोर करना है तो DATETIME उपयोग करें।
TIMESTAMP: ऑटो‑अपडेट और टाइम ज़ोन परिवर्तनDATETIME: टाइम ज़ोन से प्रभावित नहीं होता; तारीख/समय “जैसा है” वैसा ही स्टोर करता है
DATETIME अक्सर लॉग और इतिहास तालिकाओं में उपयोग किया जाता है।
Q5. क्या ENUM का उपयोग सुरक्षित है?
उ: यह केवल तब उपयोगी है जब मान “बदलने की गारंटी नहीं है”।
ENUM हल्का और सुविधाजनक है, लेकिन मान जोड़ने या बदलने के लिए ALTER TABLE की आवश्यकता होती है। उन फ़ील्ड्स के लिए जो बढ़ सकते हैं, एक अलग तालिका में मास्टर प्रबंधन की सिफारिश की जाती है।
Q6. क्या मैं अभी के लिए सिर्फ JSON उपयोग कर सकता हूँ?
उ: JSON केवल उन डेटा के लिए उपयोग करें जिन्हें आप खोजते नहीं हैं। जिन डेटा को आप खोजते हैं उन्हें सामान्यीकृत होना चाहिए।
JSON लचीला है, लेकिन इसमें प्रदर्शन संबंधी कमजोरियाँ हैं।
- खोज के लिए कमजोर
- इंडेक्स संरचनाएँ अधिक जटिल हो जाती हैं
- डेटा संगति बनाए रखना कठिन
यह सेटिंग्स और विकल्पों के लिए अच्छा काम करता है—ऐसे गुण जो खोज शर्तों के रूप में उपयोग नहीं होते।
Q7. VARCHAR की अधिकतम लंबाई कैसे तय करूँ?
उ: वास्तविक डेटा के आधार पर अधिकतम का अनुमान लगाएँ और थोड़ा बफ़र जोड़ें।
उदाहरण: ईमेल पता → VARCHAR(100) पर्याप्त है
उदाहरण: उपयोगकर्ता नाम → VARCHAR(50) अक्सर ठीक रहता है
सिर्फ “255” क्योंकि—ऐसा करने की सलाह नहीं दी जाती।
Q8. यदि मैंने गलत टाइप चुना, तो क्या बाद में बदल सकता हूँ?
उ: हाँ, लेकिन यह बड़े तालिकाओं पर बहुत भारी हो सकता है।
ALTER TABLE अक्सर पूर्ण स्कैन और पुनर्निर्माण शामिल करता है, जिससे डाउनटाइम या लंबा लॉक समय हो सकता है।
→ प्रारंभिक डिज़ाइन चरण में सावधानीपूर्वक योजना बनाना सबसे महत्वपूर्ण है.

