MySQL डेटा प्रकारों की व्याख्या: प्रदर्शन और स्केलेबिलिटी के लिए सही कॉलम प्रकार चुनें

1 1. परिचय: आपको MySQL डेटा टाइप सूची को क्यों समझना चाहिए
2 2. डेटा टाइप क्या है, और “सही टाइप चुनना” क्यों महत्वपूर्ण है?
- 2.1 डेटा टाइप की भूमिका
- 2.2 यदि आप गलत टाइप चुनते हैं तो क्या होता है?
- 2.3 आपको प्रारंभ में समझने वाले मुख्य वर्गीकरण
3 3. MySQL डेटा प्रकार श्रेणियाँ (सारांश सूची)
4 3.1 संख्यात्मक प्रकार
- 4.1 पूर्णांक प्रकार
  - 4.1.1 नोट्स
- 4.2 दशमलव / फ्लोटिंग‑पॉइंट प्रकार
  - 4.2.1 नोट्स
- 4.3 अन्य संख्यात्मक प्रकार
5 3.2 तिथि और समय प्रकार
- - 5.3.1 नोट्स
6 3.3 स्ट्रिंग / बाइनरी प्रकार
- 6.1 निश्चित‑लंबाई स्ट्रिंग्स
- 6.2 परिवर्तनीय‑लंबाई स्ट्रिंग्स
- 6.3 बड़े टेक्स्ट (TEXT परिवार)
  - 6.3.1 नोट्स
- 6.4 बाइनरी डेटा (BINARY / BLOB)
- 6.5 ENUM / SET प्रकार (एन्यूमरेशन)
  - 6.5.1 नोट्स
7 3.4 JSON प्रकार
8 3.5 स्पैशियल प्रकार
9 4. प्रत्येक डेटा प्रकार को कैसे चुनें और उपयोग करें (मुख्य निर्णय बिंदु)
10 4.1 संख्यात्मक प्रकार कैसे चुनें
- 10.1 पूर्णांक प्रकार चुनने के मानदंड
11 4.2 तिथि और समय प्रकार कैसे चुनें
- 11.1 DATETIME और TIMESTAMP के बीच अंतर
  - 11.1.1 चयन के सामान्य नियम
  - 11.1.2 जहाँ YEAR उपयोगी है
12 4.3 स्ट्रिंग प्रकार कैसे चुनें
- 12.1 CHAR और VARCHAR के बीच कैसे निर्णय लें
  - 12.1.1 जब आपको CHAR का उपयोग करना चाहिए
  - 12.1.2 जब आपको VARCHAR का उपयोग करना चाहिए
- 12.2 क्या आपको TEXT का उपयोग करना चाहिए?
  - 12.2.1 TEXT के लाभ
  - 12.2.2 TEXT के लिए सावधानियां
13 4.4 JSON प्रकार कैसे चुनें
- 13.1 जब JSON अच्छी तरह काम करता है
- 13.2 जब JSON उपयुक्त नहीं है
14 4.5 ENUM / SET प्रकार कैसे चुनें
- 14.1 जब ENUM उपयुक्त है
- 14.2 ENUM के लिए सावधानियां
- 14.3 जब SET उपयुक्त है
- 14.4 SET के लिए सावधानियां
15 4.6 बाइनरी / BLOB प्रकार कैसे चुनें
- 15.1 BINARY / VARBINARY
- 15.2 BLOB प्रकारों के सामान्य उपयोग केस
  - 15.2.1 लेकिन ध्यान दें
16 5. अभ्यास: टेबल डिज़ाइन करते समय “डेटा टाइप रेफ़रेंस लिस्ट” का उपयोग कैसे करें
17 5.1 चरण 1: कॉलम के “उद्देश्य” और “प्रकृति” को स्पष्ट करें
- 17.1 चेकलिस्ट
18 5.2 चरण 2: आवश्यक रेंज और प्रारूप का अनुमान लगाएं
- 18.1 उदाहरण: आईडी कॉलम
- 18.2 उदाहरण: उत्पाद नाम
- 18.3 उदाहरण: मूल्य
19 5.3 चरण 3: डेटा वॉल्यूम और प्रदर्शन पर विचार करें
- 19.1 प्रमुख विचार
20 5.4 चरण 4: नमूना डेटा के साथ प्रकारों की पुष्टि करें
- 20.1 क्या जांचें
21 5.5 चरण 5: स्केलेबिलिटी और रखरखाव पर विचार करें
- 21.1 भारी प्रकार परिवर्तनों के उदाहरण
22 5.6 चरण 6: CREATE TABLE उदाहरण (व्यावहारिक नमूना)
- 22.1 इस उदाहरण में प्रमुख बिंदु
23 6. सामान्य गलतियां और उन्हें कैसे टालें
24 6.1 अत्यधिक बड़े डेटा प्रकारों का उपयोग
- 24.1 सामान्य उदाहरण
- 24.2 समस्याएं
- 24.3 इसे कैसे टालें
25 6.2 दशमलव मानों के लिए FLOAT/DOUBLE का उपयोग (सटीकता समस्याएँ)
- 25.1 सामान्य उदाहरण
- 25.2 कैसे बचें
26 6.3 अत्यधिक बड़े VARCHAR कॉलम
- 26.1 सामान्य उदाहरण
- 26.2 समस्याएँ
- 26.3 कैसे बचें
27 6.4 TEXT प्रकारों का अधिक उपयोग
- 27.1 सामान्य उदाहरण
- 27.2 समस्याएँ
- 27.3 कैसे बचें
28 6.5 डेट/टाइम प्रकारों का चयन बिना उनकी विशेषताओं को समझे
- 28.1 सामान्य उदाहरण
- 28.2 कैसे बचें
29 6.6 ENUM / SET का बहुत सहज उपयोग
- 29.1 सामान्य उदाहरण
- 29.2 समस्याएँ
- 29.3 कैसे बचें
30 6.7 “सुविधा” के कारण JSON में बहुत अधिक डेटा पैक करना
- 30.1 सामान्य उदाहरण
- 30.2 समस्याएँ
- 30.3 कैसे बचें
31 6.8 प्रकार परिवर्तन की लागत को कम आंकना
- 31.1 समस्याएँ
- 31.2 कैसे बचें
32 7. सारांश
- 32.1 इस लेख के मुख्य बिंदु
- 32.2 आज से आप उपयोग कर सकते हैं एक डिज़ाइन चेकलिस्ट
- 32.3 अंत में
33 8. अक्सर पूछे जाने वाले प्रश्न
- 33.1 Q1. क्या मुझे INT या BIGINT उपयोग करना चाहिए?
- 33.2 Q2. क्या मुझे VARCHAR या TEXT उपयोग करना चाहिए?
- 33.3 Q3. क्या पैसे को DOUBLE के रूप में स्टोर करना ठीक है?
- 33.4 Q4. मैं DATETIME और TIMESTAMP के बीच अंतर नहीं समझता। मुझे कैसे चुनना चाहिए?
- 33.5 Q5. क्या ENUM का उपयोग सुरक्षित है?
- 33.6 Q6. क्या मैं अभी के लिए सिर्फ JSON उपयोग कर सकता हूँ?
- 33.7 Q7. VARCHAR की अधिकतम लंबाई कैसे तय करूँ?
- 33.8 Q8. यदि मैंने गलत टाइप चुना, तो क्या बाद में बदल सकता हूँ?

1. परिचय: आपको MySQL डेटा टाइप सूची को क्यों समझना चाहिए

जब आप MySQL के साथ टेबल डिज़ाइन करते हैं या एप्लिकेशन को इंटीग्रेट करते हैं, तो सबसे आम सवालों में से एक यह होता है: “इस कॉलम के लिए मुझे कौन सा डेटा टाइप इस्तेमाल करना चाहिए?”
क्या यह INT होना चाहिए? क्या आपको वास्तव में BIGINT की ज़रूरत है? क्या स्ट्रिंग्स के लिए VARCHAR पर्याप्त है, या TEXT बेहतर है? ये विकल्प छोटे लग सकते हैं, लेकिन ये वही बुनियाद बनाते हैं जो बाद में आपके सिस्टम को प्रभावित करती है।

यदि आप डेटा टाइप चुनने के महत्व को कम आँकते हैं, तो आप अक्सर नीचे दिए गए मुद्दों का सामना करेंगे:

जैसे ही आपका डेटा अपेक्षा से अधिक बढ़ता है, आप स्टोरेज स्पेस बर्बाद करते हैं
इंडेक्स बloat हो जाते हैं और क्वेरी प्रदर्शन धीरे‑धीरे घटता है
रेंज से बाहर के मान या ओवरफ़्लो अनपेक्षित बग या एक्सेप्शन का कारण बनते हैं
आपको बाद में कॉलम टाइप बदलने के लिए मजबूर होना पड़ता है, जिससे बड़े‑पैमाने पर माइग्रेशन की आवश्यकता होती है

दूसरे शब्दों में, MySQL डेटा टाइप को व्यवस्थित रूप से समझना और प्रत्येक उपयोग केस के लिए सही टाइप चुनना प्रदर्शन और मेंटेनबिलिटी दोनों को सुधारने का सबसे तेज़ तरीका है।

यह पेज मुख्यतः निम्नलिखित पाठकों के लिए है:

वे इंजीनियर जो MySQL के साथ गंभीर सिस्टम विकास शुरू करने वाले हैं
बैकएंड / इन्फ्रास्ट्रक्चर‑उन्मुख इंजीनियर जो मौजूदा टेबल डिज़ाइनों की समीक्षा करना चाहते हैं
वेब डेवलपर और प्रोग्रामर जो उपयोग केस के आधार पर “सिफ़ारिश किए गए टाइप” चाहते हैं

हम प्रमुख MySQL डेटा टाइप को एक वर्गीकृत “सूची” के रूप में व्यवस्थित करके शुरू करेंगे। फिर हम मुख्य टाइप—न्यूमेरिक, स्ट्रिंग, डेट/टाइम, JSON, ENUM/SET—की विशेषताओं, सामान्य उपयोग केस और चयन टिप्स को समझाएंगे। अंत में, हम सामान्य डिज़ाइन गलतियों का सारांश और उन्हें कैसे टाला जाए, साथ ही एक FAQ प्रस्तुत करेंगे।

यह केवल “टर्म्स की सूची” नहीं है। यह निर्णय‑लेने के मार्गदर्शन के रूप में संरचित है ताकि आप वास्तविक प्रोजेक्ट्स में टेबल डिज़ाइन करते समय फँसे न रहें। अगले सेक्शन में, चलिए डेटा टाइप के बारे में सोचने और वर्गीकृत सूची की समीक्षा करने में डुबकी लगाते हैं।

2. डेटा टाइप क्या है, और “सही टाइप चुनना” क्यों महत्वपूर्ण है?

डेटाबेस में, “डेटा टाइप” एक नियम है जो निर्धारित करता है कि कॉलम किस प्रकार के मान संग्रहीत कर सकता है।
MySQL कई डेटा टाइप प्रदान करता है—इंटीजर, डेसिमल, स्ट्रिंग, डेट, बाइनरी, JSON, और अधिक—इसलिए आपको अपने उद्देश्य के अनुसार उपयुक्त टाइप चुनना आवश्यक है।

डेटा टाइप की भूमिका

डेटा टाइप केवल “फ़ॉर्मेट श्रेणी” नहीं है। यह एक साथ कई भूमिकाएँ निभाता है:

डेटा के प्रकार को प्रतिबंधित करना (न्यूमेरिक बनाम स्ट्रिंग, बूलियन, आदि)
अनुमत रेंज और अंकों की संख्या निर्धारित करना
आवश्यक मेमोरी (स्टोरेज साइज) तय करना
इंडेक्स संरचनाओं और खोज प्रदर्शन को प्रभावित करना
इम्प्लिसिट कन्वर्ज़न और तुलना नियमों को प्रभावित करना (जैसे, स्ट्रिंग कोलेशन)

संक्षेप में, डेटा टाइप केवल “कंटेनर” नहीं हैं—वे मूलभूत डिज़ाइन विकल्प हैं जो पूरे डेटा मैनेजमेंट लाइफ़साइकल को प्रभावित करते हैं।

यदि आप गलत टाइप चुनते हैं तो क्या होता है?

गलत डेटा टाइप चुनने पर वास्तविक कार्य में अक्सर नीचे दिए गए समस्याएँ उत्पन्न होती हैं:

• स्टोरेज बर्बाद करना

उदाहरण के लिए, यदि BIGINT (8 बाइट) पर्याप्त है लेकिन आप गलती से DECIMAL या LONGTEXT उपयोग करते हैं, तो आप अपेक्षा से कहीं अधिक डिस्क स्पेस खपत कर सकते हैं।

• धीमी क्वेरीज़

यदि आप बड़े TEXT कॉलम पर LIKE सर्च का अधिक उपयोग करते हैं, या यदि आप अत्यधिक बड़े न्यूमेरिक टाइप चुनते हैं जिससे इंडेक्स बloat हो जाता है, तो SQL निष्पादन धीमा हो जाता है।

• असंगत मान या ओवरफ़्लो

आप ऐसे मान संग्रहीत कर सकते हैं जो INT में फिट नहीं होते, जिससे अनपेक्षित नकारात्मक मान, राउंडिंग या अन्य समस्याएँ उत्पन्न हो सकती हैं।

• महँगी टेबल परिवर्तन

विशेषकर बड़े टेबलों पर, ALTER TABLE के साथ टाइप बदलने से निम्नलिखित हो सकते हैं:

लंबी लॉक अवधि
सेवा पर प्रभाव
डेटा माइग्रेशन कार्य और अन्य जोखिम

आपको प्रारंभ में समझने वाले मुख्य वर्गीकरण

MySQL डेटा टाइप व्यापक रूप से निम्नलिखित रूप में वर्गीकृत होते हैं:

न्यूमेरिक टाइप (इंटीजर, डेसिमल)
स्ट्रिंग टाइप
डेट और टाइम टाइप
बाइनरी टाइप
JSON टाइप
ENUM / SET टाइप
स्पैशियल डेटा टाइप

Each category has different trade‑offs—strengths/weaknesses, “light vs. heavy,” and “easy vs. hard to search.” That’s why you need the optimal type selection for each use case.

3. MySQL डेटा प्रकार श्रेणियाँ (सारांश सूची)

In this section, we’ll summarize the data types available in MySQL as a categorized overview list. In practice, the first things you want to confirm are “What types exist?” and “Which one should I use?”
So here we’ll clearly show use cases, key characteristics, and representative type names, and then explain each category in more detail in the following sections.

3.1 संख्यात्मक प्रकार

Numeric types are the foundation for all numeric processing, including integers, decimals, and floating‑point values.
This category is used most frequently for IDs, quantities, prices, flag checks, and many other purposes.

पूर्णांक प्रकार

Type	Bytes	Characteristics / Use Cases
TINYINT	1B	-128 to 127. Ideal for flags and small numbers
SMALLINT	2B	-32,768 to 32,767. Lightweight integers
MEDIUMINT	3B	Integer type that can handle a mid-range
INT / INTEGER	4B	The most common integer type. Often used for IDs
BIGINT	8B	Large values (order numbers, log counters, etc.)

नोट्स

UNSIGNED जोड़ने से सकारात्मक सीमा दोगुनी हो जाती है।
INT कई मामलों में उपयोग किया जाता है, लेकिन BIGINT को सहजता से उपयोग करने से इंडेक्स भारी हो सकते हैं।

दशमलव / फ्लोटिंग‑पॉइंट प्रकार

Type	Characteristics
DECIMAL	Best for amounts like currency where errors are unacceptable
NUMERIC	Synonymous with `DECIMAL`
FLOAT	Memory-efficient, but may introduce rounding errors
DOUBLE	Higher precision than `FLOAT`, but errors can still occur

नोट्स

धन के लिए, DECIMAL ही एकमात्र उचित विकल्प है। फ्लोटिंग‑पॉइंट प्रकार (FLOAT / DOUBLE) त्रुटियाँ उत्पन्न कर सकते हैं।
कई गणनाओं वाले मामलों में, गति/सटीकता के ट्रेड‑ऑफ़ के कारण DOUBLE कभी‑कभी चुना जाता है।

अन्य संख्यात्मक प्रकार

Type	Characteristics
BIT	Bit-level flag management (0/1)
BOOL / BOOLEAN	Actually an alias for `TINYINT(1)`

3.2 तिथि और समय प्रकार

Date/time handling is used very frequently in application development.
Depending on the purpose, factors like “time zone behavior,” “automatic updates,” and “second‑level precision” differ, so choosing the right type matters.

Type	Characteristics / Use Cases
DATE	Date only (`YYYY-MM-DD`)
TIME	Time only (`HH:MM:SS`)
DATETIME	Date + time. Not affected by time zones
TIMESTAMP	Date + time. Stored as UNIX time; affected by time zones; can auto-update
YEAR	Stores the year only (`YYYY`)

नोट्स

यदि आप “updated at” को स्वचालित रूप से प्रबंधित करना चाहते हैं, तो TIMESTAMP सुविधाजनक है।
“लॉग” या “इतिहास” के लिए जहाँ सटीक टाइमस्टैम्प संग्रहीत करना चाहते हैं, DATETIME आमतौर पर उपयोग किया जाता है।

3.3 स्ट्रिंग / बाइनरी प्रकार

Usernames, emails, passwords, descriptions—strings are often the most complex area in table design.

निश्चित‑लंबाई स्ट्रिंग्स

Type	Characteristics
CHAR(n)	Always reserves space for exactly `n` characters. Suitable for fixed-length data (e.g., country codes)

परिवर्तनीय‑लंबाई स्ट्रिंग्स

Type	Characteristics
VARCHAR(n)	The most common string type. Best for data with varying length

बड़े टेक्स्ट (TEXT परिवार)

Type	Characteristics
TINYTEXT	Up to 255 characters
TEXT	Strings up to 64KB
MEDIUMTEXT	Up to 16MB
LONGTEXT	Up to 4GB

नोट्स

जब आपको लेख के मुख्य भाग या लंबी विवरण जैसी बहुत बड़ी स्ट्रिंग्स संग्रहीत करनी हों, तो TEXT का उपयोग करें।
खोज और इंडेक्स डिज़ाइन के साथ सावधान रहें।

बाइनरी डेटा (BINARY / BLOB)

Type	Characteristics
BINARY / VARBINARY	Fixed-length / variable-length binary data
BLOB / MEDIUMBLOB / LONGBLOB	Large binary data such as images and files

※ सामान्यतः, बड़े फ़ाइलें डेटाबेस में संग्रहीत नहीं की जातीं; एक सामान्य डिज़ाइन यह है कि उन्हें बाहरी स्टोरेज में रखा जाए।

ENUM / SET प्रकार (एन्यूमरेशन)

Type	Characteristics
ENUM	Select exactly one value from a predefined set of strings
SET	An enumeration type that allows selecting multiple values

नोट्स

यदि बाद में प्रकार परिभाषा बदलनी पड़े, तो रखरखाव भारी हो जाता है
यह छोटे‑पैमाने, स्थिर उम्मीदवारों के लिए प्रभावी हो सकता है

3.4 JSON प्रकार

Type	Characteristics
JSON	Stores structured data. Officially supported since MySQL 5.7

आप NoSQL‑समान लचीलापन प्राप्त करते हैं जबकि JSON‑विशिष्ट फ़ंक्शन का उपयोग भी कर सकते हैं।
हालांकि, बार‑बार खोजे जाने वाले डेटा को JSON में पैक करना अनुशंसित नहीं है। यदि इसे सामान्यीकृत किया जा सकता है, तो इसे संरचित तालिकाओं के रूप में मॉडल किया जाना चाहिए।

3.5 स्पैशियल प्रकार

These are used when working with geographic and location data.

Type	Characteristics
GEOMETRY	Base type for spatial data
POINT, LINESTRING, POLYGON	Coordinates, lines, areas, and more

In typical web applications, these aren’t used often, but they are important for map apps and GPS integrations.

4. प्रत्येक डेटा प्रकार को कैसे चुनें और उपयोग करें (मुख्य निर्णय बिंदु)

In this section, we delve deeper into the categories introduced above, focusing on “how to choose in real‑world scenarios.”
Simply knowing the names is not enough—selecting the best‑fit data type has a major impact on maintainability, performance, and future scalability.

4.1 संख्यात्मक प्रकार कैसे चुनें

पूर्णांक प्रकार चुनने के मानदंड

When selecting integer types, focus on these three points:

1. अधिकतम आवश्यक सीमा को समझें

छोटे काउंटर → TINYINT
उत्पाद मात्रा / फ़्लैग → SMALLINT / INT
बड़े‑पैमाने के IDs या लॉग → BIGINT

Some projects overuse BIGINT for primary keys, but this can easily lead to larger index sizes and may negatively impact performance.

2. सक्रिय रूप से UNSIGNED पर विचार करें

If you only handle positive values (e.g., numeric IDs, inventory counts)
→ using UNSIGNED doubles the range and may allow you to use a smaller type.

3. पैसे या सटीकता‑संकटपूर्ण मानों के लिए, DECIMAL का उपयोग करें

For values where “errors are not acceptable,” avoid FLOAT/DOUBLE and always use DECIMAL.

4.2 तिथि और समय प्रकार कैसे चुनें

The appropriate type depends on your use case.

DATETIME और TIMESTAMP के बीच अंतर

Item	DATETIME	TIMESTAMP
Time zone	Not affected	Affected (converted)
Storage format	A “string-like” date/time	Stored as UNIX time
Auto update	Manual	Can auto-update (e.g., `DEFAULT CURRENT_TIMESTAMP`)
Range	Year 1000 to 9999	Year 1970 to 2038

चयन के सामान्य नियम

एप्लिकेशन लॉग या इवेंट रिकॉर्ड → DATETIME (समय क्षेत्र परिवर्तन प्रभावों से बचें)
जब आप स्वचालित रूप से अपडेटेड टाइमस्टैम्प रिकॉर्ड करना चाहते हैं → TIMESTAMP (सुविधाजनक ऑटो‑अपडेट व्यवहार)

जहाँ YEAR उपयोगी है

वित्तीय‑वर्ष श्रेणियाँ, रिलीज़ वर्ष, स्थापना वर्ष, आदि → कॉम्पैक्ट रूप से प्रबंधित (1 बाइट)

4.3 स्ट्रिंग प्रकार कैसे चुनें

CHAR और VARCHAR के बीच कैसे निर्णय लें

जब आपको CHAR का उपयोग करना चाहिए

लंबाई हमेशा स्थिर रहती है: प्रीफ़ेक्चर कोड, देश कोड, निश्चित‑लंबाई पहचानकर्ता, आदि।
डेटा जिसे तेज़ एक्सेस की आवश्यकता है और जो कम बार अपडेट होता है

जब आपको VARCHAR का उपयोग करना चाहिए

लंबाई बदलती है: नाम, ईमेल पते, शीर्षक, आदि।
अधिकांश स्थितियों में सबसे अच्छा डिफ़ॉल्ट विकल्प

क्या आपको TEXT का उपयोग करना चाहिए?

TEXT के लाभ

बड़े टेक्स्ट का समर्थन करता है (विवरण, लेख के बॉडी आदि)।

TEXT के लिए सावधानियां

इंडेक्सिंग सीमित है (प्रिफिक्स इंडेक्स आवश्यक हैं)
JOINs या WHERE क्लॉज़ में उपयोग करने पर प्रदर्शन घट सकता है
खोज और सॉर्टिंग भारी हो सकती है

सिफारिश:
TEXT का उपयोग “बड़े स्ट्रिंग्स” जैसे बॉडी या नोट्स के लिए करें,
और बाकी सब के लिए यथासंभव VARCHAR का उपयोग करें।

4.4 JSON प्रकार कैसे चुनें

JSON प्रकार बहुत उपयोगी है, लेकिन आपको इसे “सही तरीके से” उपयोग करना चाहिए।

जब JSON अच्छी तरह काम करता है

लचीले सेटिंग्स या डेटा जिसमें फ़ील्ड्स की संख्या बदलती रहती है
सीमित लुकअप उपयोग मामलों, या जब एप्लिकेशन इसे विस्तारित/पार्स करता है
हल्का डेटा संग्रहीत करना जो मास्टर टेबल की आवश्यकता नहीं रखता

जब JSON उपयुक्त नहीं है

डेटा जिसे आप अक्सर खोजते हैं
डेटा जो फ़िल्टर्ड सर्च, एग्रीगेशन, या JOINs के लिए उपयोग होता है
संरचित डेटा जिसे सामान्यीकृत किया जाना चाहिए

सामान्य नियम:
जिस डेटा को आपको खोजने की आवश्यकता है उसे सामान्यीकृत और संरचना के रूप में माना जाना चाहिए।
भूलिए नहीं कि JSON “लचीला है लेकिन खोज के लिए कमजोर है।”

4.5 ENUM / SET प्रकार कैसे चुनें

जब ENUM उपयुक्त है

स्थितियां निश्चित हैं: उदाहरण के लिए, स्टेटस (draft / published / archived)
विकल्पों का छोटा सेट जो शायद ही बदलता है

ENUM के लिए सावधानियां

मान जोड़ने या बदलने के लिए ALTER TABLE आवश्यक है
एप्लिकेशन‑साइड परिभाषाओं के साथ संगतता खोने का जोखिम

जब SET उपयुक्त है

छोटे‑पैमाने का डेटा जो कई चयन की आवश्यकता रखता है (जैसे, उपलब्ध सप्ताह के दिन, या जब केवल कुछ टैग विकल्प हों)

SET के लिए सावधानियां

मानों के संयोजन जटिल हो सकते हैं
बहु‑मान स्थितियों का प्रबंधन कठिन हो सकता है

4.6 बाइनरी / BLOB प्रकार कैसे चुनें

BINARY / VARBINARY

टोकन, IDs, हैश मान, आदि।
निश्चित‑लंबाई बाइनरी (जैसे, 16‑बाइट UUIDs)

BLOB प्रकारों के सामान्य उपयोग केस

छोटे फ़ाइलें, थंबनेल इमेज, एन्क्रिप्टेड डेटा

लेकिन ध्यान दें

डेटाबेस में बड़े फ़ाइलें संग्रहीत करने से बैकअप भारी हो जाता है
पढ़ने/लिखने का लोड भी बढ़ता है → वास्तविक सिस्टम में, बाहरी स्टोरेज + पाथ मैनेजमेंट की सलाह दी जाती है

5. अभ्यास: टेबल डिज़ाइन करते समय “डेटा टाइप रेफ़रेंस लिस्ट” का उपयोग कैसे करें

इस सेक्शन में, हम टेबल डिज़ाइन करते समय MySQL डेटा टाइप लिस्ट को व्यावहारिक वर्कफ़्लो में कैसे उपयोग करें समझाएंगे।
सिर्फ टाइप्स को याद रखने के बजाय, “आपने वह टाइप क्यों चुना” को लॉजिक और चरणों के माध्यम से व्यवस्थित करने से उच्च‑गुणवत्ता वाला डेटाबेस डिज़ाइन बनता है।

5.1 चरण 1: कॉलम के “उद्देश्य” और “प्रकृति” को स्पष्ट करें

पहले, स्पष्ट रूप से परिभाषित करें कि कॉलम में क्या संग्रहीत किया जाएगा।

चेकलिस्ट

क्या यह संख्यात्मक, स्ट्रिंग, तिथि, या एक फ्लैग है?
क्या यह चर-लंबाई या निश्चित-लंबाई का है?
अधिकतम मान या अधिकतम लंबाई क्या है?
क्या NULL की अनुमति होनी चाहिए?
क्या यह भविष्य में बढ़ने की संभावना है?

यदि आप यहां अस्पष्ट धारणाओं के साथ आगे बढ़ते हैं, तो प्रकार चयन बाद में अनावश्यक रूप से जटिल हो जाता है।

5.2 चरण 2: आवश्यक रेंज और प्रारूप का अनुमान लगाएं

अगला, उन मानों की ऊपरी/निचली सीमाएं, चरित्र लंबाई, और आवश्यक परिशुद्धता का अनुमान लगाएं जिन्हें आप संग्रहीत करेंगे।

उदाहरण: आईडी कॉलम

अधिकतम रिकॉर्ड संख्या दसियों मिलियन तक पहुंचेगी? सैकड़ों मिलियन? → यह निर्धारित करने में मदद करता है कि INT पर्याप्त है या BIGINT आवश्यक है।

उदाहरण: उत्पाद नाम

औसत 15–25 चरित्र, अधिकतम लगभग 50? → VARCHAR(50) पर्याप्त है। TEXT अनावश्यक है।

उदाहरण: मूल्य

क्या परिशुद्धता आवश्यक है? → आपको कुछ जैसे DECIMAL(10,2) चुनना चाहिए।

5.3 चरण 3: डेटा वॉल्यूम और प्रदर्शन पर विचार करें

मायएसक्यूएल डेटा प्रकार चुनना प्रदर्शन को सीधे प्रभावित करता है।

प्रमुख विचार

बहुत बड़े प्रकार → भंडारण का अपव्यय और इंडेक्स को भारी बनाते हैं
TEXT / BLOB → खोज प्रदर्शन को कमजोर करते हैं
JSON → लचीला लेकिन खोज के लिए कमजोर
TIMESTAMP → स्वचालित अपडेट और तुलनाओं के लिए कुशल

विशेष रूप से, इंडेक्स वाले कॉलमों को संभवतः सबसे हल्का डेटा प्रकार उपयोग करना चाहिए।

5.4 चरण 4: नमूना डेटा के साथ प्रकारों की पुष्टि करें

तालिका डिजाइन करने के बाद, दर्जनों से सैकड़ों पंक्तियों का परीक्षण डेटा डालें और व्यवहार की जांच करें।

क्या जांचें

क्या अनपेक्षित गोलाई या कटौती की समस्याएं हैं?
क्या VARCHAR पर्याप्त है, या इसे TEXT होना चाहिए?
क्या तिथि-समय छंटाई और खोज अपेक्षित रूप से व्यवहार करती है?
JSON पढ़ने/लिखने का प्रदर्शन

यथार्थवादी डेटा के साथ परीक्षण “सैद्धांतिक गलतफहमियों” को कम करता है।

5.5 चरण 5: स्केलेबिलिटी और रखरखाव पर विचार करें

तालिका डिजाइन के अंतिम चरण में, जांचें कि क्या भविष्य के परिवर्तन आसान होंगे।

भारी प्रकार परिवर्तनों के उदाहरण

ENUM (मान जोड़ने पर ALTER TABLE की आवश्यकता)
TEXT → VARCHAR (विस्तार आसान, संकुचन जोखिमपूर्ण)
FLOAT → DECIMAL (अर्थ बदल सकता है)

भविष्य के विस्तार की संभावना का आकलन करके प्रकार चुनें।

5.6 चरण 6: CREATE TABLE उदाहरण (व्यावहारिक नमूना)

नीचे एक उदाहरण तालिका दी गई है जो एक सामान्य वेब एप्लिकेशन में सामान्य डेटा प्रकार चयन मानों को प्रतिबिंबित करती है।

CREATE TABLE products (
    id           BIGINT UNSIGNED AUTO_INCREMENT PRIMARY KEY,
    name         VARCHAR(100) NOT NULL,
    price        DECIMAL(10,2) NOT NULL,
    stock        INT UNSIGNED NOT NULL DEFAULT 0,
    status       ENUM('draft', 'published', 'archived') NOT NULL DEFAULT 'draft',
    description  TEXT,
    created_at   DATETIME NOT NULL,
    updated_at   TIMESTAMP NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP
);

इस उदाहरण में प्रमुख बिंदु

id : भविष्य के पैमाने को ध्यान में रखते हुए BIGINT UNSIGNED का उपयोग
name : मध्यम-लंबाई चर स्ट्रिंग → VARCHAR
price : मौद्रिक मूल्य → सटीक DECIMAL
stock : इन्वेंटरी गणना → INT UNSIGNED
status : निश्चित मानों का सेट → ENUM
description : संभावित रूप से लंबा पाठ → TEXT
updated_at : सुविधाजनक स्व-अपडेटिंग TIMESTAMP

जैसा दिखाया गया है, हर प्रकार चुनाव का स्पष्ट तर्क होना चाहिए, और उस तर्क को स्पष्ट रूप से व्यक्त करने की क्षमता अच्छे डिजाइन की पहचान है।

6. सामान्य गलतियां और उन्हें कैसे टालें

क्योंकि मायएसक्यूएल कई डेटा प्रकार प्रदान करता है, वास्तविक परियोजनाओं में कई सामान्य गलतियां अक्सर दिखाई देती हैं।
यह खंड सामान्य गड्ढों को उजागर करता है और व्यावहारिक प्रतिकार प्रदान करता है।

6.1 अत्यधिक बड़े डेटा प्रकारों का उपयोग

सामान्य उदाहरण

सभी आईडी को BIGINT बनाना
हर स्ट्रिंग को VARCHAR(255) सेट करना
गैर-पाठ्य सामग्री के लिए TEXT का उपयोग

समस्याएं

अपव्ययित भंडारण
फूले हुए इंडेक्स जो क्वेरी प्रदर्शन को नुकसान पहुंचाते हैं
अपव्ययित नेटवर्क बैंडविड्थ (बड़े डेटा हस्तांतरण)

इसे कैसे टालें

अधिकतम और न्यूनतम मानों का अनुमान पहले से लगाएँ
प्रमाण के आधार पर VARCHAR की लंबाई सेट करें
केवल तभी TEXT का उपयोग करें जब वास्तव में आवश्यक हो

6.2 दशमलव मानों के लिए FLOAT/DOUBLE का उपयोग (सटीकता समस्याएँ)

सामान्य उदाहरण

कीमतों को FLOAT के रूप में संग्रहीत करना
राउंडिंग त्रुटियों के कारण संख्यात्मक तुलना विफल होना

कैसे बचें

धन और सटीकता‑महत्वपूर्ण मानों के लिए DECIMAL का उपयोग करें
वैज्ञानिक या अस्थायी गणनाओं को छोड़कर FLOAT / DOUBLE से बचें

6.3 अत्यधिक बड़े VARCHAR कॉलम

सामान्य उदाहरण

डिफ़ॉल्ट रूप में VARCHAR(255) का उपयोग करना
ऐसे कॉलम के लिए बड़ी लंबाई सेट करना जो केवल लगभग 30 अक्षर संग्रहीत करते हैं

समस्याएँ

बर्बाद मेमोरी और स्टोरेज
इंडेक्स अक्सर भारी हो जाते हैं

कैसे बचें

वास्तविक डेटा से औसत और अधिकतम लंबाई का अनुमान लगाएँ
अनावश्यक रूप से बड़ी आकार से बचें (उदाहरण: ईमेल पते → VARCHAR(100) )

6.4 TEXT प्रकारों का अधिक उपयोग

सामान्य उदाहरण

यह मान लेना कि “string = TEXT”
फ़िल्टरिंग या खोज की आवश्यकता वाले डेटा के लिए TEXT का उपयोग करना

समस्याएँ

कई इंडेक्सिंग सीमाएँ
भारी LIKE खोजें
JOIN में धीमी प्रोसेसिंग

कैसे बचें

केवल लंबे‑रूप सामग्री जैसे विवरण या बॉडी के लिए TEXT का उपयोग करें
जहाँ संभव हो, खोज योग्य स्ट्रिंग्स को VARCHAR में संग्रहीत करें

6.5 डेट/टाइम प्रकारों का चयन बिना उनकी विशेषताओं को समझे

सामान्य उदाहरण

सब कुछ के लिए DATETIME का उपयोग करना
“updated at” के लिए DATETIME का उपयोग करना, जिससे यह स्वतः‑अपडेट नहीं होता
टाइमज़ोन अंतर के कारण टाइमस्टैम्प बदलना

कैसे बचें

स्वतः‑अपडेट चाहिए: TIMESTAMP
टाइमज़ोन शिफ्ट से बचना चाहते हैं: DATETIME
केवल वर्ष चाहिए: YEAR

6.6 ENUM / SET का बहुत सहज उपयोग

सामान्य उदाहरण

भविष्य में विकल्प बदल सकते हैं, फिर भी ENUM का उपयोग करना
कॉमा‑सेपरेटेड सूची की तरह SET का उपयोग करना

समस्याएँ

परिवर्तन के लिए ALTER TABLE आवश्यक है
एप्लिकेशन‑साइड परिभाषाओं के साथ असंगति की संभावना अधिक है

कैसे बचें

यदि मान बढ़ सकते हैं, तो उन्हें अलग मास्टर टेबल में प्रबंधित करें
केवल तब ENUM का उपयोग करें जब सेट छोटा और वास्तव में स्थिर हो

6.7 “सुविधा” के कारण JSON में बहुत अधिक डेटा पैक करना

सामान्य उदाहरण

संरचनाओं को जो सामान्यीकृत होनी चाहिए, उन्हें JSON में पैक करना
अक्सर खोजे जाने वाले डेटा को JSON के अंदर संग्रहीत करना

समस्याएँ

खोज प्रदर्शन घटता है
इंडेक्स कम प्रभावी / उपयोग करने में कठिन होते हैं
एप्लिकेशन साइड पर अधिक पार्सिंग कार्य
स्कीमा‑रहित डिज़ाइन से स्थिरता टूटना आसान हो जाता है

कैसे बचें

केवल उन डेटा के लिए JSON का उपयोग करें जिन्हें आप खोजते नहीं हैं
इसे “छोटा, परिवर्तनीय डेटा” जैसे सेटिंग्स तक सीमित रखें
JOIN और खोज में उपयोग होने वाली जानकारी को सामान्यीकृत करें

6.8 प्रकार परिवर्तन की लागत को कम आंकना

समस्याएँ

बड़े टेबल पर ALTER TABLE बहुत भारी हो सकता है
सेवा डाउनटाइम या लंबा लॉक समय हो सकता है
कुछ मामलों में, डेटा माइग्रेशन आवश्यक होता है

कैसे बचें

डिज़ाइन चरण में भविष्य की वृद्धि की योजना बनाएँ
ENUM का सावधानीपूर्वक उपयोग करें
DECIMAL की प्रिसीजन/स्केल में जगह रखें (परन्तु अधिक न करें)

7. सारांश

MySQL विभिन्न प्रकार के डेटा टाइप्स प्रदान करता है, और आपका चयन किया गया टाइप प्रदर्शन, स्केलेबिलिटी, और रखरखाव को काफी हद तक प्रभावित कर सकता है।
विशेष रूप से वेब एप्लिकेशन जैसे वातावरण में जहाँ डेटा बढ़ता रहता है, प्रारंभिक डिज़ाइन निर्णय सीधे दीर्घकालिक गुणवत्ता को प्रभावित करते हैं।

इस लेख के मुख्य बिंदु

डेटा टाइप्स “मान प्रकार, रेंज, प्रिसीजन, स्टोरेज, और प्रदर्शन” को प्रभावित करने वाले महत्वपूर्ण कारक हैं।
न्यूमेरिक, स्ट्रिंग, डेट/टाइम, JSON, ENUM/SET, और BLOB टाइप्स के अपने-अपने फायदे और कमियां हैं।
इंटीजर, स्ट्रिंग, और डेट/टाइम टाइप्स सबसे अधिक उपयोग होते हैं, इसलिए सही चयन महत्वपूर्ण है।
JSON और ENUM सुविधाजनक हैं, लेकिन दुरुपयोग से रखरखाव कठिन हो सकता है।
TEXT और BLOB का अधिक उपयोग प्रदर्शन को घटा सकता है।
एक तर्कसंगत डिज़ाइन दृष्टिकोण है: “उद्देश्य → रेंज → प्रदर्शन → स्केलेबिलिटी।”

आज से आप उपयोग कर सकते हैं एक डिज़ाइन चेकलिस्ट

क्या कॉलम का उद्देश्य स्पष्ट रूप से परिभाषित है?
क्या आप अधिकतम और न्यूनतम संभावित मानों को समझते हैं?
क्या चुनी गई VARCHAR लंबाई के पीछे कोई प्रमाण है?
क्या आप पैसे के लिए DECIMAL का उपयोग कर रहे हैं?
क्या “updated at” टाइमस्टैम्प को TIMESTAMP के साथ और जहाँ उपयुक्त हो, ऑटो‑अपडेट के साथ प्रबंधित किया गया है?
ENUM का उपयोग करने से पहले, क्या आपने विचार किया कि भविष्य में मान बढ़ सकते हैं?
क्या आप ऐसे डिज़ाइन से बच रहे हैं जहाँ JSON के अधिक उपयोग से खोज धीमी हो जाती है?
क्या आपने बड़े डेटासेट पर भारी ALTER TABLE ऑपरेशनों से बचने के लिए डिज़ाइन किया है?

अंत में

MySQL डेटा टाइप चुनने के लिए हमेशा एक ही “सही उत्तर” नहीं होता।
हालाँकि, यदि आप उद्देश्य और भविष्य की वृद्धि को ध्यान में रखकर चुनते हैं, तो आप बड़े मुद्दों को रोक सकते हैं और अपने डेटा संरचना को साफ़ रख सकते हैं।

आखिरकार, सबसे अच्छा चयन आपके प्रोजेक्ट की प्रकृति, डेटा की मात्रा, और एप्लिकेशन की आवश्यकताओं पर निर्भर करता है। लेकिन यदि आप इस लेख में प्रस्तुत मानदंडों को अपनी नींव के रूप में उपयोग करते हैं, तो आप किसी भी स्थिति में बेहतर डेटा टाइप चुन सकते हैं।

आगे, हम एक FAQ सेक्शन प्रस्तुत करेंगे जो वास्तविक कार्य में अक्सर पूछे जाने वाले प्रश्नों का सारांश देगा। जब आप टाइप चयन के बारे में अनिश्चित हों, तो इस FAQ को पहले देखना आपको अधिक सहजता से निर्णय लेने में मदद करेगा।

8. अक्सर पूछे जाने वाले प्रश्न

MySQL डेटा टाइप चुनना ऐसा क्षेत्र है जहाँ निर्णय वास्तविक अनुभव के आधार पर काफी भिन्न हो सकते हैं। यहाँ हम विकास टीमों के सामान्य प्रश्नों को संकलित करते हैं और संक्षिप्त, स्पष्ट उत्तर प्रदान करते हैं।

Q1. क्या मुझे INT या BIGINT उपयोग करना चाहिए?

उ: डिफ़ॉल्ट रूप से INT उपयोग करें। BIGINT केवल तब उपयोग करें जब भविष्य में यह 2.1 बिलियन से अधिक हो सकता है।

INT (4 बाइट) लगभग 2.1 बिलियन तक समर्थन करता है और अधिकांश अनुप्रयोगों के लिए पर्याप्त है। लॉग, उच्च‑ट्रैफ़िक सेवाओं, या उन सिस्टमों के लिए BIGINT पर विचार करें जो बहुत बड़ी संख्या में IDs उत्पन्न कर सकते हैं।

Q2. क्या मुझे VARCHAR या TEXT उपयोग करना चाहिए?

उ: यदि आपको खोज की आवश्यकता है तो VARCHAR उपयोग करें। लंबी सामग्री के लिए TEXT उपयोग करें।

VARCHAR : इंडेक्स‑फ्रेंडली और खोज के लिए बेहतर
TEXT : लंबी सामग्री के लिए अच्छा लेकिन खोज या JOINs के लिए आदर्श नहीं

※ TEXT का अधिक उपयोग करने से प्रदर्शन में गिरावट आ सकती है।

Q3. क्या पैसे को DOUBLE के रूप में स्टोर करना ठीक है?

उ: नहीं। हमेशा DECIMAL उपयोग करें।

DOUBLE और FLOAT राउंडिंग त्रुटियाँ उत्पन्न कर सकते हैं, इसलिए वे पैसे या सटीकता‑महत्वपूर्ण मानों के लिए उपयुक्त नहीं हैं। व्यावसायिक सिस्टम में, DECIMAL(10,2) या DECIMAL(12,2) एक सामान्य मानक है।

Q4. मैं DATETIME और TIMESTAMP के बीच अंतर नहीं समझता। मुझे कैसे चुनना चाहिए?

उ: यदि आपको ऑटो‑अपडेट की आवश्यकता है तो TIMESTAMP उपयोग करें। यदि आपको टाइम ज़ोन परिवर्तन के बिना सटीक टाइमस्टैम्प स्टोर करना है तो DATETIME उपयोग करें।

TIMESTAMP : ऑटो‑अपडेट और टाइम ज़ोन परिवर्तन
DATETIME : टाइम ज़ोन से प्रभावित नहीं होता; तारीख/समय “जैसा है” वैसा ही स्टोर करता है

DATETIME अक्सर लॉग और इतिहास तालिकाओं में उपयोग किया जाता है।

Q5. क्या ENUM का उपयोग सुरक्षित है?

उ: यह केवल तब उपयोगी है जब मान “बदलने की गारंटी नहीं है”।

ENUM हल्का और सुविधाजनक है, लेकिन मान जोड़ने या बदलने के लिए ALTER TABLE की आवश्यकता होती है। उन फ़ील्ड्स के लिए जो बढ़ सकते हैं, एक अलग तालिका में मास्टर प्रबंधन की सिफारिश की जाती है।

Q6. क्या मैं अभी के लिए सिर्फ JSON उपयोग कर सकता हूँ?

उ: JSON केवल उन डेटा के लिए उपयोग करें जिन्हें आप खोजते नहीं हैं। जिन डेटा को आप खोजते हैं उन्हें सामान्यीकृत होना चाहिए।

JSON लचीला है, लेकिन इसमें प्रदर्शन संबंधी कमजोरियाँ हैं।

खोज के लिए कमजोर
इंडेक्स संरचनाएँ अधिक जटिल हो जाती हैं
डेटा संगति बनाए रखना कठिन

यह सेटिंग्स और विकल्पों के लिए अच्छा काम करता है—ऐसे गुण जो खोज शर्तों के रूप में उपयोग नहीं होते।

Q7. VARCHAR की अधिकतम लंबाई कैसे तय करूँ?

उ: वास्तविक डेटा के आधार पर अधिकतम का अनुमान लगाएँ और थोड़ा बफ़र जोड़ें।

उदाहरण: ईमेल पता → VARCHAR(100) पर्याप्त है
उदाहरण: उपयोगकर्ता नाम → VARCHAR(50) अक्सर ठीक रहता है

सिर्फ “255” क्योंकि—ऐसा करने की सलाह नहीं दी जाती।

Q8. यदि मैंने गलत टाइप चुना, तो क्या बाद में बदल सकता हूँ?

उ: हाँ, लेकिन यह बड़े तालिकाओं पर बहुत भारी हो सकता है।

ALTER TABLE अक्सर पूर्ण स्कैन और पुनर्निर्माण शामिल करता है, जिससे डाउनटाइम या लंबा लॉक समय हो सकता है।

→ प्रारंभिक डिज़ाइन चरण में सावधानीपूर्वक योजना बनाना सबसे महत्वपूर्ण है.