- 1 1. හැඳින්වීම
- 2 2. MySQL හි නියමිත ප්රකාශන මූලික කරුණු සහ ව්යවස්ථා
- 3 සාරාංශ
- 4 3. MySQL 8.0 සහ පසුගිය සංස්කරණවල එකතු කරන ලද නියම රෙගුලාසි ක්රියාකාරකම්
- 5 4. MySQL නියමිත ප්රකාශන වල ප්රායෝගික උදාහරණ
- 6 Summary
- 7 5. Important Considerations When Using Regular Expressions (Performance and Security)
- 8 Summary
- 9 6. FAQ (නිතර අසන ප්රශ්න)
- 10 සාරාංශය
- 11 7. සාරාංශය
1. හැඳින්වීම
MySQL හි නියමිත ප්රකාශන (Regular Expressions) භාවිතය
MySQL යනු දත්ත සොයා ගැනීම සහ සැකසීම සඳහා ශක්තිමත් දත්ත ගබඩා කළමනාකරණ පද්ධතියක් වන අතර, නියමිත ප්රකාශන (REGEXP) භාවිතයෙන් වඩාත් සවිස්තරාත්මක සෙවීම් සිදු කිරීමට සහාය දක්වයි. නියමිත ප්රකාශන භාවිතා කිරීමෙන්, ඔබට විශේෂිත රටා සමඟ ගැලපෙන දත්ත කාර්යක්ෂමව ලබා ගත හැකි අතර, දත්ත ආකෘතිකරණය හෝ වලංගුකරණයද සිදු කළ හැකිය.
MySQL හි නියමිත ප්රකාශන භාවිතයේ ප්රතිලාභ
MySQL නියමිත ප්රකාශන භාවිතා කිරීමෙන් පහත වැනි ප්රතිලාභ ලැබේ:
- උසස් සෙවීම් : විශේෂිත අක්ෂර මාලා හෝ රටා අඩංගු දත්ත පහසුවෙන් ලබා ගත හැකිය.
- දත්ත අඛණ්ඩතාව පරීක්ෂා කිරීම : ඇතුළත් කිරීමේ වලංගුකරණය (උදා. ඊමේල් ලිපින ආකෘති වලංගුකරණය) සඳහා ප්රයෝජනවත් වේ.
- LIKE මෙහෙයුමට වඩා ශක්තිමත් : LIKE මෙහෙයුම වැනි වයිල්ඩ්කාඩ් (
%සහ_) භාවිතා කරන අතර, REGEXP ඔබට සංකීර්ණ සෙවීම් කොන්දේසි වඩා සවිස්තරාත්මකව නිර්වචනය කිරීමට ඉඩ සලසයි.
මෙම ලිපියේ අරමුණ සහ ව්යුහය
මෙම ලිපිය MySQL හි නියමිත ප්රකාශන මූලික කරුණු සිට උසස් භාවිතය, කාර්ය සාධන අභිප්රේරණය, සහ MySQL 8.0 සහ ඊට පසු නිකුත් කරන ලද නව නියමිත ප්රකාශන ක්රියාකාරකම් දක්වා සියල්ල පැහැදිලි කරයි. ප්රායෝගික උදාහරණ සමඟ, අරම්භකයන්ටත් පහසුවෙන් අවබෝධ කරගත හැකි ලෙස අන්තර්ගතය සැලසුම් කර ඇත.
ලිපියේ ව්යුහය:
- MySQL නියමිත ප්රකාශන මූලික කරුණු සහ ව්යවස්ථා
- MySQL 8.0 සහ ඊට පසු එකතු කරන ලද නියමිත ප්රකාශන ක්රියාකාරකම්
- ප්රායෝගික උදාහරණ (වලංගුකරණය, දත්ත ලබා ගැනීම, ආකෘති පරිවර්තනය)
- නියමිත ප්රකාශන භාවිතයේ වැදගත් සැලකිලි (කාර්ය සාධනය, ආරක්ෂාව)
- FAQ (නිතර අසන ප්රශ්න)
- සාරාංශය
2. MySQL හි නියමිත ප්රකාශන මූලික කරුණු සහ ව්යවස්ථා
MySQL හි නියමිත ප්රකාශන භාවිතා කරන ආකාරය
MySQL හි, ඔබ REGEXP මෙහෙයුම (හෝ RLIKE) භාවිතා කර නියමිත ප්රකාශන සමඟ වැඩ කරයි. LIKE මෙහෙයුමට සමානව, එය තීරණය කිරීම සඳහා භාවිතා වේ කෝලමයක් නියමිත රෙගෙක්ස් රටාවකට ගැලපේද යන්න.
මූලික ව්යවස්ථා
SELECT * FROM table_name WHERE column_name REGEXP 'regex_pattern';
හෝ
SELECT * FROM table_name WHERE column_name RLIKE 'regex_pattern';
RLIKE යනු REGEXP සඳහා වෙනත් නාමයක් වන අතර, දෙකම එකම ආකාරයෙන් ක්රියා කරයි.
උදාහරණ
උදාහරණයක් ලෙස, නාමය තුළ “山” අක්ෂරය අඩංගු වාර්තා සෙවීමට:
SELECT * FROM users WHERE name REGEXP '山';
නියමිත ප්රකාශන මූලික රටා
MySQL නියමිත ප්රකාශන වල, ඔබට පහත පරිදි රටා භාවිතා කළ හැකිය.
| Symbol | Meaning | Example | Result |
|---|---|---|---|
. | Any single character | a.c | Matches “abc”, “aac”, “adc” |
^ | Start of the string | ^abc | Matches “abcde” but not “dabc” |
$ | End of the string | xyz$ | Matches “axyz” but not “xyzb” |
[] | Any one of the specified characters | [abc] | Matches “a”, “b”, or “c” |
[^] | Any character not in the specified set | [^abc] | Matches any character except “a”, “b”, or “c” |
* | Repeat the preceding character 0 or more times | a* | Matches “”, “a”, “aa”, “aaa”, etc. |
+ | Repeat the preceding character 1 or more times | a+ | Matches “a”, “aa”, “aaa”, etc. (does not match the empty string) |
{n} | Repeat the preceding character exactly n times | a{3} | Matches “aaa” |
{n,} | Repeat the preceding character at least n times | a{2,} | Matches “aa”, “aaa”, “aaaa”, etc. |
{n,m} | Repeat the preceding character between n and m times | a{2,4} | Matches “aa”, “aaa”, “aaaa” |
LIKE මෙහෙයුම සමඟ වෙනස්කම්
MySQL LIKE මෙහෙයුමද ලබා දේ, එය සරල රටා ගැලපීම සඳහා සාමාන්යයෙන් භාවිතා වේ. නමුත්, REGEXP යනු LIKE ට වඩා ශක්තිමත් වන අතර, වඩා සංකීර්ණ කොන්දේසි සමඟ සෙවීම් සිදු කළ හැකිය.
උදාහරණ 1: LIKE මෙහෙයුම භාවිතා කිරීම
SELECT * FROM users WHERE name LIKE '%山%';
LIKEසමඟ, ඔබට山අඩංගු දත්ත සෙවිය හැකි නමුත්, සරල වයිල්ඩ්කාඩ් (%සහ_) පමණක් භාවිතා කළ හැකිය.
උදාහරණ 2: REGEXP මෙහෙයුම භාවිතා කිරීම
SELECT * FROM users WHERE name REGEXP '^山';
REGEXPසමඟ, නාමය 山 සමඟ ආරම්භ වන දත්ත පමණක් ලබා ගත හැකිය.
බහු රටා නිරූපණය කිරීමේ ආකාරය
ඔබ | භාවිතා කර OR කොන්දේසිය සමඟ බහු රටා නිරූපණය කළ හැකිය.
උදාහරණ: අවසාන නාමය “佐藤” හෝ “田中” වන පරිශීලකයින් ලබා ගන්න
SELECT * FROM users WHERE name REGEXP '佐藤|田中';
නකරු (Negative) ගැලපීම
කොටුලක ඇතුළත ^ භාවිතා කළහොත්, “නිශ්චිත අක්ෂර අඩංගු නොවන” දත්ත ලබා ගත හැකිය.
උදාහරණ: “山” නොවන අක්ෂරයෙන් ආරම්භ වන දත්ත
SELECT * FROM users WHERE name REGEXP '^[^山]';
මෙම අවස්ථාවේ, නාමය 山 සමඟ ආරම්භ නොවන වාර්තා පෙන්වයි.
සාරාංශ
- MySQL හි,
REGEXPයනුLIKEට වඩා ශක්තිමත් රටා සෙවීම සක්රිය කරයි. - මූලික ව්යවස්ථා සහ රටා (
.,^,$,[],*,+, ආදිය) අවබෝධ කර ගැනීම මඟින් ලවච්ච සෙවීම් සිදු කළ හැක. LIKEසමඟ ඇති වෙනස්කම් අවබෝධ කර ඒ අනුව භාවිතා කිරීම වැදගත් වේ.|භාවිතා කිරීමෙන් බහු රටා සමඟ සෙවිය හැක.- නකලත් අක්ෂර පන්තිය
[^ ]භාවිතා කිරීමෙන් නියමිත අක්ෂර වලින් ආරම්භ නොවන දත්ත සෙවිය හැක.
3. MySQL 8.0 සහ පසුගිය සංස්කරණවල එකතු කරන ලද නියම රෙගුලාසි ක්රියාකාරකම්
MySQL 8.0 හි, සාම්ප්රදායික REGEXP මෙහෙයුමට අමතරව, නව ක්රියාකාරකම් හතරක් එකතු කර ඇත, එමඟින් වඩා ලවච්ච නියම රෙගුලාසි සෙවීම් සිදු කළ හැක. මෙය ගැලපීම් ස්ථාන ලබා ගැනීම, උපස්තර ලබා ගැනීම, සහ ප්රතිස්ථාපන සිදු කිරීම සක්රිය කරයි, MySQL හි රෙගෙක්ස් සමඟ ඔබට කළ හැකි දේවල් විශාල ලෙස විස්තාර කරයි.
මෙම කොටසේ, අපි නව නියම රෙගුලාසි ක්රියාකාරකම් එක් එක් විස්තරාත්මකව පැහැදිලි කර, ප්රායෝගික උදාහරණ පෙන්වමු.
3.1 REGEXP_LIKE()
සාරාංශය
REGEXP_LIKE(), REGEXP මෙහෙයුම වැනි, තීරුවේ අගය නිර්දේශිත රෙගුලාසි රටාවකට ගැලපේදැයි පරීක්ෂා කරයි.
ව්යවස්ථාව
REGEXP_LIKE(column_name, 'regex_pattern' [, flags])
column_name: සෙවිය යුතු තීරුව'regex_pattern': කොන්දේසිය ලෙස භාවිතා කරන රෙගුලාසි රටාවflags (optional): අකුරු සංවේදනය (case sensitivity) (case‑insensitive ගැලපීම සඳහාiභාවිතා කරන්න)
උදාහරණ
“gmail.com හෝ yahoo.co.jp සමඟ අවසන් වන ඊමේල් ලිපිනයක් ඇති පරිශීලකයින් ලබා ගන්න”
SELECT * FROM users WHERE REGEXP_LIKE(email, '(@gmail\.com|@yahoo\.co\.jp)$');
“’admin’ අඩංගු පරිශීලක නාම සෙවීම (අකුරු සංවේදනය නොවන)”
SELECT * FROM users WHERE REGEXP_LIKE(username, 'admin', 'i');
✅ REGEXP_LIKE() REGEXP මෙහෙයුමට සමාන කාර්යයක් කරයි, නමුත් එය වඩා ප්රමිතියට අනුකූල SQL‑හිතකාමී රීතියක් ලබා දෙයි.
3.2 REGEXP_INSTR()
සාරාංශය
REGEXP_INSTR() ස්ට්රින්ග් එක තුළ රෙගුලාසි ගැලපීම සිදුවන ස්ථානය (ආරම්භක අංකය) ලබා දෙයි.
ව්යවස්ථාව
REGEXP_INSTR(column_name, 'regex_pattern' [, start_position, occurrence, return_option, flags])
start_position(විකල්ප): සෙවීම ආරම්භ කරන ස්ථානය (පෙරනිමි: 1)occurrence(විකල්ප): ලබා දිය යුතු ගැලපීමේ සංඛ්යාව (පෙරනිමි: 1)return_option(විකල්ප): 0 (ආරම්භක ස්ථානය ලබා දෙයි) හෝ 1 (ගැලපීමේ අවසන් ස්ථානය ලබා දෙයි)flags(විකල්ප): case‑insensitive ගැලපීම සඳහාiභාවිතා කරන්න
උදාහරණ
“දුරකථන අංකය 090 හෝ 080 සමඟ ආරම්භ වූ විට, ආරම්භක ස්ථානය ලබා ගන්න”
SELECT phone, REGEXP_INSTR(phone, '^(090|080)') AS match_pos FROM users;
“ඊමේල් ලිපිනයේ ඩොමේන් කොටසෙහි ආරම්භක ස්ථානය ලබා ගන්න”
SELECT email, REGEXP_INSTR(email, '@') AS domain_start FROM users;
- එය
@ලකුණ සොයාගත් ස්ථානය ලබා දෙයි (උදාහරණයක් ලෙස,user@example.comහි5ලෙස 반환 වේ).
✅ REGEXP_INSTR() සමඟ, ඔබට ස්ථාන තොරතුරු ලබා ගත හැකි අතර, ස්ට්රින්ග් සැකසීමේ විකල්පයන් පුළුල් කරයි.
3.3 REGEXP_SUBSTR()
සාරාංශය
REGEXP_SUBSTR() රෙගුලාසි රටාවකට ගැලපෙන උපස්තරය ස්ට්රින්ග් එකෙන් ලබා ගනී.
ව්යවස්ථාව
REGEXP_SUBSTR(column_name, 'regex_pattern' [, start_position, occurrence, flags])
occurrence(විකල්ප): n වැනි ගැලපීම ලබා ගන්න (පෙරනිමි: 1)flags(විකල්ප): අකුරු සංවේදනය (iභාවිතා කර අකුරු සංවේදනය නොකරන්න)
උදාහරණ
“ඊමේල් ලිපිනයේ ඩොමේන් කොටස පමණක් ලබා ගන්න”
SELECT email, REGEXP_SUBSTR(email, '@[a-zA-Z0-9.-]+') AS domain FROM users;
“පණිවිඩයක පළමු අංක අනුක්රමය ලබා ගන්න”
SELECT message, REGEXP_SUBSTR(message, '[0-9]+') AS first_number FROM logs;
✅ REGEXP_SUBSTR() සමඟ, ඔබට විශේෂ රටා ලබා ගනිමින් දත්ත සංවිධානය සහ පරිවර්තනය සඳහා භාවිතා කළ හැක.
3.4 REGEXP_REPLACE()
සාරාංශය
REGEXP_REPLACE() රෙගුලාසි රටාවකට ගැලපෙන උපස්තරයන් වෙනත් ස්ට්රින්ග් එකක් සමඟ ප්රතිස්ථාපනය කරයි.
ව්යවස්ථාව
REGEXP_REPLACE(column_name, 'regex_pattern', 'replacement' [, occurrence, flags])
replacement: ගැලපෙන කොටස ප්රතිස්ථාපනය කිරීමට භාවිතා කරන stringoccurrence(විකල්ප): nth ගැලපීම පමණක් ප්රතිස්ථාපනය කරන්න (අවලංගු කර ඇත්නම්, සියලු ගැලපීම් ප්රතිස්ථාපනය වේ)flags(විකල්ප): case‑insensitive ගැලපීම සඳහාiභාවිතා කරන්න
උදාහරණ
“දුරකථන අංක වලින් හයිෆන් (-) ඉවත් කරන්න”
SELECT phone, REGEXP_REPLACE(phone, '-', '') AS clean_phone FROM users;
“HTML ටැග් ඉවත් කරන්න”
SELECT comment, REGEXP_REPLACE(comment, '<[^>]+>', '') AS clean_text FROM reviews;
✅ REGEXP_REPLACE() සමඟ, ආකෘති පරිවර්තනය සහ දත්ත පිරිසිදු කිරීම පහසු වේ.
3.5 සාරාංශය
| Function | Purpose | Example |
|---|---|---|
REGEXP_LIKE() | Check whether a value matches a regex pattern | SELECT * FROM users WHERE REGEXP_LIKE(email, '@gmail\.com$'); |
REGEXP_INSTR() | Get the start position of the matched substring | SELECT REGEXP_INSTR(email, '@') FROM users; |
REGEXP_SUBSTR() | Extract the matched substring | SELECT REGEXP_SUBSTR(email, '@[a-zA-Z0-9.-]+') FROM users; |
REGEXP_REPLACE() | Replace the matched substring | SELECT REGEXP_REPLACE(phone, '-', '') FROM users; |
4. MySQL නියමිත ප්රකාශන වල ප්රායෝගික උදාහරණ
MySQL නියමිත ප්රකාශන භාවිතා කිරීමෙන්, ඔබට දත්ත වලංගු කිරීම, විශේෂ දත්ත ලබා ගැනීම, සහ ආකෘති පරිවර්තනය වැනි වාස්තුක දත්ත සැකසීමේ කාර්යයන් සරල කළ හැක. මෙම කොටසේ, SQL කේත සහ විස්තර සමඟ ප්රායෝගික භාවිතා කේස් හඳුන්වා දෙමු.
4.1 ඊමේල් ලිපින වලංගු කිරීම
සමාලෝචනය
දත්ත ගබඩාවේ සුරැකි ඊමේල් ලිපින වලංගු ආකෘතියකට අනුකූලදැයි පරීක්ෂා කිරීමට නියමිත ප්රකාශන භාවිතා කරන්න.
භාවිතා කිරීමට SQL
SELECT email FROM users
WHERE email REGEXP '^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$';
විස්තර
^[a-zA-Z0-9._%+-]+→@ට පෙර අක්ෂර‑අංක, බින්දු, අඩි රේඛා, හෝ පළමු ලකුණු එකක් හෝ වැඩි@[a-zA-Z0-9.-]+→@පසු ඩොමේන් නාමයක්\.[a-zA-Z]{2,}$→ අවම වශයෙන් අක්ෂර 2ක් ඇති TLD (ඉහළ‑මට්ටමේ ඩොමේන්) සමඟ අවසන් වේ (උදා:.com,.jp,.net)
මෙම විමසුම සමඟ, ඔබට වලංගු නොවන ඊමේල් ලිපින (උදා: user@@example.com, user@.com) ඉවත් කළ හැක.
4.2 ජපන් දුරකථන අංක ආකෘති පරීක්ෂා කිරීම
සමාලෝචනය
සාමාන්ය ජපන් දුරකථන අංක (උදා: 090-1234-5678, 03-1234-5678) නිවැරදි ආකෘතියට අනුකූලදැයි තීරණය කරන්න.
භාවිතා කිරීමට SQL
SELECT phone FROM users
WHERE phone REGEXP '^(0[789]0-[0-9]{4}-[0-9]{4}|0[1-9]-[0-9]{4}-[0-9]{4})$';
විස්තර
0[789]0-[0-9]{4}-[0-9]{4}→ ජංගම අංක (090-xxxx-xxxx,080-xxxx-xxxx, ආදිය )0[1-9]-[0-9]{4}-[0-9]{4}→ ස්ථාවර අංක (03-xxxx-xxxx,06-xxxx-xxxx, ආදිය )
මෙම ආකාරයෙන්, ආකෘති අඛණ්ඩතාව අවශ්ය වන විට නියමිත ප්රකාශන ප්රයෝජනවත් වේ.
4.3 ක්රෙඩිට් කාඩ් අංක ආකෘති වලංගු කිරීම
සමාලෝචනය
ක්රෙඩිට් කාඩ් අංක (Visa, Mastercard, American Express, ආදිය) ආකෘති වලංගු කරන්න.
භාවිතා කිරීමට SQL
SELECT card_number FROM payments
WHERE card_number REGEXP '^(4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|3[47][0-9]{13})$';
විස්තර
^4[0-9]{12}(?:[0-9]{3})?$→ Visa (16 අංක හෝ 13 අංක)^5[1-5][0-9]{14}$→ Mastercard (අංක 16)^3[47][0-9]{13}$→ American Express (අංක 15)
මෙම විමසුම සමඟ, ඔබට දත්ත ගබඩාවේ වලංගු නොවන කාඩ් අංක (උදා: වැරදි දිග හෝ අසත්ය ආරම්භක අංක) ඉවත් කළ හැක.
4.4 HTML ටැග් ඉවත් කිරීම
සමාලෝචනය
පරිශීලක‑ඉදිරිපත් කළ දත්ත HTML ටැග් අඩංගු නම්, ඔබට ඒවා ඉවත් කර අන්තර්ගතය සාමාන්ය පෙළට පරිවර්තනය කළ හැක.
භාවිතා කිරීමට SQL
SELECT REGEXP_REPLACE(comment, '<[^>]+>', '') AS clean_comment FROM reviews;
විස්තර
'<[^>]+>'→<සහ>අතර ඇති සියලු HTML ටැග් ඉවත් කරයි
උදාහරණ
| Input | Output |
|---|---|
<b>Hello</b> World! | Hello World! |
<p>これはサンプルです</p> | これはサンプルです |
මෙය පරිශීලක අදහස් සහ බ්ලොග් පෝස්ට් වලින් HTML ටැග් ඉවත් කිරීම සඳහා ප්රයෝජනවත් වේ.
4.5 තැපැල් කේත ආකෘති වලංගු කිරීම (ජපානය)
සමාලෝචනය
ජපන් තැපැල් කේත (උදා: 123-4567) නිවැරදි ආකෘතියට අනුකූලදැයි පරීක්ෂා කරන්න.
භාවිතා කිරීමට SQL
SELECT postal_code FROM addresses
WHERE postal_code REGEXP '^[0-9]{3}-[0-9]{4}$';
විස්තර
^[0-9]{3}-[0-9]{4}$→ “3 අංක-4 අංක” ආකෘතියේ තැපැල් කේතයක්
මෙම නියමිත ප්රකාශන භාවිතයෙන් දත්ත අඛණ්ඩතාව රැක ගැනීමට සහ වැරදි ආකෘති වැළැක්වීමට උපකාරී වේ.
4.6 පරිශීලක නාම පිරික්සුම (අවසර නොලත් වචන හඳුනා ගැනීම)
සමාලෝචනය
Check whether usernames contain disallowed words reserved for system use (e.g., admin, root, system) during registration.
SQL to Use
SELECT username FROM users
WHERE username REGEXP 'admin|root|system';
Explanation
admin|root|system→ මෙම පදයන් අඩංගු පරිශීලක නාමයන් හඳුනා ගනී
මෙම විමසුම සාමාන්ය පරිශීලකයන්ට පද්ධති පරිපාලකයන් සඳහා නියමිත නාම භාවිතය වැළැක්වීමට උපකාරී වේ.
Summary
- නියමිත පදනම් ඊමේල් ලිපින, දුරකථන අංක, සහ ණය පත අංක වල සත්යාපනය සඳහා භාවිතා කළ හැක.
- එමඟින් HTML ටැග් ඉවත් කිරීම සහ දත්ත ආකෘති පරිවර්තනය කිරීමටද භාවිතා කළ හැක.
- අනුමත නොකළ වචන පෙරහන් කිරීම සහ තැපැල් කේත සත්යාපනය වැනි කාර්යයන් මගින් දත්ත ගබඩා ආරක්ෂාව සහ සමතුලිතතාවය වැඩිදියුණු කිරීමේදී ඒවා ප්රයෝජනවත් වේ.

5. Important Considerations When Using Regular Expressions (Performance and Security)
Using regular expressions in MySQL enables powerful searching and data cleansing. However, improper usage can cause performance degradation and introduce security risks. This section explains key considerations for using MySQL regular expressions safely and efficiently.
5.1 Performance Optimization for Regular Expressions
MySQL regex searching is convenient, but it has a drawback: indexes generally do not apply, which can make queries slower.
Measures to Improve Performance
LIKEහෝFULLTEXTසුචක එකතු කරන්නSELECT * FROM users WHERE email LIKE '%gmail.com';
- සරල නියමිත පදනම් භාවිතා කරන්න
SELECT * FROM users WHERE name REGEXP '^admin|admin$';
- ඉලක්ක දත්ත පළමුව පෙරහන් කරන්න
SELECT * FROM users WHERE email LIKE 'a%' AND email REGEXP '^[a-zA-Z0-9._%+-]+@gmail\.com$';
5.2 Security Risks and Countermeasures
1. නියමිත පදනම් DoS (ReDoS)
.*වැනි සීමාව නොමැති ගැලපුම් වලින් වැළකින්න.- සෙවීමේ පරාසය සීමා කිරීමට
^සහ$භාවිතා කරන්න. - පරිශීලක ආදානය සෘජුව
REGEXPවෙත ලබා නොදෙන්න.
2. SQL Injection සහ නියමිත පදනම්
❌ Unsafe query
SELECT * FROM users WHERE username REGEXP '$input';
✅ Safe query (use placeholders)
$stmt = $pdo->prepare("SELECT * FROM users WHERE username REGEXP ?");
$stmt->execute([$sanitized_input]);
5.3 Version Compatibility
| Version | Main Features |
|---|---|
| MySQL 5.x | Only the REGEXP operator is available |
| MySQL 8.x | Adds REGEXP_LIKE(), REGEXP_INSTR(), REGEXP_SUBSTR(), and REGEXP_REPLACE() |
Summary
REGEXPසුචක භාවිතා නොකරන බැවින්, කාර්ය සාධන ක්රියාමාර්ග වැදගත් වේ.- ReDoS (නියමිත පදනම් DoS) වැළැක්වීමට, අධික වයිල්ඩ්කාඩ් භාවිතය avoided.
- SQL injection වැළැක්වීමට, පරිශීලක ආදානය සෘජුව
REGEXPවෙත යොදන්න එපා.
6. FAQ (නිතර අසන ප්රශ්න)
Here are common questions about using MySQL regular expressions (REGEXP). Resolving these issues will help you use regex more effectively.
6.1 MySQL හි මට භාවිතා කළ හැකි regex රටා කුමනවාද?
| Symbol | Description | Example | Result |
|---|---|---|---|
. | Any single character | a.c | "abc", "aac", "adc" |
^ | Start of the string | ^abc | "abcde" (does not match "dabc") |
$ | End of the string | xyz$ | "axyz" (does not match "xyzb") |
[] | Any of the specified characters | [abc] | "a", "b", "c" |
[^] | Any character not in the specified set | [^abc] | Any character except "a", "b", "c" |
* | Repeat the preceding character 0 or more times | a* | "", "a", "aa", "aaa" |
+ | Repeat the preceding character 1 or more times | a+ | "a", "aa", "aaa" (does not match "") |
6.2 LIKE සහ REGEXP අතර වෙනස කුමක්ද?
| Comparison | LIKE | REGEXP |
|---|---|---|
| Functionality | Simple pattern matching | Searching with complex regular expressions |
| Wildcards | % (any string), _ (any single character) | .* (any string), ^, $, [a-z], etc. |
| Search speed | Fast because indexes can apply | Often slower due to full table scans |
| Use cases | Simple searches (contains, prefix matching, etc.) | Complex searches based on specific patterns |
✅ LIKE වේගවත් බැවින්, සරල සෙවීම් සඳහා LIKE භාවිතා කර, සංකීර්ණ ගැලපුම් අවශ්ය වන විට REGEXP භාවිතා කරන්න.
6.3 MySQL 5.x සහ MySQL 8.x අතර regex විශේෂාංග වෙනස්කම් කුමනවාද?
| Version | Main Features |
|---|---|
| MySQL 5.x | Only the REGEXP operator is available |
| MySQL 8.x | Adds REGEXP_LIKE(), REGEXP_INSTR(), REGEXP_SUBSTR(), and REGEXP_REPLACE() |
6.4 regex එකක් අපේක්ෂිත ලෙස ක්රියා නොකරන්නේ නම් මොකද කළ යුතුද?
✅ Checklist
- ඉස්කේප් (escaping) නිවැරදිදැයි පරීක්ෂා කරන්න
SELECT * FROM users WHERE email REGEXP '\.com$';
REGEXP_LIKE()සමඟiකොඩිය (flag) භාවිතා කර බලන්නSELECT * FROM users WHERE REGEXP_LIKE(username, 'admin', 'i');
- දත්ත කේතනය (encoding) පරීක්ෂා කරන්න
SHOW VARIABLES LIKE 'character_set_database';
6.5 REGEXP විමසුම් කාර්ය සාධනය වැඩිදියුණු කිරීමේ ක්රම මොනවාද?
LIKEසමඟ පෙර-පෙරහන් කිරීමSELECT * FROM users WHERE email LIKE '%gmail.com' AND email REGEXP '^[a-zA-Z0-9._%+-]+@gmail\.com$';
- අවශ්ය තැන්වල සුචක (indexes) භාවිතා කරන්න
ALTER TABLE users ADD FULLTEXT(email);
සාරාංශය
REGEXPසුචක භාවිතා නොකරන බැවින්, කාර්ය සාධන ක්රියාමාර්ග වැදගත් වේ.- ReDoS (නියමිත පදනම් DoS) වැළැක්වීමට, අධික වයිල්ඩ්කාඩ් භාවිතය avoided.
SQL injection වැළැක්වීමට, පරිශීලක ආදානය සෘජුව
REGEXPවෙත යොදන්න එපා.REGEXPLIKE ට වඩා ශක්තිමත් ය, නමුත් කාර්ය සාධනය ගැන සැලකිලිමත් විය යුතුයි.- MySQL 8.0 හි,
REGEXP_LIKE()වැනි නව regex ශ්රිය (functions) එකතු කරන ලදී, වඩා නම්යශීලී සැකසුම්කරණය සඳහා හැකියාව ලබා දෙමින්. - කාර්ය සාධනය වැඩිදියුණු කිරීමට: LIKE සමඟ ඒකාබද්ධ කරන්න, සුචිකරණ (indexes) භාවිතා කරන්න, සහ සරල regex රටා නිර්මාණය කරන්න.
7. සාරාංශය
MySQL නිතිඅනුකූල සමිකරණ (REGEXP) දත්ත සෙවීම, සත්යාපනය සහ ආකෘති පරිවර්තනය සඳහා ඉතා උපකාරී වේ. මෙම ලිපිය MySQL regex මූලික, MySQL 8.0 සහ පසුකාලීනව එකතු කළ නව විශේෂාංග, ප්රායෝගික උදාහරණ, වැදගත් සලකා බැලීම්, සහ FAQ ආවරණය කළේය.
7.1 ප්රධාන ඉගෙනීම්
මෙන්න වඩාත් වැදගත් කරුණුවල වේගවත් සාරාංශයක්.
1. MySQL නිතිඅනුකූල සමිකරණ මූලික
REGEXPක්රියාකාරකය භාවිතයෙන්LIKEට වඩා නම්යශී රටා සමගත කිරීම හැකියාව ලැබේ.- පොදු regex රටා
^(ආරම්භය),$(අවසානය),.(එක ඕනෑම තනි අක්ෂරයක්),[](අක්ෂර පන්තිය),+(එක හෝ ඊට වැඩි පුනරාවර්තන), ආදිය.
2. MySQL 8.0+ හි නව නිතිඅනුකූල සමිකරණ ශ්රිය
MySQL 8.0 හි, මෙම ශ්රිය හතර එකතු කරන ලදී, වඩා නම්යශී සැකසුම්කරණය සඳහා හැකියාව ලබා දෙමින්:
REGEXP_LIKE():REGEXPක්රියාකාරකයට විකල්පයක්REGEXP_INSTR(): සමගත උපවාකයේ ආරම්භක පිහිටුම ලබා ගන්නREGEXP_SUBSTR(): සමගත උපවාකය ඉවත් කරන්නREGEXP_REPLACE(): regex භාවිතයෙන් උපවාක ප්රතිස්ථාපනය කරන්න
3. ප්රායෝගික උදාහරණ
- විද්යුත් තැපෑල ලිපින සත්යාපනය
- දුරකථන අංක සහ ණය පත්රිකා අංක පරීක්ෂාවන්
- HTML ටැග් ඉවත් කිරීම
- අඛණ්ඩ කේත ආකෘති සත්යාපනය
- නි for තවමත් නොහැකි වචන හඳුනා ගැනීම
- දත්ත සෝදිසි කිරීම (තිරිසන් විභාග කපා ඉවත් කිරීම, කොමා ඉවත් කිරීම, ආදිය.)
4. නිතිඅනුකූල සමිකරණ භාවිතා කිරීමේදී වැදගත් සලකා බැලීම්
- කාර්ය සාධනය උපායමාර්ගීකරණය
REGEXPසුචිකරණ භාවිතා නොකරන නිසා, එය සම්පූර්ණ පුවරු ස්කෑන් ඇති කළ හැකිය.LIKEහෝFULLTEXTසුචිකරණ ඒකාබද්ධ කිරීමෙන් කාර්ය සාධනය වැඩිදියුණු කළ හැකිය.- ආරක්ෂාවේ උපාය මාර්ග
- ReDoS (Regular Expression DoS) වැළැක්වීමට,
.*හි අධික භාවිතයෙන් වළකින්න. - SQL injection වැළැක්වීමට,
placeholdersභාවිතා කරන්න.
5. FAQ (පොදු ප්රශ්න)
- MySQL හි ලබා ගත හැකි regex රටා
LIKEසහREGEXPඅතර වෙනස්කම්- MySQL 5.x සහ 8.x අතර විශේෂාංග වෙනස්කම්
- regex අපේක්ෂිත පරිදි හැසිරෙන්නේ නැති විට ගැටලු විසඳීම
- කාර්ය සාධනය වැඩිදියුණු කිරීමේ ක්රම
7.2 නිතිඅනුකූල සමිකරණ භාවිතා කිරීමේ හොඳම පුරුදු
- regex රටා සරලව තබා ගන්න
- උදාහරණය:
.*හි අධික භාවිතයෙන් වළකින්න සහ^(ආරම්භය) සහ$(අවසානය) භාවිතා කරන්න.
- අදාළ තැනක
LIKEහෝFULLTEXTසමඟ ඒකාබද්ධ කරන්න
LIKEසමඟ පූර්ව-පෙරලි කරන්න, ඉන්පසුREGEXPභාවිතා කරන්න විමසුම් පිරිවැය අඩු කිරීමට.
REGEXP_REPLACE()දත්ත සෝදිසි කිරීමට භාවිතා කරන්න
- උදාහරණය: HTML ටැග් ඉවත් කරන්න සහ අනවශ්ය විභාග සමාන්කරණය කරන්න.
- MySQL 8.0 සහ පසුකාලීනව භාවිතා කිරීමේ වාසිය ගන්න
REGEXP_LIKE()වැනි නව ශ්රිය භාවිතයෙන් SQL වඩා පිළිගත හැකිය.
- ආරක්ෂා උපාය මාර්ග පුළුල්ව යෙදෙන්න
- පරිශීලක ආදාන
REGEXPහි සෘජුව යෙදෙන්නේ නැත (SQL injection වැළැක්වීම). - ගතික විමසුම් සඳහා
placeholdersභාවිතා කරන්න.
7.3 තවදුරටත් ඉගෙනීම සඳහා සම්පත්
මෙන්න MySQL නිතිඅනුකූල සමිකරණ ගැඹුරින් ඉගෙන ගැනීමට උපකාර වන යොමුකිරීම්.
ලියකියවිලි ලේඛන
7.4 අවසාන සටහන්
MySQL නිතිඅනුකූල සමිකරණ දත්ත සෙවීම, සෝදිසි කිරීම සහ සත්යාපනය ඇතුළු බොහෝ තත්ත්වයන්හි භාවිතා කළ හැකිය. කෙසේ වෙතත්, කාර්ය සාධනය සහ ආරක්ෂා සලකා බැලීම් තේරුම් ගනිමින් ඒවා සුදුසු ලෙස භාවිතා කිරීම වැදගත් වේ.
අපි බලාපොරොත්තු වන්නේ මෙම ලිපිය MySQL නිතිඅනුකූල සමිකරණ සමඟ වැඩ කිරීමේදී ඔබට උපකාරී වේවි. ඔබේ ව්යාපෘතිවල මෙම තාක්ෂණය භාවිතා කිරීම උත්සාහ කරන්න!


